(19)中华人民共和国国家知识产权局
(12)发明专利申请
(21)申请号 CN20161074.2 (22)申请日 2016.08.09
(71)申请人 北京北信源软件股份有限公司
地址 100081 北京市海淀区中关村南大街34号中关村科技发展大厦C座1602室
(10)申请公布号 CN106202569A
(43)申请公布日 2016.12.07
(72)发明人 蒙进财;;白志凌
(74)专利代理机构 北京连和连知识产权代理有限公司
代理人 张建鹏
(51)Int.CI
G06F17/30;
权利要求说明书 说明书 幅图
(54)发明名称
一种基于大数据量的清洗方法
(57)摘要
本发明提供一种基于大数据量的清洗方
法。所述方法包括以下步骤:配置清洗规则、配置清洗后的数据的存储方式、配置清洗程序的Spark集群服务器资源、部署清洗程序任务以及评估清洗后的数据。本发明具有减少数据存储容量、提高数据检索准确度和检索速度、降低web展示端响应时间、以及满足不同业务需要的优点。
法律状态
法律状态公告日
2016-12-07 2016-12-07 2017-01-25 2017-01-25 2020-05-22
公开 公开
实质审查的生效 实质审查的生效
发明专利申请公布后的驳回
法律状态信息
公开 公开
法律状态
实质审查的生效 实质审查的生效
发明专利申请公布后的驳回
权利要求说明书
一种基于大数据量的清洗方法的权利要求说明书内容是....请下载后查看
说明书
一种基于大数据量的清洗方法的说明书内容是....请下载后查看