|
数据清理主要围绕数据的正确性、准确性、一致性、完整性、符合业务规则等方面对数据进行全面的检查和核对。确定权威的数据源, 对现存数据进行清理和整合,并借助电话调查等方式来核实数据的准确性,提高数据质量的有效性。
适用范围
- 客户面临大量的数据;
- 数据经常更新;
- 系统改变;
- 开始新的分析计划;
- 没有足够的时间和资源自己进行分析 ;
主要内容
将现有数据与权威数据进行对比、分析、整理,对数据的完整性、准确性进行有效性评估。针对缺失的数据进行补充,对数据更新时间超过一定阶段的数据进行电话复核和整理,数据质量分析。
- 数据有效性:对什么数据可以用来解决什么商业问题进行评估,包括哪些是需要但是现在不具备的数据、如何收集这些数据和如何对现有数据进行转换以利于分析的建议;
- 数据完整性:评估现有数据的完整性,得出现有数据质量的有关报告以及如何提高数据的完整性,并对数据清理方案进行设计和执行;
- 数据准确性:根据数据的更新时间和与权威数据的对比,对数据的准确性进行评估。对准确性差的数据进行电话复核。
主要特点
- 帮助企业处理大量实际应用数据,数据的质量越高,企业进行的市场决策越准确;
- 运用科学的抽样评估办法来检验数据,验收到真实、准确、有效的数;
- 更好的组织数据得到更加英明的决策;
- 更快、更好的得到有价值的数据;
- 证数据在分类统计口径一致性;
|