此文是杭州包装设计公司关于设计公司如果推广和营销企业的分享,杭州包装设计公司旨在想让更多的设计公司提高设计业务能力!
注:配图为UCI设计公司作品
杭州包装设计公司转发原文直译:
我们过去已经谈了很多关于数据质量的问题,包括坏数据的成本。但是,尽管对数据质量有了基本的了解,许多人仍然不太理解"质量"的确切含义。
例如,有没有一种方法可以衡量质量,如果有,你是如何做到的?
在这篇文章中,我们将寻找这些问题的答案,甚至更多。但是首先
破除数据质量神话
确保数据质量的基础始于基本需求的创建
关于数据质量的最大误区之一是它必须完全没有错误。随着网站和其他活动收集如此多的数据,零错误几乎是不可能的。相反,数据只需要符合为其设定的标准。为了确定什么是"质量",我们首先需要知道三件事:谁创建了需求
需求是如何产生的,以及
在满足这些要求方面,我们有多大的自由度?
许多企业都有一个单一的"数据管理员",他了解并设定这些要求,同时也是决定错误容忍度的人。如果没有数据管家,它通常会确保负责数据的人了解任何可能影响数据的缺点。
你可以选择好的、快的或便宜的——选择两个从收集数据到使数据符合公司需求的一切都有可能出错。拥有100%完整和100%准确的数据不仅非常昂贵,而且非常耗时,几乎没有触及投资回报率.
面对如此多的数据,必须迅速做出决策。这就是为什么数据质量在很大程度上是一种微妙的平衡行为——在准确性和完整性之间周旋和判断。如果这听起来像是一个难以完成的任务,您会很高兴知道有一个疯狂的方法,第一步是数据概要分析。
什么是数据分析?
数据分析包括查看数据库中的所有信息,以确定其是否准确和/或完整,以及如何处理不准确的条目。例如,导入贵公司生产的产品的数据库并确保所有信息都是准确的,这相当简单,但当您导入竞争对手产品的详细信息或其他相关详细信息时,情况就不同了。
通过数据分析,您还可以查看数据的准确性。如果你在2016年七月一日发射,系统会记录为1916年还是2016年?
在梳理你已经获得的信息时,你甚至可能发现重复的和其他的问题。以这种方式分析数据为我们提供了一个起点——一个跳板,让我们可以确保我们使用的信息是尽可能高质量的。
确定数据质量
现在我们有了一个起点来确定我们的信息是否完整和准确,下一个问题就变成了——当我们发现错误或问题时,我们该怎么做?
通常,你可以做以下四件事之一:接受错误——如果它在可接受的标准范围内(即主要街道而不是主街),你可以决定接受它并继续下一个条目。
拒绝错误——有时,特别是在数据导入时,信息被严重破坏或不正确,与其试图纠正错误,不如干脆删除条目。
纠正错误——客户姓名的拼写错误是常见的错误,很容易纠正。如果名称有变化,您可以将其中一个设置为"主",并在所有数据库中保持数据的统一和正确。
创建一个默认值——如果你不知道该值,有一些东西(未知或不适用)总比什么都没有好。整合数据
当您在不同的数据库中拥有相同的数据时,出现错误和重复的机会就来了。成功集成的第一步是看到数据在哪里,然后以一致的方式组合这些数据。在这种情况下,投资于经过验证的数据质量和准确性工具来帮助跨数据库协调和同步信息是非常值得的。
您的数据质量检查表最后,由于您要处理的数据涉及如此之多的不同领域,因此有一个检查表来确定您正在使用的数据质量是否尽可能的高是很有帮助的达马联合王国创建了一个关于"数据维度"的优秀指南,可以用来更好地了解如何决定数据质量的全貌。
他们的数据质量维度包括:
完整性包含一个或多个值的数据的百分比。重要的是,关键数据(如客户姓名、电话号码、电子邮件地址等。)首先完成,因为完整性不会对非关键数据产生太大影响。
唯一性——与其他数据集相比,只有一个同类条目。
及时性—日期和时间对数据的影响有多大?
这可能是以前的销售,产品l
注:配图为UCI设计公司作品
杭州包装设计公司
通过杭州包装设计公司的精彩分享,设计师更轻松快捷地掌握杭州包装设计公司分享的营销与设计知识,帮助北京vi设计公司更好地服务好客户 。
声明:本文“ 什么是数据质量,如何衡量数据质量以获得最佳结果_杭州包装设计公司 ”信息内容来源于网络,文章版权和文责属于原作者,不代表本站立场。如图文有侵权、虚假或错误信息,请您联系我们,我们将立即删除或更正。