据最近估计,Netflix 每年因有效利用可用数据而节省了 10 亿美元的留存成本,”他说。“[Netflix 可以确定] 一个人在停止之前观看了多少分钟。他们是否观看了不止一集?人们最有可能狂看哪种类型的内容?所有这些因素都会影响未来的制作决策,以及为用户提供个性化的应用内体验。”
大数据也是世界经济的重要组成部分。纽约证券交易所就是一个最好的例子,它使用最先进的计算技术来处理 每天交易的超过 14 亿股股票。如此大量的交易数据需要一种大数据解决方案,能够在短时间内接收、解析并传输进出华尔街的大量数据。
社交媒体
从个人角度来说,你的社交媒体页面也是大数据的一部分。虽然你的 Twitter 个人资料和 Facebook 动态可以看作是单个数据点,但更细粒度的数据覆盖项目,例如你的喜好、帖子、照片和个人数据,都是可量化 保加利亚 whatsApp 数据 的数据,大数据可以使用这些数据来了解你可能购买什么、你的爱好是什么,甚至在即将到来的选举中你可能投票给谁。
大数据如何存储和监管?
鉴于大数据的“庞大”,存储此类信息的设施也一定同样庞大,对吧?这取决于您的企业有多少资金和空间可用。世界上一些最大的数据中心占地数百万平方英尺,拥有价值数十亿美元的服务器设备。但对于您的小型企业来说,一个拥有 TB 级存储空间的服务器机架就足够了。
虽然您可能会发现许多公司依赖物理解决方案来存储其文件系统,例如大型数据仓库或大型服务器,但其他公司已转向基于云的存储解决方案,例如由 Google 和 Amazon Web Services 托管的解决方案。在这两种情况下,只要有空间,就可以存储数据。
至于大数据的监管,美国联邦政府对此采取了基本上不干预的态度。相反,现有的隐私法倾向于监管大数据和寻求参与其中的公司。美国的隐私法通常侧重于处理敏感信息的特定行业,例如使用非公开个人信息的金融机构,这些机构必须遵守《格雷姆-里奇-比利雷法案》。同样,使用大数据的医疗保健提供商必须确保数据符合《 健康保险流通与责任法案》 (HIPAA)。
Goodwin Procter LLP 高级法律顾问 Jacqueline Klosek 在Taylor Wessing的一篇文章中表示 ,公司经常修改数据以删除任何敏感的身份信息。这一步骤通常在数据科学家分析数据之前或将数据发送给第三方之前进行。
“根据 GLBA,‘个人可识别财务信息’的定义明确排除了‘无法识别消费者的信息,例如不包含个人识别信息(如账号、姓名或地址)的汇总信息或盲数据’,”Klosek 写道。“根据 HIPAA,去识别数据的隐私要求也有例外。使用严格匿名化数据的公司仍需确保其行为符合自己的隐私政策和合同义务,当然,还需要确保相关数据是真正匿名的。”