然而,大数据并不形成

TG Database is a platform for organized data management.
Post Reply
Bappy10
Posts: 419
Joined: Sat Dec 21, 2024 5:30 am

然而,大数据并不形成

Post by Bappy10 »

资料来源:LetsgoFacebook.nl

研究人员表示,利用大量数字数据为创新和生产力增长提供了前所未有的机会。但是,当您处理总大小现在以泽字节表示的数据集时,挖掘这一点并不容易。互联网上存储的信息量每两年翻一番,今年预计将突破 1.8 ZB 大关。研究机构 IDC 代表备份和存储系统制造商 EMC 计算了这一结果。

“数字宇宙十年——你准备好了吗?”

一泽字节,这是一个很少有人能想象的数量。大约有 10,000 亿千兆字节。你不能把它放在你的硬盘上。但这是没有必要的。在报告“数字宇宙十年——你准备好了吗?”中IDC 描绘了一个未来,首席信息官和聪明的 IT 专业人员就像宇航员,可以通过虚拟基础设施轻松地为我们探索数字宇宙。在云中,他们使用新的高级商业智能工具分析泽字节的非结构化信息。

大数据
这种发展被称为大数据。 IDC 研究人员假设 80-90% 的数据以非结构化方式存储,大约 70% 来自消费者。 IDC 表示,组织可以从这些非结构化数据中提取有价值的信息。由于这对竞争力和创新能力产生重大影响,企业应该非常重视大数据领域的发展。
统一的整体。它们包括文本文档、来自(移动)应用程 罗马尼亚赌徒数据库 序的客户数据、扫描、照片、视频、推文以及来自 Facebook 和 LinkedIn 等网站的更新。 IBM等公司表示,目前还没有好的工具来分析如此大量的非结构化数据。该公司认为该市场前景广阔,因此投资 1 亿美元用于大数据分析工具的研究。

根据麦肯锡全球研究院 (MGI) 的研究,企业不能等待 IBM 及其同事为我们准备的解决方案。大数据的战略利益太大了。麦肯锡认为,大数据将从根本上改变经济。为了为“大数据世界”做好准备,公司现在应该开始为整个组织制定数据战略。

搜索引擎应用
搜索引擎应用程序可能会在短期内提供解决方案。与 BI 系统不同,搜索引擎是从头开始设计的,可以快速搜索来自各种来源的大量数据。搜索引擎的架构旨在非常有效且快速地处理各种不同的内部和外部源系统的搜索。当然,这些所谓的 SBA(基于搜索的应用程序)也有缺点。它们不太适合存储和管理数据,并且难以进行复杂的分析,但最大的优点是它们比当前的 BI 解决方案便宜得多,而且该技术已经可用。



IBM 是否会通过数百万美元的投资挖掘新的金矿还有待观察。所有这些泽字节的客户信息都不容易访问。存在所有权问题、法律问题和对隐私的合理担忧。也许 IDC 研究人员有点夸大其词了。存储的数字数据主要由副本组成,据一些数据高达 75%,而且并非社交网络上的所有数据都是相关的,专家估计最多为 20%。以这种方式推理,在这 1.8 ZB 中,仅保留了大约 5% 的唯一相关信息。一座约900亿GB的金矿。它仍然是我们大多数人无法想象的惊人数量。
Post Reply