首页
/ 正文

你相信你得到的见解吗？对大数据和分析的影响

更新时间: 2023-02-26 16:21:07

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

您相信从大数据分析中获得的见解吗？您应该考虑哪些因素来决定您是否可以信任结果。在这篇文章中，我考虑了最重要的问题。你能对我提出的问题回答是或否吗？

信任是一个如此强大的情感词。在我加入 Informatica 负责数据质量研发后不久，这是与我的新老板 Ivan Chong 的第一次谈话之一，我问了这个问题；与客户交谈时的关键信息是什么？在他的回答中，他提到了信任这个词。哇，如何用一个词来概括 DataProfiling 和 Data Quality 功能；客户可以更加信任他们的数据。

作为 Oracle 的数据库迁移大师，我没有使用信任这个词，但我相信我试图表达同样的观点。我在 Oracle Migration Workbench 所做的事情中使用了等效性。如果您总共有 10 个表和 100 万行，当您迁移到 Oracle 时，您应该有相同的 10 个数据类型相同的表，并且存在相同的 100 万行。我提到过侵入性和非侵入性的变化。 Oracle 分区功能是非侵入性的，因为它对应用程序或用户是透明的。由于返回结果的及时性，用物化视图替换标准视图可被视为侵入性更改。这可能对应用程序和用户都很好，但它应该是经过深思熟虑的决定。

在 Singularities ，当我们将基于 SaaS 的解决方案推向针对商业用户的市场时，信任我们正在做出的决策中的重要特征。这些是我们问自己的问题：

我信任我的托管供应商吗？

由于我们将通过 SaaS 交付我们的解决方案，因此我们必须提出这个问题。如果我查看当前的市场领导者 Amazon Web Services ( AWS) ，我会在他们的网站上看到一个涉及安全性的部分。通过查看他们的功能列表和最近的 Forrester Wave™：公共云平台服务提供商的安全性， 2014 年第 4 季度，他们被显示作为彻头彻尾的领导者。我有信心可以回答对那个问题是的。

我信任我的平台吗？

为了从我们选择 Hadoop 的平台上获得我们想要的可伸缩性和开放性。我可以信任 Hadoop 吗？要回答这个问题，您必须考虑您将选择哪种 Hadoop 发行版、您将如何配置它以及托管供应商是否支持您选择的发行版。在流行的 Hadoop 发行版之一 Cloudera 中，我很高兴地发现：

Cloudera Navigator - 合规就绪数据治理
Cloudera 导航器加密 - Hadoop数据透明加密
敏感数据编辑 - 从不需要的地方删除敏感信息。

我想我可以对这个问题回答是。

我信任我的原始数据吗？

我如何信任我的原始数据？你不能 100% 信任它，但你可以采取措施建立对它的信心。如果我戴上 Data Wrangler 的帽子，给我原始数据，因为它来自生成它的实体。忘掉您的经典数据仓库技术，不要对其建模并挑选 IT 认为最有趣的内容。请让我这样做。考虑到 Hadoop 是一个可扩展的平台，我通常会以原始原始格式保存数据，直到找到可证明的洞察力。然后我可以优化数据管道。请不要过滤或汇总数据，因为我可能对寻找随时间变化的模式（时间序列分析）大海捞针感兴趣。有了强大的数据处理平台，让我找到了那些宝贵的金针。使用您选择的数据整理工具的数据分析功能，推动数据集质量改进或发现数据质量问题。使用这种方法，轻松地说是。

我信任我的分析吗？

我使用了哪些分析函数，为什么选择它们？我使用了哪些参数？对于机器学习算法，我使用的训练集是什么？它与我现在使用的数据集有很大不同吗？从我们自己的角度来看，Singularities 是一个基础完善的平台，可以学习、存储个人和实体的全面而精确的模型并与之交互，因此它们可以用于刺激、预测、诊断和探索建议的应用程序，以影响他们在不同场景下的行为。奇点模型可以是在自治系统中执行复杂操作的代理。

Singularities 基于强大的信息建模数学理论。它使用变量和信息方程来表示实体及其信念状态和行为。对于奇点这个问题，我可以回答是。

我相信我所看到的吗？

什么可视化工具显示从您信任的分析中获得的见解？它是实时访问这些见解还是使用缓存机制？在选择包含在您的仪表板中的可视化中，您是否进行了任何预过滤，这在显示的结果中是不明显的？

本文阐述了要考虑的主要问题，您是否会相信您所看到的那些引人注目的可视化效果？我不认为信任应该是假设的，它应该是赚来的。我已经指出了 5 个问题，您也应该能够回答是。

我们对您对信任的想法以及对大数据和分析的影响很感兴趣。您可以给我发电子邮件： donal.daly@singularities.com 。

你相信你得到的见解吗？对大数据和分析的影响

我信任我的托管供应商吗？

我信任我的平台吗？

我信任我的原始数据吗？

我信任我的分析吗？

我相信我所看到的吗？

最新发布

Clion 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

RubyMine 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

PhpStorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Webstorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

IDEA 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）

你相信你得到的见解吗？对大数据和分析的影响

我 信任 我的托管供应商吗？

我信任 我的 平台 吗 ？

我信任我的原始数据 吗 ？

我信任我的 分析 吗 ？

我相信我所看到的吗？

最新发布

Clion 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

RubyMine 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

PhpStorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Webstorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

IDEA 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）

我信任我的托管供应商吗？

我信任我的平台吗？

我信任我的原始数据吗？

我信任我的分析吗？