• 大小: 7.13MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-04-10
  • 语言: 其他
  • 标签: 开源项目  

资源简介

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告问题。
 Apache Griffin填补了开源世界里在大数据质量领域的空白。就像空气质量,水和食品安全等无时不刻地在影响人类的生命一样,数据质量在数据科学领域是至关重要的。在大数据时代,企业决策调整,商机发现等越来越依赖于大数据的数据分析和数据挖掘,而数据质量的保证是所有一切数据分析和数据挖掘的基础。系统架构:核心优势:主要功能:企业应用:Apache Griffin已经部署在eBay的生产环境中,

资源截图

代码片段和文件信息

评论

共有 条评论