Graph Studio 可识别所有数据的位置、内容和业务关系。它揭示了数据集之间的联系,并实现了快速的可视化数据探索和发现。使用Graph Studio,数据科学家和业务中的其他数据消费者可以通过迭代清洁、转换、对齐和链接来自多个之前不相连的企业数据平台的数据来构建混合的、分析就绪的数据集。
Graph Studio 独特地利用语义学和图形数据模型,结合易于使用的工具,使其几乎适用于组织中的任何人——从新手业务用户到熟练的数据科学家。公民数据科学家和业务分析师可以用临时的或预定义的问题探索企业数据,跨以前孤立的平台混合数据,并在几分钟内构建定制的、分析就绪的数据集——所有这些操作都不需要专业技能或IT帮助。
Graph Studio 通过三个主要步骤将原始数据源转换为合适的分析就绪的数据:
1、选择数据源: 内置的数据管道和自动生成的查询连接到结构化/半结构化数据源,如关系数据库管理系统
(RDBMS)、CSV、XML和JSON。自然语言处理(NLP)用于从PDF、文本文件和文字处理文件等非结构化内容中
查找和提取数据。Graph Studio将加载好的数据转换为资源描述框架(RDF)格式,编目所有加载数据的位置、模型、转换、谱系和安全性。
2、增强: Graph Studio 根据您指定的数据源自动构建知识图谱。它将您的数据映射到基于业务的标准化语义图模型,包括业务含义、数据重叠和模式识别。它以任何人都能理解的日常语言捕捉所有数据的业务含义。
Graph Studio 使用内存中的MPP处理范式来执行对数据集的查询,实现企业规模的敏捷数据集成、转换和分析。它利用包括W3C的RDF、OWL、SKOS和SPARQL在内的标准,结合元数据和数据的知识图谱,用户可以探索、转换和分析。
Graph Studio 与企业元数据、治理、安全控制和政策集成,并包括API,以便与其他流程进行无人工干预的集成。
Graph Studio 得益于其突破性的嵌入式图形数据库和内存中大规模并行处理(MPP)查询引擎,在几秒钟内对庞大的数据集进行建模和操作。您可以通过Kubernetes将知识图谱部署到任何云服务提供商,直接部署到本地服务器,或两者结合使用。
3、使用您喜欢的工具访问、分析和可视化探索数据:Graph Studio让用户轻松地转换数据并提出全新的问题,而无需重新设计数据架构。在Graph Studio内部以原生图形格式访问和查询数据,或导出数据以供外部工具使用,包括像R、Microsoft® PowerBI®以及使用OData或REST端点的流行商业智能和数据可视化程序。