Hi ,v2ers ,给大家介绍一下我们开源的标准化图数据文件格式 - GraphAr。
项目地址: https://github.com/alibaba/GraphAr
随着社交网络分析、数据挖掘、科学计算等应用的发展,图计算作为海量数据分析的重要组成部分,变得日益重要,业界也诞生了很多基于内存 /外存的图存储、数据库、图分析和交互式图查询引擎等。由于图计算的生态非常碎片化,存在很多不同类型的数据格式和访问模式,因此需要建立一套标准化的文件格式和访问接口来解决各种图计算系统的数据导入导出,互相访问的问题。
GraphAr 就是为了解决不同图计算系统数据导入导出过于复杂的问题而设计的。它为图数据定义了一套标准化的、独立于计算 /存储系统的文件格式,并提供了一系列接口用来生成、访问和转换这些格式化的文件。GraphAr 可以帮助各类图计算应用或现有系统方便快捷地构建和访问图数据,它既可以作为图计算应用的直接数据源,也可以服务于图数据的导入 /导出和持久化存储,减少各类图系统之间协同工作的开销。
目前 GraphAr 项目包含:
未来还会添加更多的数据类型,文件类型支持,多语言 SDK 等
为了尽可能兼顾各类系统对图数据存储和访问的不同需求,GraphAr 标准化图文件格式的设计考虑了如下要点:
GraphAr 现已支持在多个场景中进行应用,部分已经实现的案例包括
未来随着 GraphAr 的发展成熟,我们的目标是将项目贡献到一个供应商中立的场所,例如 Apache 、LF AI & Data 。这将确保项目继续以开放透明的方式进行开发,并得到广泛的开发者社区的贡献。
👏 如果你对开源感兴趣,欢迎加入 GraphAr 的社区,和我们一起推进 GraphAr 的发展。
👏 如果你觉得这个项目还不错,可以在 github 上加星,关注,这是对我们开发者莫大的鼓励。