平台

数据中台

  • 驭数平台。提供易用、低门槛基于大模型打造的大数据平台,助力企业便捷、低成本的实现“掌控数据、轻盈如云”的愿景。驭数平台完全可以满足企业的基础数据梳理、数据治理、数据中台、大数据基础平台等企业数据建设功能,远景目标是基于大模型为广大企业提供开源可用的Data Fabric实现平台
  • 至爻云
    • spark-yun。至轻云,基于Spark打造超轻量级大数据平台
  • DataSphereStudio一键部署容器化版本,助力开发者快速试用WeDataSphere开源大数据平台套件
  • LarkMidTable。LarkMidTable 是一站式开源的数据中台,实现中台的 基础建设,数据治理,数据开发,监控告警,数据服务,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。部分开源,开源了数据集成模块(yunque
  • alldata。AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案
  • DataFan。DataFan 的初衷是为了打通企业从数据集成 -> 数据开发 -> 数据应用的全流程。将数据集成、数据开发(离线+实时)、数据可视化等平台开源出来,同开源社区一同治理和发展。
  • 南瓜树大数据基础能力平台。构建企业数据共享平台,所有业务数据源统一在数据平台管理;简单数据服务在平台只需要写sql就能提供API接口服务;复杂功能由代码生成器生成进行手工Merge;实现了低代码开发的同时又支持灵活编码,解决了当前低代码产品普遍不灵活的弊端!
  • 一站式数据中台。一款为数据治理而生的企业一站式数据治理中台,基于智数通项目扩展开发。采用微服务云原生技术,富含各类开箱即用的组件,提供了统一的元数据采集和维护入口,支持常见的数据库元数据采集,用来帮助构建企业数据资产目录和数据安全体系;数据质量模块可以定时对数据质量进行管控;通过数据 api 模块,可以为各业务系统提供数据检索查询服务,实现数据赋能;可视化模块无需搭配任何开发工具,简单拖拽组合,便可以完成复杂的数据分析任务,以看板,酷屏的方式展现
  • vespa。yahoo 开源实时大数据处理服务系统 Vespa
  • lacus。Lacus是一个开源大数据平台项目,致力于让数据采集变得更简单、好用。基于 Flink CDC
  • datax-cloud。智数通提供了元数据管理、数据标准管理、数据质量管理、主数据管理、数据集市管理、可视化图表看板、流程管理等微服务,是为数字化建设而生的企业级一站式数据治理平台。已停止维护

实时计算平台

机器学习/深度学习AI平台

  • cube-studio。cube studio开源云原生一站式机器学习/深度学习AI平台,支持sso登录,多租户/多项目组,大数据平台对接,notebook在线开发,拖拉拽任务流pipeline编排,多机多卡分布式训练,超参搜索,推理服务VGPU,边缘计算,serverless,标注平台,自动化标注,数据集管理,大模型微调,大模型推理,llmops,私有知识库,AI模型应用商店,支持模型一键开发/推理/微调,支持国产cpu/gpu/npu芯片,支持RDMA,支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式

诊断平台

文章列表

埋点平台

运维平台

  • datasophon。致力于快速实现部署、管理、监控以及自动化运维大数据云原生平台,帮助您快速构建起稳定、高效、可弹性伸缩的大数据云原生平台。
  • CloudEon。CloudEon 将基于 Kubernetes 的资源安装部署开源大数据组件,实现开源大数据平台的容器化运行,您可减少对于底层资源的运维关注。
  • kubernetes-data-platform。KDP(Kubernetes Data Platform) 提供了一个基于 Kubernetes 的现代化混合云原生数据平台。它能够利用 Kubernetes 的云原生能力来有效地管理数据平台。