Search Docs
K
介绍
环境配置
博客
开源项目
AI
阿里
CNCF
面试大全
FAQ
简体中文
English
2025
2025
2024
2023
GitHub
介绍
环境配置
博客
开源项目
AI
阿里
CNCF
面试大全
FAQ
简体中文
English
2025
2025
2024
2023
GitHub
Menu
目录
#
湖仓
#
数仓分层
参考链接:
数仓分层
架构与模型设计
简单聊聊数仓分层
腾讯面试:数仓建设需要遵循哪些规范?
腾讯面试:数仓分层架构是怎么样的?为什么要这样设计?
数据仓库经典面试题(50道)
大数据仓库开发规范示例
#
Flink
如何使用DataStream API实现FlinkSQL相同的功能
万字长文 | Flink 运维指南
Flink SQL 四种 Join 方式详解:原理、场景与实战
腾讯面试:Flink五种Join方式,各自有什么特点,应用场景分别是怎么样的?
Flink + YARN + Gitlab 自动提交代码全流程详解
Flink 1.19 + Paimon 1.2 构建实时数据湖深度实践指南
Flink SQL × Paimon 构建实时数仓最佳实践
超强总结:Flink最新学习文档(十二章)
超强总结:Flink可以优化的方方面面
Flink经典面试题(200道)
Flink源码分析 经典面试题(200道)
FlinkSQL 经典面试题(200道)
网易面试:Flink优化可以从哪几个方面入手?分别详细介绍一下?
建议收藏 | FlinkSQL电商订单状态追踪与实时处理代码
腾讯面试:Flink哪些场景下的数据需要保存到状态中参与计算?
腾讯面试:Flink Checkpoint与两阶段提交对下游算子拉取数据时机的影响
Flink 1.19 风控管理系统核心代码实现
一个可以写进简历的Flink在金融风控行业应用的真实案例(附详细业务代码)
腾讯面试:Flink Checkpoint 和 Spark Checkpoint 有什么区别?
Flink Checkpoint源码级拆解
腾讯面试:Flink100G大状态如何优化?有哪些参数可以调整?
Flink中的Savepoint和Checkpoint有什么区别?
腾讯面试:Flink出现反压如何排查?有哪些参数可以调整?
Flink 反压问题深度剖析与解决方案
美团面试:Flink 反压机制(Backpressure)是如何实现的?出现反压如何解决?
阿里面试:请详细解释一下Flink内存管理,具体有哪些参数可以调整?
Flink内存调优指南(经验版)
蚂蚁面试:Flink并行度、算子、算子链、Slot、Slot共享组之间的关系是什么?如何设置能够使资源利用最大化?
京东面试:如何合理设置Flink并行度?有哪些优化的点?
百度面试:Flink CEP复杂事件处理是什么?原理是怎么样的?哪些场景可以使用?
字节面试:Flink如何做压测?如何保证系统稳定?
FlinkSQL中Catalog的使用场景及案例详解
省流版 | Apache Flink 2.0.0 核心特点总结
Flink 消费 Kafka 配置优化实战分享
Flink一致性语义和checkpoint时barrier对齐和不对齐的关系是什么?
再也不用state和checkpoint傻傻分不清了,Flink1.13开始statebacked的配置方式好清晰
Flink State有哪几种类型?
Flink Watermark都包不住的这部分迟到数据怎么处理?
Flink Watermark卡住不动,出现eventtime倾斜问题怎么办?
Flink Watermark的两种产生方式:标点水位线和周期水位线详解s
Flink乱序问题解决神器Watermark详解及代码实战
Flink Watermark何种情况下可以触发窗口计算?
Flink 并行运行时Watermark如何向下传递?
【视频】| Flink 窗口函数是个好东西,你真的会用吗?
Flink CDC
什么是Chunk分片?它如何提高Flink CDC的性能?
FlinkCDC经典面试题(200道)
建议收藏 | Flink CDC 系列总结篇
终于搞明白了 Flink CDC 2.0 原理,人麻了...
#
Doris
Doris查询太慢?要不要试试这几项加速技术。。
腾讯面试:Doris优化可以从哪些点入手?请详细描述优化方案。。
阿里面试:Doris冷热分层原理是什么?如何配置冷热分层。。
腾讯面试:如何使用Doris × Paimon构建湖仓一体,请给出详细建设方案。。
阿里面试:ClickHouse 为什么在多表Join场景中性能不及Doris ?
腾讯面试:介绍一下Doris问题排查思路,有没有总结过相关文档?
腾讯面试:Doris 物化视图的使用场景是怎么样的,有哪几种数据更新方式?
Doris经典面试题(200道)
【Apache Doris】行列转换 最佳实践指南
【Apache Doris】部分列更新 最佳实践指南
终态部署、易扩展、无感升级,Doris Operator 支持高效 Kubernetes 容器化部署方案
我用X2Doris干翻了3000张表,老板还以为我组了个团队
全网最全Doris实战文章合集
Doris 数仓使用规范(经验版)
#
StarRocks
超强总结:StarRocks可以优化的方方面面
字节面试:StarRocks中如何优化大表JOIN?
StarRocks经典面试题(200道)
#
Paimon
阿里面试:Paimon Changelog 和 合并引擎有哪些组合,分别适用于哪些场景?
腾讯面试:Paimon自动分区清理与快照清理机制是怎么样的?哪个先清理?
超强整理:Paimon最新学习文档(十一章)
Paimon 经典面试题(200道)
腾讯面试:请详细描述Paimon如何基于LSM树实现高吞吐写入和高效查询?
阿里面试:Paimon QPS太低怎么优化?
阿里面试:Hudi,Iceberg,Paimon之间的差异有哪些?该如何选择?
网易面试:Hudi、Iceberg、Paimon有什么异同点?如何选型?
这篇文章把Paimon和Fluss的关系给彻底说清楚了
超强总结:Paimon可以优化的方方面面
阿里面试:Paimon只保留两天的快照,如何关联昨天的数据?
小米面试:Paimon Join用法有哪些?大规模数据场景下如何优化 Join 性能?
老板说要降本又增效,我把Paimon搬进了Doris家,然后...
建议收藏 | Paimon 实战文章总结
Paimon通过分支操作来完成数据修正
Paimon使用技巧 | 通过tags查询历史数据
利用Paimon系统表快速获取物理表的快照文件配置等信息
#
综合案例
data-warehouse-learning
。数据湖建设实战项目代码
基于Kubernetes的湖仓一体高可用架构部署指南
超强总结 | Kubernetes 详细学习路线图
阿里面试:如果让你负责大数据平台的架构,需要考虑哪些点?如何设计?
什么是湖仓一体数据平台?怎么构建湖仓一体数据平台
一文聊透开放表格式和开放数据Lakehouse
#
其他
大数据架构师简历“天花板”模板:架构/开发/优化/管理,四大核心全覆盖!
阿里面试:列式存储和行式存储有什么区别?他们的应用场景分别是怎么样?
大数据计算引擎(Hadoop,Spark,Flink)发展史
新入职的老哥终于把数据治理给讲清楚了,真香!
目录
数仓分层
Flink
Doris
StarRocks
Paimon
综合案例
其他