Paimon

表类型

primary table。默认表，需定义主键，支持 insert、update 和 delete。
- 数据在 bucket 内根据主键进行排序。
- merge engine。当同一主键存在多条数据时，需要指定 merge engine 处理数据 merge
  - deduplicate。默认 merge engine，使用最后来的数据覆盖其他数据，如果最后来的数据是 delete，则会删除整条数据
  - partial-update。部分更新，用户可以通过多次更新，每次更新不同的列直到数据完整。null 无法覆盖数据列，因此用户无法通过 partial-update 将某个字段值更新为 null
    - 无法处理 delete 数据。
  - aggregation。类似 Doris 的 aggregate 类型表的 AggregationType
    - last_value, last_non_null_value, first_value, first_non_null_value，min, max, sum, count, product 等
    - 只有 sum, product, count, collect, merge_map, nested_update, last_value 和 last_non_null_value 支持 flink 回撤消息
  - first-row。和 deduplicate 相反，总是使用第一条数据。使用 first-row 可以实现仅 insert 效果
append table。又名日志表，未定义主键即为 append table。
- 自动小文件合并
- z-order 文件布局
- 索引。minmax，bitmap，bloomfilter，倒排索引

在分区内数据存储在 bucket 内

固定分桶

分桶数大于 0 即为固定分桶。

固定分桶只能通过离线处理进行扩缩容

动态分桶

分桶数设置为 -1 即为动态分桶。

动态分桶只支持单个写入任务。