feat: implement basic write/read methods for bulk memtable (#6888)

* feat: implement basic write/read methods for bulk memtable Signed-off-by: evenyag <realevenyag@gmail.com> * chore: change update stats atomic ordering We have already acquired the write lock so Relaxed ordering is fine Signed-off-by: evenyag <realevenyag@gmail.com> --------- Signed-off-by: evenyag <realevenyag@gmail.com>
2026-01-03 20:02:54 +00:00 · 2025-09-04 16:42:05 +08:00
parent 2c019965be
commit 40a49ddc82
2 changed files with 604 additions and 27 deletions
--- a/src/mito2/src/memtable/bulk.rs
+++ b/src/mito2/src/memtable/bulk.rs
@@ -14,18 +14,6 @@

 //! Memtable implementation for bulk load

-use std::sync::{Arc, RwLock};
-
-use mito_codec::key_values::KeyValue;
-use store_api::metadata::RegionMetadataRef;
-use store_api::storage::{ColumnId, SequenceNumber};
-
-use crate::error::Result;
-use crate::memtable::bulk::part::{BulkPart, EncodedBulkPart};
-use crate::memtable::{
-    KeyValues, Memtable, MemtableId, MemtableRanges, MemtableRef, MemtableStats, PredicateGroup,
-};
-
 #[allow(unused)]
 pub mod context;
 #[allow(unused)]
@@ -33,10 +21,75 @@ pub mod part;
 pub mod part_reader;
 mod row_group_reader;

-#[derive(Debug)]
+use std::collections::BTreeMap;
+use std::sync::atomic::{AtomicI64, AtomicU64, AtomicUsize, Ordering};
+use std::sync::{Arc, RwLock};
+
+use datatypes::arrow::datatypes::SchemaRef;
+use mito_codec::key_values::KeyValue;
+use store_api::metadata::RegionMetadataRef;
+use store_api::storage::{ColumnId, SequenceNumber};
+
+use crate::error::{Result, UnsupportedOperationSnafu};
+use crate::flush::WriteBufferManagerRef;
+use crate::memtable::bulk::context::BulkIterContext;
+use crate::memtable::bulk::part::BulkPart;
+use crate::memtable::bulk::part_reader::BulkPartRecordBatchIter;
+use crate::memtable::stats::WriteMetrics;
+use crate::memtable::{
+    AllocTracker, BoxedBatchIterator, BoxedRecordBatchIterator, EncodedBulkPart, IterBuilder,
+    KeyValues, MemScanMetrics, Memtable, MemtableBuilder, MemtableId, MemtableRange,
+    MemtableRangeContext, MemtableRanges, MemtableRef, MemtableStats, PredicateGroup,
+};
+use crate::sst::file::FileId;
+use crate::sst::{to_flat_sst_arrow_schema, FlatSchemaOptions};
+
+/// All parts in a bulk memtable.
+#[derive(Default)]
+struct BulkParts {
+    /// Raw parts.
+    parts: Vec<BulkPartWrapper>,
+    /// Parts encoded as parquets.
+    encoded_parts: Vec<EncodedPartWrapper>,
+}
+
+impl BulkParts {
+    /// Total number of parts (raw + encoded).
+    fn num_parts(&self) -> usize {
+        self.parts.len() + self.encoded_parts.len()
+    }
+
+    /// Returns true if there is no part.
+    fn is_empty(&self) -> bool {
+        self.parts.is_empty() && self.encoded_parts.is_empty()
+    }
+}
+
+/// Memtable that ingests and scans parts directly.
 pub struct BulkMemtable {
    id: MemtableId,
-    parts: RwLock<Vec<EncodedBulkPart>>,
+    parts: Arc<RwLock<BulkParts>>,
+    metadata: RegionMetadataRef,
+    alloc_tracker: AllocTracker,
+    max_timestamp: AtomicI64,
+    min_timestamp: AtomicI64,
+    max_sequence: AtomicU64,
+    num_rows: AtomicUsize,
+    /// Cached flat SST arrow schema for memtable compaction.
+    #[allow(dead_code)]
+    flat_arrow_schema: SchemaRef,
+}
+
+impl std::fmt::Debug for BulkMemtable {
+    fn fmt(&self, f: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
+        f.debug_struct("BulkMemtable")
+            .field("id", &self.id)
+            .field("num_rows", &self.num_rows.load(Ordering::Relaxed))
+            .field("min_timestamp", &self.min_timestamp.load(Ordering::Relaxed))
+            .field("max_timestamp", &self.max_timestamp.load(Ordering::Relaxed))
+            .field("max_sequence", &self.max_sequence.load(Ordering::Relaxed))
+            .finish()
+    }
 }

 impl Memtable for BulkMemtable {
@@ -45,14 +98,43 @@ impl Memtable for BulkMemtable {
    }

    fn write(&self, _kvs: &KeyValues) -> Result<()> {
-        unimplemented!()
+        UnsupportedOperationSnafu {
+            err_msg: "write() is not supported for bulk memtable",
+        }
+        .fail()
    }

    fn write_one(&self, _key_value: KeyValue) -> Result<()> {
-        unimplemented!()
+        UnsupportedOperationSnafu {
+            err_msg: "write_one() is not supported for bulk memtable",
+        }
+        .fail()
    }

-    fn write_bulk(&self, _fragment: BulkPart) -> Result<()> {
+    fn write_bulk(&self, fragment: BulkPart) -> Result<()> {
+        let local_metrics = WriteMetrics {
+            key_bytes: 0,
+            value_bytes: fragment.estimated_size(),
+            min_ts: fragment.min_ts,
+            max_ts: fragment.max_ts,
+            num_rows: fragment.num_rows(),
+            max_sequence: fragment.sequence,
+        };
+
+        {
+            let mut bulk_parts = self.parts.write().unwrap();
+            bulk_parts.parts.push(BulkPartWrapper {
+                part: fragment,
+                file_id: FileId::random(),
+            });
+
+            // Since this operation should be fast, we do it in parts lock scope.
+            // This ensure the statistics in `ranges()` are correct. What's more,
+            // it guarantees no rows are out of the time range so we don't need to
+            // prune rows by time range again in the iterator of the MemtableRange.
+            self.update_stats(local_metrics);
+        }
+
        Ok(())
    }

@@ -68,29 +150,511 @@ impl Memtable for BulkMemtable {

    fn ranges(
        &self,
-        _projection: Option<&[ColumnId]>,
-        _predicate: PredicateGroup,
-        _sequence: Option<SequenceNumber>,
+        projection: Option<&[ColumnId]>,
+        predicate: PredicateGroup,
+        sequence: Option<SequenceNumber>,
    ) -> Result<MemtableRanges> {
-        todo!()
+        let mut ranges = BTreeMap::new();
+        let mut range_id = 0;
+
+        let context = Arc::new(BulkIterContext::new(
+            self.metadata.clone(),
+            &projection,
+            predicate.predicate().cloned(),
+        ));
+
+        // Adds ranges for regular parts and encoded parts
+        {
+            let bulk_parts = self.parts.read().unwrap();
+
+            // Adds ranges for regular parts
+            for part_wrapper in bulk_parts.parts.iter() {
+                // Skips empty parts
+                if part_wrapper.part.num_rows() == 0 {
+                    continue;
+                }
+
+                let range = MemtableRange::new(
+                    Arc::new(MemtableRangeContext::new(
+                        self.id,
+                        Box::new(BulkRangeIterBuilder {
+                            part: part_wrapper.part.clone(),
+                            context: context.clone(),
+                            sequence,
+                        }),
+                        predicate.clone(),
+                    )),
+                    part_wrapper.part.num_rows(),
+                );
+                ranges.insert(range_id, range);
+                range_id += 1;
+            }
+
+            // Adds ranges for encoded parts
+            for encoded_part_wrapper in bulk_parts.encoded_parts.iter() {
+                // Skips empty parts
+                if encoded_part_wrapper.part.metadata().num_rows == 0 {
+                    continue;
+                }
+
+                let range = MemtableRange::new(
+                    Arc::new(MemtableRangeContext::new(
+                        self.id,
+                        Box::new(EncodedBulkRangeIterBuilder {
+                            file_id: encoded_part_wrapper.file_id,
+                            part: encoded_part_wrapper.part.clone(),
+                            context: context.clone(),
+                            sequence,
+                        }),
+                        predicate.clone(),
+                    )),
+                    encoded_part_wrapper.part.metadata().num_rows,
+                );
+                ranges.insert(range_id, range);
+                range_id += 1;
+            }
+        }
+
+        let mut stats = self.stats();
+        stats.num_ranges = ranges.len();
+
+        // TODO(yingwen): Supports per range stats.
+        Ok(MemtableRanges { ranges, stats })
    }

    fn is_empty(&self) -> bool {
-        self.parts.read().unwrap().is_empty()
+        let bulk_parts = self.parts.read().unwrap();
+        bulk_parts.is_empty()
    }

    fn freeze(&self) -> Result<()> {
+        self.alloc_tracker.done_allocating();
        Ok(())
    }

    fn stats(&self) -> MemtableStats {
-        todo!()
+        let estimated_bytes = self.alloc_tracker.bytes_allocated();
+
+        if estimated_bytes == 0 || self.num_rows.load(Ordering::Relaxed) == 0 {
+            return MemtableStats {
+                estimated_bytes,
+                time_range: None,
+                num_rows: 0,
+                num_ranges: 0,
+                max_sequence: 0,
+                series_count: 0,
+            };
+        }
+
+        let ts_type = self
+            .metadata
+            .time_index_column()
+            .column_schema
+            .data_type
+            .clone()
+            .as_timestamp()
+            .expect("Timestamp column must have timestamp type");
+        let max_timestamp = ts_type.create_timestamp(self.max_timestamp.load(Ordering::Relaxed));
+        let min_timestamp = ts_type.create_timestamp(self.min_timestamp.load(Ordering::Relaxed));
+
+        let num_ranges = self.parts.read().unwrap().num_parts();
+
+        MemtableStats {
+            estimated_bytes,
+            time_range: Some((min_timestamp, max_timestamp)),
+            num_rows: self.num_rows.load(Ordering::Relaxed),
+            num_ranges,
+            max_sequence: self.max_sequence.load(Ordering::Relaxed),
+            series_count: self.estimated_series_count(),
+        }
    }

-    fn fork(&self, id: MemtableId, _metadata: &RegionMetadataRef) -> MemtableRef {
+    fn fork(&self, id: MemtableId, metadata: &RegionMetadataRef) -> MemtableRef {
+        // Computes the new flat schema based on the new metadata.
+        let flat_arrow_schema = to_flat_sst_arrow_schema(
+            metadata,
+            &FlatSchemaOptions::from_encoding(metadata.primary_key_encoding),
+        );
+
        Arc::new(Self {
            id,
-            parts: RwLock::new(vec![]),
+            parts: Arc::new(RwLock::new(BulkParts::default())),
+            metadata: metadata.clone(),
+            alloc_tracker: AllocTracker::new(self.alloc_tracker.write_buffer_manager()),
+            max_timestamp: AtomicI64::new(i64::MIN),
+            min_timestamp: AtomicI64::new(i64::MAX),
+            max_sequence: AtomicU64::new(0),
+            num_rows: AtomicUsize::new(0),
+            flat_arrow_schema,
        })
    }
 }
+
+impl BulkMemtable {
+    /// Creates a new BulkMemtable
+    pub fn new(
+        id: MemtableId,
+        metadata: RegionMetadataRef,
+        write_buffer_manager: Option<WriteBufferManagerRef>,
+    ) -> Self {
+        let flat_arrow_schema = to_flat_sst_arrow_schema(
+            &metadata,
+            &FlatSchemaOptions::from_encoding(metadata.primary_key_encoding),
+        );
+
+        Self {
+            id,
+            parts: Arc::new(RwLock::new(BulkParts::default())),
+            metadata,
+            alloc_tracker: AllocTracker::new(write_buffer_manager),
+            max_timestamp: AtomicI64::new(i64::MIN),
+            min_timestamp: AtomicI64::new(i64::MAX),
+            max_sequence: AtomicU64::new(0),
+            num_rows: AtomicUsize::new(0),
+            flat_arrow_schema,
+        }
+    }
+
+    /// Updates memtable stats.
+    ///
+    /// Please update this inside the write lock scope.
+    fn update_stats(&self, stats: WriteMetrics) {
+        self.alloc_tracker
+            .on_allocation(stats.key_bytes + stats.value_bytes);
+
+        self.max_timestamp
+            .fetch_max(stats.max_ts, Ordering::Relaxed);
+        self.min_timestamp
+            .fetch_min(stats.min_ts, Ordering::Relaxed);
+        self.max_sequence
+            .fetch_max(stats.max_sequence, Ordering::Relaxed);
+        self.num_rows.fetch_add(stats.num_rows, Ordering::Relaxed);
+    }
+
+    /// Returns the estimated time series count.
+    fn estimated_series_count(&self) -> usize {
+        let bulk_parts = self.parts.read().unwrap();
+        bulk_parts
+            .parts
+            .iter()
+            .map(|part_wrapper| part_wrapper.part.estimated_series_count())
+            .sum()
+    }
+}
+
+/// Iterator builder for bulk range
+struct BulkRangeIterBuilder {
+    part: BulkPart,
+    context: Arc<BulkIterContext>,
+    sequence: Option<SequenceNumber>,
+}
+
+impl IterBuilder for BulkRangeIterBuilder {
+    fn build(&self, _metrics: Option<MemScanMetrics>) -> Result<BoxedBatchIterator> {
+        UnsupportedOperationSnafu {
+            err_msg: "BatchIterator is not supported for bulk memtable",
+        }
+        .fail()
+    }
+
+    fn is_record_batch(&self) -> bool {
+        true
+    }
+
+    fn build_record_batch(
+        &self,
+        _metrics: Option<MemScanMetrics>,
+    ) -> Result<BoxedRecordBatchIterator> {
+        let iter = BulkPartRecordBatchIter::new(
+            self.part.batch.clone(),
+            self.context.clone(),
+            self.sequence,
+        );
+
+        Ok(Box::new(iter))
+    }
+}
+
+/// Iterator builder for encoded bulk range
+struct EncodedBulkRangeIterBuilder {
+    #[allow(dead_code)]
+    file_id: FileId,
+    part: EncodedBulkPart,
+    context: Arc<BulkIterContext>,
+    sequence: Option<SequenceNumber>,
+}
+
+impl IterBuilder for EncodedBulkRangeIterBuilder {
+    fn build(&self, _metrics: Option<MemScanMetrics>) -> Result<BoxedBatchIterator> {
+        UnsupportedOperationSnafu {
+            err_msg: "BatchIterator is not supported for encoded bulk memtable",
+        }
+        .fail()
+    }
+
+    fn is_record_batch(&self) -> bool {
+        true
+    }
+
+    fn build_record_batch(
+        &self,
+        _metrics: Option<MemScanMetrics>,
+    ) -> Result<BoxedRecordBatchIterator> {
+        if let Some(iter) = self.part.read(self.context.clone(), self.sequence)? {
+            Ok(iter)
+        } else {
+            // Return an empty iterator if no data to read
+            Ok(Box::new(std::iter::empty()))
+        }
+    }
+}
+
+struct BulkPartWrapper {
+    part: BulkPart,
+    /// The unique file id for this part in memtable.
+    #[allow(dead_code)]
+    file_id: FileId,
+}
+
+struct EncodedPartWrapper {
+    part: EncodedBulkPart,
+    /// The unique file id for this part in memtable.
+    #[allow(dead_code)]
+    file_id: FileId,
+}
+
+/// Builder to build a [BulkMemtable].
+#[derive(Debug, Default)]
+pub struct BulkMemtableBuilder {
+    write_buffer_manager: Option<WriteBufferManagerRef>,
+}
+
+impl BulkMemtableBuilder {
+    /// Creates a new builder with specific `write_buffer_manager`.
+    pub fn new(write_buffer_manager: Option<WriteBufferManagerRef>) -> Self {
+        Self {
+            write_buffer_manager,
+        }
+    }
+}
+
+impl MemtableBuilder for BulkMemtableBuilder {
+    fn build(&self, id: MemtableId, metadata: &RegionMetadataRef) -> MemtableRef {
+        Arc::new(BulkMemtable::new(
+            id,
+            metadata.clone(),
+            self.write_buffer_manager.clone(),
+        ))
+    }
+
+    fn use_bulk_insert(&self, _metadata: &RegionMetadataRef) -> bool {
+        true
+    }
+}
+
+#[cfg(test)]
+mod tests {
+
+    use mito_codec::row_converter::build_primary_key_codec;
+
+    use super::*;
+    use crate::memtable::bulk::part::BulkPartConverter;
+    use crate::read::scan_region::PredicateGroup;
+    use crate::sst::{to_flat_sst_arrow_schema, FlatSchemaOptions};
+    use crate::test_util::memtable_util::{build_key_values_with_ts_seq_values, metadata_for_test};
+
+    fn create_bulk_part_with_converter(
+        k0: &str,
+        k1: u32,
+        timestamps: Vec<i64>,
+        values: Vec<Option<f64>>,
+        sequence: u64,
+    ) -> Result<BulkPart> {
+        let metadata = metadata_for_test();
+        let capacity = 100;
+        let primary_key_codec = build_primary_key_codec(&metadata);
+        let schema = to_flat_sst_arrow_schema(
+            &metadata,
+            &FlatSchemaOptions::from_encoding(metadata.primary_key_encoding),
+        );
+
+        let mut converter =
+            BulkPartConverter::new(&metadata, schema, capacity, primary_key_codec, true);
+
+        let key_values = build_key_values_with_ts_seq_values(
+            &metadata,
+            k0.to_string(),
+            k1,
+            timestamps.into_iter(),
+            values.into_iter(),
+            sequence,
+        );
+
+        converter.append_key_values(&key_values)?;
+        converter.convert()
+    }
+
+    #[test]
+    fn test_bulk_memtable_write_read() {
+        let metadata = metadata_for_test();
+        let memtable = BulkMemtable::new(999, metadata.clone(), None);
+
+        let test_data = vec![
+            (
+                "key_a",
+                1u32,
+                vec![1000i64, 2000i64],
+                vec![Some(10.5), Some(20.5)],
+                100u64,
+            ),
+            (
+                "key_b",
+                2u32,
+                vec![1500i64, 2500i64],
+                vec![Some(15.5), Some(25.5)],
+                200u64,
+            ),
+            ("key_c", 3u32, vec![3000i64], vec![Some(30.5)], 300u64),
+        ];
+
+        for (k0, k1, timestamps, values, seq) in test_data.iter() {
+            let part =
+                create_bulk_part_with_converter(k0, *k1, timestamps.clone(), values.clone(), *seq)
+                    .unwrap();
+            memtable.write_bulk(part).unwrap();
+        }
+
+        let stats = memtable.stats();
+        assert_eq!(5, stats.num_rows);
+        assert_eq!(3, stats.num_ranges);
+        assert_eq!(300, stats.max_sequence);
+
+        let (min_ts, max_ts) = stats.time_range.unwrap();
+        assert_eq!(1000, min_ts.value());
+        assert_eq!(3000, max_ts.value());
+
+        let predicate_group = PredicateGroup::new(&metadata, &[]);
+        let ranges = memtable.ranges(None, predicate_group, None).unwrap();
+
+        assert_eq!(3, ranges.ranges.len());
+        assert_eq!(5, ranges.stats.num_rows);
+
+        for (_range_id, range) in ranges.ranges.iter() {
+            assert!(range.num_rows() > 0);
+            assert!(range.is_record_batch());
+
+            let record_batch_iter = range.build_record_batch_iter(None).unwrap();
+
+            let mut total_rows = 0;
+            for batch_result in record_batch_iter {
+                let batch = batch_result.unwrap();
+                total_rows += batch.num_rows();
+                assert!(batch.num_rows() > 0);
+                assert_eq!(8, batch.num_columns());
+            }
+            assert_eq!(total_rows, range.num_rows());
+        }
+    }
+
+    #[test]
+    fn test_bulk_memtable_ranges_with_projection() {
+        let metadata = metadata_for_test();
+        let memtable = BulkMemtable::new(111, metadata.clone(), None);
+
+        let bulk_part = create_bulk_part_with_converter(
+            "projection_test",
+            5,
+            vec![5000, 6000, 7000],
+            vec![Some(50.0), Some(60.0), Some(70.0)],
+            500,
+        )
+        .unwrap();
+
+        memtable.write_bulk(bulk_part).unwrap();
+
+        let projection = vec![4u32];
+        let predicate_group = PredicateGroup::new(&metadata, &[]);
+        let ranges = memtable
+            .ranges(Some(&projection), predicate_group, None)
+            .unwrap();
+
+        assert_eq!(1, ranges.ranges.len());
+        let range = ranges.ranges.get(&0).unwrap();
+
+        assert!(range.is_record_batch());
+        let record_batch_iter = range.build_record_batch_iter(None).unwrap();
+
+        let mut total_rows = 0;
+        for batch_result in record_batch_iter {
+            let batch = batch_result.unwrap();
+            assert!(batch.num_rows() > 0);
+            assert_eq!(5, batch.num_columns());
+            total_rows += batch.num_rows();
+        }
+        assert_eq!(3, total_rows);
+    }
+
+    #[test]
+    fn test_bulk_memtable_unsupported_operations() {
+        let metadata = metadata_for_test();
+        let memtable = BulkMemtable::new(111, metadata.clone(), None);
+
+        let key_values = build_key_values_with_ts_seq_values(
+            &metadata,
+            "test".to_string(),
+            1,
+            vec![1000].into_iter(),
+            vec![Some(1.0)].into_iter(),
+            1,
+        );
+
+        let err = memtable.write(&key_values).unwrap_err();
+        assert!(err.to_string().contains("not supported"));
+
+        let kv = key_values.iter().next().unwrap();
+        let err = memtable.write_one(kv).unwrap_err();
+        assert!(err.to_string().contains("not supported"));
+    }
+
+    #[test]
+    fn test_bulk_memtable_freeze() {
+        let metadata = metadata_for_test();
+        let memtable = BulkMemtable::new(222, metadata.clone(), None);
+
+        let bulk_part = create_bulk_part_with_converter(
+            "freeze_test",
+            10,
+            vec![10000],
+            vec![Some(100.0)],
+            1000,
+        )
+        .unwrap();
+
+        memtable.write_bulk(bulk_part).unwrap();
+        memtable.freeze().unwrap();
+
+        let stats_after_freeze = memtable.stats();
+        assert_eq!(1, stats_after_freeze.num_rows);
+    }
+
+    #[test]
+    fn test_bulk_memtable_fork() {
+        let metadata = metadata_for_test();
+        let original_memtable = BulkMemtable::new(333, metadata.clone(), None);
+
+        let bulk_part =
+            create_bulk_part_with_converter("fork_test", 15, vec![15000], vec![Some(150.0)], 1500)
+                .unwrap();
+
+        original_memtable.write_bulk(bulk_part).unwrap();
+
+        let forked_memtable = original_memtable.fork(444, &metadata);
+
+        assert_eq!(forked_memtable.id(), 444);
+        assert!(forked_memtable.is_empty());
+        assert_eq!(0, forked_memtable.stats().num_rows);
+
+        assert!(!original_memtable.is_empty());
+        assert_eq!(1, original_memtable.stats().num_rows);
+    }
+}
--- a/src/mito2/src/memtable/bulk/part.rs
+++ b/src/mito2/src/memtable/bulk/part.rs
@@ -61,6 +61,7 @@ use crate::memtable::bulk::context::BulkIterContextRef;
 use crate::memtable::bulk::part_reader::EncodedBulkPartIter;
 use crate::memtable::time_series::{ValueBuilder, Values};
 use crate::memtable::BoxedRecordBatchIterator;
+use crate::sst::parquet::flat_format::primary_key_column_index;
 use crate::sst::parquet::format::{PrimaryKeyArray, PrimaryKeyArrayBuilder, ReadFormat};
 use crate::sst::parquet::helper::parse_parquet_metadata;
 use crate::sst::to_sst_arrow_schema;
@@ -152,6 +153,18 @@ impl BulkPart {
            .sum()
    }

+    /// Returns the estimated series count in this BulkPart.
+    /// This is calculated from the dictionary values count of the PrimaryKeyArray.
+    pub fn estimated_series_count(&self) -> usize {
+        let pk_column_idx = primary_key_column_index(self.batch.num_columns());
+        let pk_column = self.batch.column(pk_column_idx);
+        if let Some(dict_array) = pk_column.as_any().downcast_ref::<PrimaryKeyArray>() {
+            dict_array.values().len()
+        } else {
+            0
+        }
+    }
+
    /// Converts [BulkPart] to [Mutation] for fallback `write_bulk` implementation.
    pub(crate) fn to_mutation(&self, region_metadata: &RegionMetadataRef) -> Result<Mutation> {
        let vectors = region_metadata
@@ -489,7 +502,7 @@ fn sort_primary_key_record_batch(batch: &RecordBatch) -> Result<RecordBatch> {
    datatypes::arrow::compute::take_record_batch(batch, &indices).context(ComputeArrowSnafu)
 }

-#[derive(Debug)]
+#[derive(Debug, Clone)]
 pub struct EncodedBulkPart {
    data: Bytes,
    metadata: BulkPartMeta,
@@ -528,7 +541,7 @@ impl EncodedBulkPart {
    }
 }

-#[derive(Debug)]
+#[derive(Debug, Clone)]
 pub struct BulkPartMeta {
    /// Total rows in part.
    pub num_rows: usize,