reorder parsing of aggregations results

2025-12-30 14:02:55 +00:00 · 2025-02-26 18:06:09 +01:00
40 changed files with 216 additions and 571 deletions
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -7,8 +7,6 @@ Tantivy 0.23 will be backwards compatible with indices created with v0.22 and v0
 - fix bug that causes out-of-order sstable key. [#2445](https://github.com/quickwit-oss/tantivy/pull/2445)(@fulmicoton)
 - fix ReferenceValue API flaw [#2372](https://github.com/quickwit-oss/tantivy/pull/2372)(@PSeitz)
 - fix `OwnedBytes` debug panic [#2512](https://github.com/quickwit-oss/tantivy/pull/2512)(@b41sh)
- catch panics during merges [#2582](https://github.com/quickwit-oss/tantivy/pull/2582)(@rdettai)
- switch from u32 to usize in bitpacker. This enables multivalued columns larger than 4GB, which crashed during merge before. [#2581](https://github.com/quickwit-oss/tantivy/pull/2581) [#2586](https://github.com/quickwit-oss/tantivy/pull/2586)(@fulmicoton-dd @PSeitz)

 #### Breaking API Changes
 - remove index sorting [#2434](https://github.com/quickwit-oss/tantivy/pull/2434)(@PSeitz)
@@ -26,7 +24,6 @@ Tantivy 0.23 will be backwards compatible with indices created with v0.22 and v0
    - reduce top hits memory consumption [#2426](https://github.com/quickwit-oss/tantivy/pull/2426)(@PSeitz)
    - check unsupported parameters top_hits [#2351](https://github.com/quickwit-oss/tantivy/pull/2351)(@PSeitz)
    - Change AggregationLimits to AggregationLimitsGuard [#2495](https://github.com/quickwit-oss/tantivy/pull/2495)(@PSeitz)
-    - add support for counting non integer in aggregation [#2547](https://github.com/quickwit-oss/tantivy/pull/2547)(@trinity-1686a)
 - **Range Queries**
    - Support fast field range queries on json fields [#2456](https://github.com/quickwit-oss/tantivy/pull/2456)(@PSeitz)
    - Add support for str fast field range query [#2460](https://github.com/quickwit-oss/tantivy/pull/2460) [#2452](https://github.com/quickwit-oss/tantivy/pull/2452) [#2453](https://github.com/quickwit-oss/tantivy/pull/2453)(@PSeitz)
@@ -37,8 +34,7 @@ Tantivy 0.23 will be backwards compatible with indices created with v0.22 and v0
 - add columnar format compatibility tests [#2433](https://github.com/quickwit-oss/tantivy/pull/2433)(@PSeitz)
 - Improved snippet ranges algorithm [#2474](https://github.com/quickwit-oss/tantivy/pull/2474)(@gezihuzi)
 - make find_field_with_default return json fields without path [#2476](https://github.com/quickwit-oss/tantivy/pull/2476)(@trinity-1686a)
- Make `BooleanQuery` support `minimum_number_should_match` [#2405](https://github.com/quickwit-oss/tantivy/pull/2405)(@LebranceBW)
- Make `NUM_MERGE_THREADS` configurable [#2535](https://github.com/quickwit-oss/tantivy/pull/2535)(@Barre)
+- feat(query): Make `BooleanQuery` support `minimum_number_should_match` [#2405](https://github.com/quickwit-oss/tantivy/pull/2405)(@LebranceBW)

 - **RegexPhraseQuery** 
 `RegexPhraseQuery` supports phrase queries with regex. E.g. query "b.* b.* wolf" matches "big bad wolf". Slop is supported as well: "b.* wolf"~2 matches "big bad wolf" [#2516](https://github.com/quickwit-oss/tantivy/pull/2516)(@PSeitz)
@@ -64,9 +60,7 @@ This will slightly increase space and access time. [#2439](https://github.com/qu
    - fix de-escaping too much in query parser [#2427](https://github.com/quickwit-oss/tantivy/pull/2427)(@trinity-1686a)
    - improve query parser [#2416](https://github.com/quickwit-oss/tantivy/pull/2416)(@trinity-1686a)
    - Support field grouping `title:(return AND "pink panther")` [#2333](https://github.com/quickwit-oss/tantivy/pull/2333)(@trinity-1686a)
-    - allow term starting with wildcard [#2568](https://github.com/quickwit-oss/tantivy/pull/2568)(@trinity-1686a)

- Exist queries match subpath fields [#2558](https://github.com/quickwit-oss/tantivy/pull/2558)(@rdettai)
 - add access benchmark for columnar [#2432](https://github.com/quickwit-oss/tantivy/pull/2432)(@PSeitz)
 - extend indexwriter proptests [#2342](https://github.com/quickwit-oss/tantivy/pull/2342)(@PSeitz)
 - add bench & test for columnar merging [#2428](https://github.com/quickwit-oss/tantivy/pull/2428)(@PSeitz)
--- a/Cargo.toml
+++ b/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy"
-version = "0.24.0"
+version = "0.23.0"
 authors = ["Paul Masurel <paul.masurel@gmail.com>"]
 license = "MIT"
 categories = ["database-implementations", "data-structures"]
@@ -31,8 +31,8 @@ lz4_flex = { version = "0.11", default-features = false, optional = true }
 zstd = { version = "0.13", optional = true, default-features = false }
 tempfile = { version = "3.12.0", optional = true }
 log = "0.4.16"
-serde = { version = "1.0.219", features = ["derive"] }
-serde_json = "1.0.140"
+serde = { version = "1.0.136", features = ["derive"] }
+serde_json = "1.0.79"
 fs4 = { version = "0.8.0", optional = true }
 levenshtein_automata = "0.2.1"
 uuid = { version = "1.0.0", features = ["v4", "serde"] }
@@ -57,13 +57,13 @@ measure_time = "0.9.0"
 arc-swap = "1.5.0"
 bon = "3.3.1"

-columnar = { version = "0.5", path = "./columnar", package = "tantivy-columnar" }
-sstable = { version = "0.5", path = "./sstable", package = "tantivy-sstable", optional = true }
-stacker = { version = "0.5", path = "./stacker", package = "tantivy-stacker" }
-query-grammar = { version = "0.24.0", path = "./query-grammar", package = "tantivy-query-grammar" }
-tantivy-bitpacker = { version = "0.8", path = "./bitpacker" }
-common = { version = "0.9", path = "./common/", package = "tantivy-common" }
-tokenizer-api = { version = "0.5", path = "./tokenizer-api", package = "tantivy-tokenizer-api" }
+columnar = { version = "0.3", path = "./columnar", package = "tantivy-columnar" }
+sstable = { version = "0.3", path = "./sstable", package = "tantivy-sstable", optional = true }
+stacker = { version = "0.3", path = "./stacker", package = "tantivy-stacker" }
+query-grammar = { version = "0.22.0", path = "./query-grammar", package = "tantivy-query-grammar" }
+tantivy-bitpacker = { version = "0.6", path = "./bitpacker" }
+common = { version = "0.7", path = "./common/", package = "tantivy-common" }
+tokenizer-api = { version = "0.3", path = "./tokenizer-api", package = "tantivy-tokenizer-api" }
 sketches-ddsketch = { version = "0.3.0", features = ["use_serde"] }
 hyperloglogplus = { version = "0.4.1", features = ["const-loop"] }
 futures-util = { version = "0.3.28", optional = true }
--- a/bitpacker/Cargo.toml
+++ b/bitpacker/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy-bitpacker"
-version = "0.8.0"
+version = "0.6.0"
 edition = "2021"
 authors = ["Paul Masurel <paul.masurel@gmail.com>"]
 license = "MIT"
--- a/bitpacker/src/bitpacker.rs
+++ b/bitpacker/src/bitpacker.rs
@@ -65,7 +65,7 @@ impl BitPacker {

 #[derive(Clone, Debug, Default, Copy)]
 pub struct BitUnpacker {
-    num_bits: usize,
+    num_bits: u32,
    mask: u64,
 }

@@ -83,7 +83,7 @@ impl BitUnpacker {
            (1u64 << num_bits) - 1u64
        };
        BitUnpacker {
-            num_bits: usize::from(num_bits),
+            num_bits: u32::from(num_bits),
            mask,
        }
    }
@@ -94,7 +94,7 @@ impl BitUnpacker {

    #[inline]
    pub fn get(&self, idx: u32, data: &[u8]) -> u64 {
-        let addr_in_bits = idx as usize * self.num_bits;
+        let addr_in_bits = idx as usize * self.num_bits as usize;
        let addr = addr_in_bits >> 3;
        if addr + 8 > data.len() {
            if self.num_bits == 0 {
@@ -134,13 +134,12 @@ impl BitUnpacker {
            "Bitwidth must be <= 32 to use this method."
        );

-        let end_idx: u32 = start_idx + output.len() as u32;
+        let end_idx = start_idx + output.len() as u32;

-        // We use `usize` here to avoid overflow issues.
-        let end_bit_read = (end_idx as usize) * self.num_bits;
+        let end_bit_read = end_idx * self.num_bits;
        let end_byte_read = (end_bit_read + 7) / 8;
        assert!(
-            end_byte_read <= data.len(),
+            end_byte_read as usize <= data.len(),
            "Requested index is out of bounds."
        );

@@ -160,24 +159,24 @@ impl BitUnpacker {
        // We want the start of the fast track to start align with bytes.
        // A sufficient condition is to start with an idx that is a multiple of 8,
        // so highway start is the closest multiple of 8 that is >= start_idx.
-        let entrance_ramp_len: u32 = 8 - (start_idx % 8) % 8;
+        let entrance_ramp_len = 8 - (start_idx % 8) % 8;

        let highway_start: u32 = start_idx + entrance_ramp_len;

-        if highway_start + (BitPacker1x::BLOCK_LEN as u32) > end_idx {
+        if highway_start + BitPacker1x::BLOCK_LEN as u32 > end_idx {
            // We don't have enough values to have even a single block of highway.
            // Let's just supply the values the simple way.
            get_batch_ramp(start_idx, output);
            return;
        }

-        let num_blocks: usize = (end_idx - highway_start) as usize / BitPacker1x::BLOCK_LEN;
+        let num_blocks: u32 = (end_idx - highway_start) / BitPacker1x::BLOCK_LEN as u32;

        // Entrance ramp
        get_batch_ramp(start_idx, &mut output[..entrance_ramp_len as usize]);

        // Highway
-        let mut offset = (highway_start as usize * self.num_bits) / 8;
+        let mut offset = (highway_start * self.num_bits) as usize / 8;
        let mut output_cursor = (highway_start - start_idx) as usize;
        for _ in 0..num_blocks {
            offset += BitPacker1x.decompress(
@@ -189,7 +188,7 @@ impl BitUnpacker {
        }

        // Exit ramp
-        let highway_end: u32 = highway_start + (num_blocks * BitPacker1x::BLOCK_LEN) as u32;
+        let highway_end = highway_start + num_blocks * BitPacker1x::BLOCK_LEN as u32;
        get_batch_ramp(highway_end, &mut output[output_cursor..]);
    }

--- a/bitpacker/src/blocked_bitpacker.rs
+++ b/bitpacker/src/blocked_bitpacker.rs
@@ -34,7 +34,7 @@ struct BlockedBitpackerEntryMetaData {

 impl BlockedBitpackerEntryMetaData {
    fn new(offset: u64, num_bits: u8, base_value: u64) -> Self {
-        let encoded = offset | (u64::from(num_bits) << (64 - 8));
+        let encoded = offset | (num_bits as u64) << (64 - 8);
        Self {
            encoded,
            base_value,
--- a/cliff.toml
+++ b/cliff.toml
@@ -16,14 +16,14 @@ body = """

 {%- if version %} in {{ version }}{%- endif -%}
 {% for commit in commits %}
-  {% if commit.remote.pr_title -%}
-    {%- set commit_message = commit.remote.pr_title -%}
+  {% if commit.github.pr_title -%}
+    {%- set commit_message = commit.github.pr_title -%}
  {%- else -%}
    {%- set commit_message = commit.message -%}
  {%- endif -%}
  - {{ commit_message | split(pat="\n") | first | trim }}\
-    {% if commit.remote.pr_number %} \
-      [#{{ commit.remote.pr_number }}]({{ self::remote_url() }}/pull/{{ commit.remote.pr_number }}){% if commit.remote.username %}(@{{ commit.remote.username }}){%- endif -%} \
+    {% if commit.github.pr_number %} \
+      [#{{ commit.github.pr_number }}]({{ self::remote_url() }}/pull/{{ commit.github.pr_number }}){% if commit.github.username %}(@{{ commit.github.username }}){%- endif -%} \
    {%- endif %}
 {%- endfor -%}

--- a/columnar/Cargo.toml
+++ b/columnar/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy-columnar"
-version = "0.5.0"
+version = "0.3.0"
 edition = "2021"
 license = "MIT"
 homepage = "https://github.com/quickwit-oss/tantivy"
@@ -12,10 +12,10 @@ categories = ["database-implementations", "data-structures", "compression"]
 itertools = "0.14.0"
 fastdivide = "0.4.0"

-stacker = { version= "0.5", path = "../stacker", package="tantivy-stacker"}
-sstable = { version= "0.5", path = "../sstable", package = "tantivy-sstable" }
-common = { version= "0.9", path = "../common", package = "tantivy-common" }
-tantivy-bitpacker = { version= "0.8", path = "../bitpacker/" }
+stacker = { version= "0.3", path = "../stacker", package="tantivy-stacker"}
+sstable = { version= "0.3", path = "../sstable", package = "tantivy-sstable" }
+common = { version= "0.7", path = "../common", package = "tantivy-common" }
+tantivy-bitpacker = { version= "0.6", path = "../bitpacker/" }
 serde = "1.0.152"
 downcast-rs = "2.0.1"

--- a/columnar/src/block_accessor.rs
+++ b/columnar/src/block_accessor.rs
@@ -139,7 +139,7 @@ mod tests {
            missing_docs.push(missing_doc);
        });

-        assert_eq!(missing_docs, Vec::<u32>::new());
+        assert_eq!(missing_docs, vec![]);
    }

    #[test]
--- a/columnar/src/column_index/merge/stacked.rs
+++ b/columnar/src/column_index/merge/stacked.rs
@@ -56,7 +56,7 @@ fn get_doc_ids_with_values<'a>(
        ColumnIndex::Full => Box::new(doc_range),
        ColumnIndex::Optional(optional_index) => Box::new(
            optional_index
-                .iter_docs()
+                .iter_rows()
                .map(move |row| row + doc_range.start),
        ),
        ColumnIndex::Multivalued(multivalued_index) => match multivalued_index {
@@ -73,7 +73,7 @@ fn get_doc_ids_with_values<'a>(
            MultiValueIndex::MultiValueIndexV2(multivalued_index) => Box::new(
                multivalued_index
                    .optional_index
-                    .iter_docs()
+                    .iter_rows()
                    .map(move |row| row + doc_range.start),
            ),
        },
@@ -177,7 +177,7 @@ impl<'a> Iterable<RowId> for StackedOptionalIndex<'a> {
                        ColumnIndex::Full => Box::new(columnar_row_range),
                        ColumnIndex::Optional(optional_index) => Box::new(
                            optional_index
-                                .iter_docs()
+                                .iter_rows()
                                .map(move |row_id: RowId| columnar_row_range.start + row_id),
                        ),
                        ColumnIndex::Multivalued(_) => {
--- a/columnar/src/column_index/optional_index/mod.rs
+++ b/columnar/src/column_index/optional_index/mod.rs
@@ -80,23 +80,23 @@ impl BlockVariant {
 /// index is the block index. For each block `byte_start` and `offset` is computed.
 #[derive(Clone)]
 pub struct OptionalIndex {
-    num_docs: RowId,
-    num_non_null_docs: RowId,
+    num_rows: RowId,
+    num_non_null_rows: RowId,
    block_data: OwnedBytes,
    block_metas: Arc<[BlockMeta]>,
 }

 impl Iterable<u32> for &OptionalIndex {
    fn boxed_iter(&self) -> Box<dyn Iterator<Item = u32> + '_> {
-        Box::new(self.iter_docs())
+        Box::new(self.iter_rows())
    }
 }

 impl std::fmt::Debug for OptionalIndex {
    fn fmt(&self, f: &mut std::fmt::Formatter) -> std::fmt::Result {
        f.debug_struct("OptionalIndex")
-            .field("num_docs", &self.num_docs)
-            .field("num_non_null_docs", &self.num_non_null_docs)
+            .field("num_rows", &self.num_rows)
+            .field("num_non_null_rows", &self.num_non_null_rows)
            .finish_non_exhaustive()
    }
 }
@@ -271,17 +271,17 @@ impl OptionalIndex {
    }

    pub fn num_docs(&self) -> RowId {
-        self.num_docs
+        self.num_rows
    }

    pub fn num_non_nulls(&self) -> RowId {
-        self.num_non_null_docs
+        self.num_non_null_rows
    }

-    pub fn iter_docs(&self) -> impl Iterator<Item = RowId> + '_ {
+    pub fn iter_rows(&self) -> impl Iterator<Item = RowId> + '_ {
        // TODO optimize
        let mut select_batch = self.select_cursor();
-        (0..self.num_non_null_docs).map(move |rank| select_batch.select(rank))
+        (0..self.num_non_null_rows).map(move |rank| select_batch.select(rank))
    }
    pub fn select_batch(&self, ranks: &mut [RowId]) {
        let mut select_cursor = self.select_cursor();
@@ -519,15 +519,15 @@ pub fn open_optional_index(bytes: OwnedBytes) -> io::Result<OptionalIndex> {
    let (mut bytes, num_non_empty_blocks_bytes) = bytes.rsplit(2);
    let num_non_empty_block_bytes =
        u16::from_le_bytes(num_non_empty_blocks_bytes.as_slice().try_into().unwrap());
-    let num_docs = VInt::deserialize_u64(&mut bytes)? as u32;
+    let num_rows = VInt::deserialize_u64(&mut bytes)? as u32;
    let block_metas_num_bytes =
        num_non_empty_block_bytes as usize * SERIALIZED_BLOCK_META_NUM_BYTES;
    let (block_data, block_metas) = bytes.rsplit(block_metas_num_bytes);
-    let (block_metas, num_non_null_docs) =
-        deserialize_optional_index_block_metadatas(block_metas.as_slice(), num_docs);
+    let (block_metas, num_non_null_rows) =
+        deserialize_optional_index_block_metadatas(block_metas.as_slice(), num_rows);
    let optional_index = OptionalIndex {
-        num_docs,
-        num_non_null_docs,
+        num_rows,
+        num_non_null_rows,
        block_data,
        block_metas: block_metas.into(),
    };
--- a/columnar/src/column_index/optional_index/tests.rs
+++ b/columnar/src/column_index/optional_index/tests.rs
@@ -164,7 +164,7 @@ fn test_optional_index_large() {
 fn test_optional_index_iter_aux(row_ids: &[RowId], num_rows: RowId) {
    let optional_index = OptionalIndex::for_test(num_rows, row_ids);
    assert_eq!(optional_index.num_docs(), num_rows);
-    assert!(optional_index.iter_docs().eq(row_ids.iter().copied()));
+    assert!(optional_index.iter_rows().eq(row_ids.iter().copied()));
 }

 #[test]
--- a/columnar/src/columnar/merge/merge_dict_column.rs
+++ b/columnar/src/columnar/merge/merge_dict_column.rs
@@ -3,7 +3,7 @@ use std::io::{self, Write};
 use common::{BitSet, CountingWriter, ReadOnlyBitSet};
 use sstable::{SSTable, Streamer, TermOrdinal, VoidSSTable};

-use super::term_merger::{TermMerger, TermsWithSegmentOrd};
+use super::term_merger::TermMerger;
 use crate::column::serialize_column_mappable_to_u64;
 use crate::column_index::SerializableColumnIndex;
 use crate::iterable::Iterable;
@@ -126,17 +126,14 @@ fn serialize_merged_dict(
    let mut term_ord_mapping = TermOrdinalMapping::default();

    let mut field_term_streams = Vec::new();
-    for (segment_ord, column_opt) in bytes_columns.iter().enumerate() {
+    for column_opt in bytes_columns.iter() {
        if let Some(column) = column_opt {
            term_ord_mapping.add_segment(column.dictionary.num_terms());
            let terms: Streamer<VoidSSTable> = column.dictionary.stream()?;
-            field_term_streams.push(TermsWithSegmentOrd { terms, segment_ord });
+            field_term_streams.push(terms);
        } else {
            term_ord_mapping.add_segment(0);
-            field_term_streams.push(TermsWithSegmentOrd {
-                terms: Streamer::empty(),
-                segment_ord,
-            });
+            field_term_streams.push(Streamer::empty());
        }
    }

@@ -194,7 +191,6 @@ fn serialize_merged_dict(

 #[derive(Default, Debug)]
 struct TermOrdinalMapping {
-    /// Contains the new term ordinals for each segment.
    per_segment_new_term_ordinals: Vec<Vec<TermOrdinal>>,
 }

@@ -209,6 +205,6 @@ impl TermOrdinalMapping {
    }

    fn get_segment(&self, segment_ord: u32) -> &[TermOrdinal] {
-        &self.per_segment_new_term_ordinals[segment_ord as usize]
+        &(self.per_segment_new_term_ordinals[segment_ord as usize])[..]
    }
 }
--- a/columnar/src/columnar/merge/merge_mapping.rs
+++ b/columnar/src/columnar/merge/merge_mapping.rs
@@ -26,7 +26,7 @@ impl StackMergeOrder {
        let mut cumulated_row_ids: Vec<RowId> = Vec::with_capacity(columnars.len());
        let mut cumulated_row_id = 0;
        for columnar in columnars {
-            cumulated_row_id += columnar.num_docs();
+            cumulated_row_id += columnar.num_rows();
            cumulated_row_ids.push(cumulated_row_id);
        }
        StackMergeOrder { cumulated_row_ids }
--- a/columnar/src/columnar/merge/mod.rs
+++ b/columnar/src/columnar/merge/mod.rs
@@ -80,12 +80,13 @@ pub fn merge_columnar(
    output: &mut impl io::Write,
 ) -> io::Result<()> {
    let mut serializer = ColumnarSerializer::new(output);
-    let num_docs_per_columnar = columnar_readers
+    let num_rows_per_columnar = columnar_readers
        .iter()
-        .map(|reader| reader.num_docs())
+        .map(|reader| reader.num_rows())
        .collect::<Vec<u32>>();

-    let columns_to_merge = group_columns_for_merge(columnar_readers, required_columns)?;
+    let columns_to_merge =
+        group_columns_for_merge(columnar_readers, required_columns, &merge_row_order)?;
    for res in columns_to_merge {
        let ((column_name, _column_type_category), grouped_columns) = res;
        let grouped_columns = grouped_columns.open(&merge_row_order)?;
@@ -93,18 +94,15 @@ pub fn merge_columnar(
            continue;
        }

-        let column_type_after_merge = grouped_columns.column_type_after_merge();
+        let column_type = grouped_columns.column_type_after_merge();
        let mut columns = grouped_columns.columns;
-        // Make sure the number of columns is the same as the number of columnar readers.
-        // Or num_docs_per_columnar would be incorrect.
-        assert_eq!(columns.len(), columnar_readers.len());
-        coerce_columns(column_type_after_merge, &mut columns)?;
+        coerce_columns(column_type, &mut columns)?;

        let mut column_serializer =
-            serializer.start_serialize_column(column_name.as_bytes(), column_type_after_merge);
+            serializer.start_serialize_column(column_name.as_bytes(), column_type);
        merge_column(
-            column_type_after_merge,
-            &num_docs_per_columnar,
+            column_type,
+            &num_rows_per_columnar,
            columns,
            &merge_row_order,
            &mut column_serializer,
@@ -130,7 +128,7 @@ fn dynamic_column_to_u64_monotonic(dynamic_column: DynamicColumn) -> Option<Colu
 fn merge_column(
    column_type: ColumnType,
    num_docs_per_column: &[u32],
-    columns_to_merge: Vec<Option<DynamicColumn>>,
+    columns: Vec<Option<DynamicColumn>>,
    merge_row_order: &MergeRowOrder,
    wrt: &mut impl io::Write,
 ) -> io::Result<()> {
@@ -140,10 +138,10 @@ fn merge_column(
        | ColumnType::F64
        | ColumnType::DateTime
        | ColumnType::Bool => {
-            let mut column_indexes: Vec<ColumnIndex> = Vec::with_capacity(columns_to_merge.len());
+            let mut column_indexes: Vec<ColumnIndex> = Vec::with_capacity(columns.len());
            let mut column_values: Vec<Option<Arc<dyn ColumnValues>>> =
-                Vec::with_capacity(columns_to_merge.len());
-            for (i, dynamic_column_opt) in columns_to_merge.into_iter().enumerate() {
+                Vec::with_capacity(columns.len());
+            for (i, dynamic_column_opt) in columns.into_iter().enumerate() {
                if let Some(Column { index: idx, values }) =
                    dynamic_column_opt.and_then(dynamic_column_to_u64_monotonic)
                {
@@ -166,10 +164,10 @@ fn merge_column(
            serialize_column_mappable_to_u64(merged_column_index, &merge_column_values, wrt)?;
        }
        ColumnType::IpAddr => {
-            let mut column_indexes: Vec<ColumnIndex> = Vec::with_capacity(columns_to_merge.len());
+            let mut column_indexes: Vec<ColumnIndex> = Vec::with_capacity(columns.len());
            let mut column_values: Vec<Option<Arc<dyn ColumnValues<Ipv6Addr>>>> =
-                Vec::with_capacity(columns_to_merge.len());
-            for (i, dynamic_column_opt) in columns_to_merge.into_iter().enumerate() {
+                Vec::with_capacity(columns.len());
+            for (i, dynamic_column_opt) in columns.into_iter().enumerate() {
                if let Some(DynamicColumn::IpAddr(Column { index: idx, values })) =
                    dynamic_column_opt
                {
@@ -194,10 +192,9 @@ fn merge_column(
            serialize_column_mappable_to_u128(merged_column_index, &merge_column_values, wrt)?;
        }
        ColumnType::Bytes | ColumnType::Str => {
-            let mut column_indexes: Vec<ColumnIndex> = Vec::with_capacity(columns_to_merge.len());
-            let mut bytes_columns: Vec<Option<BytesColumn>> =
-                Vec::with_capacity(columns_to_merge.len());
-            for (i, dynamic_column_opt) in columns_to_merge.into_iter().enumerate() {
+            let mut column_indexes: Vec<ColumnIndex> = Vec::with_capacity(columns.len());
+            let mut bytes_columns: Vec<Option<BytesColumn>> = Vec::with_capacity(columns.len());
+            for (i, dynamic_column_opt) in columns.into_iter().enumerate() {
                match dynamic_column_opt {
                    Some(DynamicColumn::Str(str_column)) => {
                        column_indexes.push(str_column.term_ord_column.index.clone());
@@ -251,7 +248,7 @@ impl GroupedColumns {
        if column_type.len() == 1 {
            return column_type.into_iter().next().unwrap();
        }
-        // At the moment, only the numerical column type category has more than one possible
+        // At the moment, only the numerical categorical column type has more than one possible
        // column type.
        assert!(self
            .columns
@@ -364,7 +361,7 @@ fn is_empty_after_merge(
                    ColumnIndex::Empty { .. } => true,
                    ColumnIndex::Full => alive_bitset.len() == 0,
                    ColumnIndex::Optional(optional_index) => {
-                        for doc in optional_index.iter_docs() {
+                        for doc in optional_index.iter_rows() {
                            if alive_bitset.contains(doc) {
                                return false;
                            }
@@ -394,6 +391,7 @@ fn is_empty_after_merge(
 fn group_columns_for_merge<'a>(
    columnar_readers: &'a [&'a ColumnarReader],
    required_columns: &'a [(String, ColumnType)],
+    _merge_row_order: &'a MergeRowOrder,
 ) -> io::Result<BTreeMap<(String, ColumnTypeCategory), GroupedColumnsHandle>> {
    let mut columns: BTreeMap<(String, ColumnTypeCategory), GroupedColumnsHandle> = BTreeMap::new();

--- a/columnar/src/columnar/merge/term_merger.rs
+++ b/columnar/src/columnar/merge/term_merger.rs
@@ -5,29 +5,28 @@ use sstable::TermOrdinal;

 use crate::Streamer;

-/// The terms of a column with the ordinal of the segment.
-pub struct TermsWithSegmentOrd<'a> {
-    pub terms: Streamer<'a>,
+pub struct HeapItem<'a> {
+    pub streamer: Streamer<'a>,
    pub segment_ord: usize,
 }

-impl PartialEq for TermsWithSegmentOrd<'_> {
+impl PartialEq for HeapItem<'_> {
    fn eq(&self, other: &Self) -> bool {
        self.segment_ord == other.segment_ord
    }
 }

-impl Eq for TermsWithSegmentOrd<'_> {}
+impl Eq for HeapItem<'_> {}

-impl<'a> PartialOrd for TermsWithSegmentOrd<'a> {
-    fn partial_cmp(&self, other: &TermsWithSegmentOrd<'a>) -> Option<Ordering> {
+impl<'a> PartialOrd for HeapItem<'a> {
+    fn partial_cmp(&self, other: &HeapItem<'a>) -> Option<Ordering> {
        Some(self.cmp(other))
    }
 }

-impl<'a> Ord for TermsWithSegmentOrd<'a> {
-    fn cmp(&self, other: &TermsWithSegmentOrd<'a>) -> Ordering {
-        (&other.terms.key(), &other.segment_ord).cmp(&(&self.terms.key(), &self.segment_ord))
+impl<'a> Ord for HeapItem<'a> {
+    fn cmp(&self, other: &HeapItem<'a>) -> Ordering {
+        (&other.streamer.key(), &other.segment_ord).cmp(&(&self.streamer.key(), &self.segment_ord))
    }
 }

@@ -38,32 +37,39 @@ impl<'a> Ord for TermsWithSegmentOrd<'a> {
 /// - the term
 /// - a slice with the ordinal of the segments containing the terms.
 pub struct TermMerger<'a> {
-    heap: BinaryHeap<TermsWithSegmentOrd<'a>>,
-    term_streams_with_segment: Vec<TermsWithSegmentOrd<'a>>,
+    heap: BinaryHeap<HeapItem<'a>>,
+    current_streamers: Vec<HeapItem<'a>>,
 }

 impl<'a> TermMerger<'a> {
    /// Stream of merged term dictionary
-    pub fn new(term_streams_with_segment: Vec<TermsWithSegmentOrd<'a>>) -> TermMerger<'a> {
+    pub fn new(streams: Vec<Streamer<'a>>) -> TermMerger<'a> {
        TermMerger {
            heap: BinaryHeap::new(),
-            term_streams_with_segment,
+            current_streamers: streams
+                .into_iter()
+                .enumerate()
+                .map(|(ord, streamer)| HeapItem {
+                    streamer,
+                    segment_ord: ord,
+                })
+                .collect(),
        }
    }

    pub(crate) fn matching_segments<'b: 'a>(
        &'b self,
    ) -> impl 'b + Iterator<Item = (usize, TermOrdinal)> {
-        self.term_streams_with_segment
+        self.current_streamers
            .iter()
-            .map(|heap_item| (heap_item.segment_ord, heap_item.terms.term_ord()))
+            .map(|heap_item| (heap_item.segment_ord, heap_item.streamer.term_ord()))
    }

    fn advance_segments(&mut self) {
-        let streamers = &mut self.term_streams_with_segment;
+        let streamers = &mut self.current_streamers;
        let heap = &mut self.heap;
        for mut heap_item in streamers.drain(..) {
-            if heap_item.terms.advance() {
+            if heap_item.streamer.advance() {
                heap.push(heap_item);
            }
        }
@@ -75,13 +81,13 @@ impl<'a> TermMerger<'a> {
    pub fn advance(&mut self) -> bool {
        self.advance_segments();
        if let Some(head) = self.heap.pop() {
-            self.term_streams_with_segment.push(head);
+            self.current_streamers.push(head);
            while let Some(next_streamer) = self.heap.peek() {
-                if self.term_streams_with_segment[0].terms.key() != next_streamer.terms.key() {
+                if self.current_streamers[0].streamer.key() != next_streamer.streamer.key() {
                    break;
                }
                let next_heap_it = self.heap.pop().unwrap(); // safe : we peeked beforehand
-                self.term_streams_with_segment.push(next_heap_it);
+                self.current_streamers.push(next_heap_it);
            }
            true
        } else {
@@ -95,6 +101,6 @@ impl<'a> TermMerger<'a> {
    /// if and only if advance() has been called before
    /// and "true" was returned.
    pub fn key(&self) -> &[u8] {
-        self.term_streams_with_segment[0].terms.key()
+        self.current_streamers[0].streamer.key()
    }
 }
--- a/columnar/src/columnar/merge/tests.rs
+++ b/columnar/src/columnar/merge/tests.rs
@@ -1,10 +1,7 @@
 use itertools::Itertools;
-use proptest::collection::vec;
-use proptest::prelude::*;

 use super::*;
-use crate::columnar::{merge_columnar, ColumnarReader, MergeRowOrder, StackMergeOrder};
-use crate::{Cardinality, ColumnarWriter, DynamicColumn, HasAssociatedColumnType, RowId};
+use crate::{Cardinality, ColumnarWriter, HasAssociatedColumnType, RowId};

 fn make_columnar<T: Into<NumericalValue> + HasAssociatedColumnType + Copy>(
    column_name: &str,
@@ -29,8 +26,9 @@ fn test_column_coercion_to_u64() {
    // u64 type
    let columnar2 = make_columnar("numbers", &[u64::MAX]);
    let columnars = &[&columnar1, &columnar2];
+    let merge_order = StackMergeOrder::stack(columnars).into();
    let column_map: BTreeMap<(String, ColumnTypeCategory), GroupedColumnsHandle> =
-        group_columns_for_merge(columnars, &[]).unwrap();
+        group_columns_for_merge(columnars, &[], &merge_order).unwrap();
    assert_eq!(column_map.len(), 1);
    assert!(column_map.contains_key(&("numbers".to_string(), ColumnTypeCategory::Numerical)));
 }
@@ -40,8 +38,9 @@ fn test_column_coercion_to_i64() {
    let columnar1 = make_columnar("numbers", &[-1i64]);
    let columnar2 = make_columnar("numbers", &[2u64]);
    let columnars = &[&columnar1, &columnar2];
+    let merge_order = StackMergeOrder::stack(columnars).into();
    let column_map: BTreeMap<(String, ColumnTypeCategory), GroupedColumnsHandle> =
-        group_columns_for_merge(columnars, &[]).unwrap();
+        group_columns_for_merge(columnars, &[], &merge_order).unwrap();
    assert_eq!(column_map.len(), 1);
    assert!(column_map.contains_key(&("numbers".to_string(), ColumnTypeCategory::Numerical)));
 }
@@ -64,8 +63,14 @@ fn test_group_columns_with_required_column() {
    let columnar1 = make_columnar("numbers", &[1i64]);
    let columnar2 = make_columnar("numbers", &[2u64]);
    let columnars = &[&columnar1, &columnar2];
+    let merge_order = StackMergeOrder::stack(columnars).into();
    let column_map: BTreeMap<(String, ColumnTypeCategory), GroupedColumnsHandle> =
-        group_columns_for_merge(columnars, &[("numbers".to_string(), ColumnType::U64)]).unwrap();
+        group_columns_for_merge(
+            &[&columnar1, &columnar2],
+            &[("numbers".to_string(), ColumnType::U64)],
+            &merge_order,
+        )
+        .unwrap();
    assert_eq!(column_map.len(), 1);
    assert!(column_map.contains_key(&("numbers".to_string(), ColumnTypeCategory::Numerical)));
 }
@@ -75,9 +80,13 @@ fn test_group_columns_required_column_with_no_existing_columns() {
    let columnar1 = make_columnar("numbers", &[2u64]);
    let columnar2 = make_columnar("numbers", &[2u64]);
    let columnars = &[&columnar1, &columnar2];
-    let column_map: BTreeMap<_, _> =
-        group_columns_for_merge(columnars, &[("required_col".to_string(), ColumnType::Str)])
-            .unwrap();
+    let merge_order = StackMergeOrder::stack(columnars).into();
+    let column_map: BTreeMap<_, _> = group_columns_for_merge(
+        columnars,
+        &[("required_col".to_string(), ColumnType::Str)],
+        &merge_order,
+    )
+    .unwrap();
    assert_eq!(column_map.len(), 2);
    let columns = &column_map
        .get(&("required_col".to_string(), ColumnTypeCategory::Str))
@@ -93,8 +102,14 @@ fn test_group_columns_required_column_is_above_all_columns_have_the_same_type_ru
    let columnar1 = make_columnar("numbers", &[2i64]);
    let columnar2 = make_columnar("numbers", &[2i64]);
    let columnars = &[&columnar1, &columnar2];
+    let merge_order = StackMergeOrder::stack(columnars).into();
    let column_map: BTreeMap<(String, ColumnTypeCategory), GroupedColumnsHandle> =
-        group_columns_for_merge(columnars, &[("numbers".to_string(), ColumnType::U64)]).unwrap();
+        group_columns_for_merge(
+            columnars,
+            &[("numbers".to_string(), ColumnType::U64)],
+            &merge_order,
+        )
+        .unwrap();
    assert_eq!(column_map.len(), 1);
    assert!(column_map.contains_key(&("numbers".to_string(), ColumnTypeCategory::Numerical)));
 }
@@ -104,8 +119,9 @@ fn test_missing_column() {
    let columnar1 = make_columnar("numbers", &[-1i64]);
    let columnar2 = make_columnar("numbers2", &[2u64]);
    let columnars = &[&columnar1, &columnar2];
+    let merge_order = StackMergeOrder::stack(columnars).into();
    let column_map: BTreeMap<(String, ColumnTypeCategory), GroupedColumnsHandle> =
-        group_columns_for_merge(columnars, &[]).unwrap();
+        group_columns_for_merge(columnars, &[], &merge_order).unwrap();
    assert_eq!(column_map.len(), 2);
    assert!(column_map.contains_key(&("numbers".to_string(), ColumnTypeCategory::Numerical)));
    {
@@ -208,7 +224,7 @@ fn test_merge_columnar_numbers() {
    )
    .unwrap();
    let columnar_reader = ColumnarReader::open(buffer).unwrap();
-    assert_eq!(columnar_reader.num_docs(), 3);
+    assert_eq!(columnar_reader.num_rows(), 3);
    assert_eq!(columnar_reader.num_columns(), 1);
    let cols = columnar_reader.read_columns("numbers").unwrap();
    let dynamic_column = cols[0].open().unwrap();
@@ -236,7 +252,7 @@ fn test_merge_columnar_texts() {
    )
    .unwrap();
    let columnar_reader = ColumnarReader::open(buffer).unwrap();
-    assert_eq!(columnar_reader.num_docs(), 3);
+    assert_eq!(columnar_reader.num_rows(), 3);
    assert_eq!(columnar_reader.num_columns(), 1);
    let cols = columnar_reader.read_columns("texts").unwrap();
    let dynamic_column = cols[0].open().unwrap();
@@ -285,7 +301,7 @@ fn test_merge_columnar_byte() {
    )
    .unwrap();
    let columnar_reader = ColumnarReader::open(buffer).unwrap();
-    assert_eq!(columnar_reader.num_docs(), 4);
+    assert_eq!(columnar_reader.num_rows(), 4);
    assert_eq!(columnar_reader.num_columns(), 1);
    let cols = columnar_reader.read_columns("bytes").unwrap();
    let dynamic_column = cols[0].open().unwrap();
@@ -341,7 +357,7 @@ fn test_merge_columnar_byte_with_missing() {
    )
    .unwrap();
    let columnar_reader = ColumnarReader::open(buffer).unwrap();
-    assert_eq!(columnar_reader.num_docs(), 3 + 2 + 3);
+    assert_eq!(columnar_reader.num_rows(), 3 + 2 + 3);
    assert_eq!(columnar_reader.num_columns(), 2);
    let cols = columnar_reader.read_columns("col").unwrap();
    let dynamic_column = cols[0].open().unwrap();
@@ -393,7 +409,7 @@ fn test_merge_columnar_different_types() {
    )
    .unwrap();
    let columnar_reader = ColumnarReader::open(buffer).unwrap();
-    assert_eq!(columnar_reader.num_docs(), 4);
+    assert_eq!(columnar_reader.num_rows(), 4);
    assert_eq!(columnar_reader.num_columns(), 2);
    let cols = columnar_reader.read_columns("mixed").unwrap();

@@ -403,11 +419,11 @@ fn test_merge_columnar_different_types() {
        panic!()
    };
    assert_eq!(vals.get_cardinality(), Cardinality::Optional);
-    assert_eq!(vals.values_for_doc(0).collect_vec(), Vec::<i64>::new());
-    assert_eq!(vals.values_for_doc(1).collect_vec(), Vec::<i64>::new());
-    assert_eq!(vals.values_for_doc(2).collect_vec(), Vec::<i64>::new());
+    assert_eq!(vals.values_for_doc(0).collect_vec(), vec![]);
+    assert_eq!(vals.values_for_doc(1).collect_vec(), vec![]);
+    assert_eq!(vals.values_for_doc(2).collect_vec(), vec![]);
    assert_eq!(vals.values_for_doc(3).collect_vec(), vec![1]);
-    assert_eq!(vals.values_for_doc(4).collect_vec(), Vec::<i64>::new());
+    assert_eq!(vals.values_for_doc(4).collect_vec(), vec![]);

    // text column
    let dynamic_column = cols[1].open().unwrap();
@@ -458,7 +474,7 @@ fn test_merge_columnar_different_empty_cardinality() {
    )
    .unwrap();
    let columnar_reader = ColumnarReader::open(buffer).unwrap();
-    assert_eq!(columnar_reader.num_docs(), 2);
+    assert_eq!(columnar_reader.num_rows(), 2);
    assert_eq!(columnar_reader.num_columns(), 2);
    let cols = columnar_reader.read_columns("mixed").unwrap();

@@ -470,119 +486,3 @@ fn test_merge_columnar_different_empty_cardinality() {
    let dynamic_column = cols[1].open().unwrap();
    assert_eq!(dynamic_column.get_cardinality(), Cardinality::Optional);
 }
-
-#[derive(Debug, Clone)]
-struct ColumnSpec {
-    column_name: String,
-    /// (row_id, term)
-    terms: Vec<(RowId, Vec<u8>)>,
-}
-
-#[derive(Clone, Debug)]
-struct ColumnarSpec {
-    columns: Vec<ColumnSpec>,
-}
-
-/// Generate a random (row_id, term) pair:
-///  - row_id in [0..10]
-///  - term is either from POSSIBLE_TERMS or random bytes
-fn rowid_and_term_strategy() -> impl Strategy<Value = (RowId, Vec<u8>)> {
-    const POSSIBLE_TERMS: &[&[u8]] = &[b"a", b"b", b"allo"];
-
-    let term_strat = prop_oneof![
-        // pick from the fixed list
-        (0..POSSIBLE_TERMS.len()).prop_map(|i| POSSIBLE_TERMS[i].to_vec()),
-        // or random bytes (length 0..10)
-        prop::collection::vec(any::<u8>(), 0..10),
-    ];
-
-    (0u32..11, term_strat)
-}
-
-/// Generate one ColumnSpec, with a random name and a random list of (row_id, term).
-/// We sort it by row_id so that data is in ascending order.
-fn column_spec_strategy() -> impl Strategy<Value = ColumnSpec> {
-    let column_name = prop_oneof![
-        Just("col".to_string()),
-        Just("col2".to_string()),
-        "col.*".prop_map(|s| s),
-    ];
-
-    // We'll produce 0..8 (rowid,term) entries for this column
-    let data_strat = vec(rowid_and_term_strategy(), 0..8).prop_map(|mut pairs| {
-        // Sort by row_id
-        pairs.sort_by_key(|(row_id, _)| *row_id);
-        pairs
-    });
-
-    (column_name, data_strat).prop_map(|(name, data)| ColumnSpec {
-        column_name: name,
-        terms: data,
-    })
-}
-
-/// Strategy to generate an ColumnarSpec
-fn columnar_strategy() -> impl Strategy<Value = ColumnarSpec> {
-    vec(column_spec_strategy(), 0..3).prop_map(|columns| ColumnarSpec { columns })
-}
-
-/// Strategy to generate multiple ColumnarSpecs, each of which we will treat
-/// as one "columnar" to be merged together.
-fn columnars_strategy() -> impl Strategy<Value = Vec<ColumnarSpec>> {
-    vec(columnar_strategy(), 1..4)
-}
-
-/// Build a `ColumnarReader` from a `ColumnarSpec`
-fn build_columnar(spec: &ColumnarSpec) -> ColumnarReader {
-    let mut writer = ColumnarWriter::default();
-    let mut max_row_id = 0;
-    for col in &spec.columns {
-        for &(row_id, ref term) in &col.terms {
-            writer.record_bytes(row_id, &col.column_name, term);
-            max_row_id = max_row_id.max(row_id);
-        }
-    }
-
-    let mut buffer = Vec::new();
-    writer.serialize(max_row_id + 1, &mut buffer).unwrap();
-    ColumnarReader::open(buffer).unwrap()
-}
-
-proptest! {
-    // We just test that the merge_columnar function doesn't crash.
-    #![proptest_config(ProptestConfig::with_cases(256))]
-    #[test]
-    fn test_merge_columnar_bytes_no_crash(columnars in columnars_strategy(), second_merge_columnars in columnars_strategy()) {
-        let columnars: Vec<ColumnarReader> = columnars.iter()
-            .map(build_columnar)
-            .collect();
-
-        let mut out = Vec::new();
-        let columnar_refs: Vec<&ColumnarReader> = columnars.iter().collect();
-        let stack_merge_order = StackMergeOrder::stack(&columnar_refs);
-        merge_columnar(
-            &columnar_refs,
-            &[],
-            MergeRowOrder::Stack(stack_merge_order),
-            &mut out,
-        ).unwrap();
-
-        let merged_reader = ColumnarReader::open(out).unwrap();
-
-        // Merge the second set of columnars with the result of the first merge
-        let mut columnars: Vec<ColumnarReader> = second_merge_columnars.iter()
-            .map(build_columnar)
-            .collect();
-        columnars.push(merged_reader);
-        let mut out = Vec::new();
-        let columnar_refs: Vec<&ColumnarReader> = columnars.iter().collect();
-        let stack_merge_order = StackMergeOrder::stack(&columnar_refs);
-        merge_columnar(
-            &columnar_refs,
-            &[],
-            MergeRowOrder::Stack(stack_merge_order),
-            &mut out,
-        ).unwrap();
-
-    }
-}
--- a/columnar/src/columnar/reader/mod.rs
+++ b/columnar/src/columnar/reader/mod.rs
@@ -19,13 +19,13 @@ fn io_invalid_data(msg: String) -> io::Error {
 pub struct ColumnarReader {
    column_dictionary: Dictionary<RangeSSTable>,
    column_data: FileSlice,
-    num_docs: RowId,
+    num_rows: RowId,
    format_version: Version,
 }

 impl fmt::Debug for ColumnarReader {
    fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
-        let num_rows = self.num_docs();
+        let num_rows = self.num_rows();
        let columns = self.list_columns().unwrap();
        let num_cols = columns.len();
        let mut debug_struct = f.debug_struct("Columnar");
@@ -112,13 +112,13 @@ impl ColumnarReader {
        Ok(ColumnarReader {
            column_dictionary,
            column_data,
-            num_docs: num_rows,
+            num_rows,
            format_version,
        })
    }

-    pub fn num_docs(&self) -> RowId {
-        self.num_docs
+    pub fn num_rows(&self) -> RowId {
+        self.num_rows
    }
    // Iterate over the columns in a sorted way
    pub fn iter_columns(
--- a/columnar/src/tests.rs
+++ b/columnar/src/tests.rs
@@ -380,7 +380,7 @@ fn assert_columnar_eq(
    right: &ColumnarReader,
    lenient_on_numerical_value: bool,
 ) {
-    assert_eq!(left.num_docs(), right.num_docs());
+    assert_eq!(left.num_rows(), right.num_rows());
    let left_columns = left.list_columns().unwrap();
    let right_columns = right.list_columns().unwrap();
    assert_eq!(left_columns.len(), right_columns.len());
@@ -588,7 +588,7 @@ proptest! {
    #[test]
    fn test_single_columnar_builder_proptest(docs in columnar_docs_strategy()) {
        let columnar = build_columnar(&docs[..]);
-        assert_eq!(columnar.num_docs() as usize, docs.len());
+        assert_eq!(columnar.num_rows() as usize, docs.len());
        let mut expected_columns: HashMap<(&str, ColumnTypeCategory), HashMap<u32, Vec<&ColumnValue>> > = Default::default();
        for (doc_id, doc_vals) in docs.iter().enumerate() {
            for (col_name, col_val) in doc_vals {
@@ -715,7 +715,6 @@ fn test_columnar_merging_number_columns() {
 // TODO test required_columns
 // TODO document edge case: required_columns incompatible with values.

-#[allow(clippy::type_complexity)]
 fn columnar_docs_and_remap(
 ) -> impl Strategy<Value = (Vec<Vec<Vec<(&'static str, ColumnValue)>>>, Vec<RowAddr>)> {
    proptest::collection::vec(columnar_docs_strategy(), 2..=3).prop_flat_map(
@@ -820,7 +819,7 @@ fn test_columnar_merge_empty() {
    )
    .unwrap();
    let merged_columnar = ColumnarReader::open(output).unwrap();
-    assert_eq!(merged_columnar.num_docs(), 0);
+    assert_eq!(merged_columnar.num_rows(), 0);
    assert_eq!(merged_columnar.num_columns(), 0);
 }

@@ -846,7 +845,7 @@ fn test_columnar_merge_single_str_column() {
    )
    .unwrap();
    let merged_columnar = ColumnarReader::open(output).unwrap();
-    assert_eq!(merged_columnar.num_docs(), 1);
+    assert_eq!(merged_columnar.num_rows(), 1);
    assert_eq!(merged_columnar.num_columns(), 1);
 }

@@ -878,7 +877,7 @@ fn test_delete_decrease_cardinality() {
    )
    .unwrap();
    let merged_columnar = ColumnarReader::open(output).unwrap();
-    assert_eq!(merged_columnar.num_docs(), 1);
+    assert_eq!(merged_columnar.num_rows(), 1);
    assert_eq!(merged_columnar.num_columns(), 1);
    let cols = merged_columnar.read_columns("c").unwrap();
    assert_eq!(cols.len(), 1);
--- a/common/Cargo.toml
+++ b/common/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy-common"
-version = "0.9.0"
+version = "0.7.0"
 authors = ["Paul Masurel <paul@quickwit.io>", "Pascal Seitz <pascal@quickwit.io>"]
 license = "MIT"
 edition = "2021"
@@ -13,7 +13,7 @@ repository = "https://github.com/quickwit-oss/tantivy"

 [dependencies]
 byteorder = "1.4.3"
-ownedbytes = { version= "0.9", path="../ownedbytes" }
+ownedbytes = { version= "0.7", path="../ownedbytes" }
 async-trait = "0.1"
 time = { version = "0.3.10", features = ["serde-well-known"] }
 serde = { version = "1.0.136", features = ["derive"] }
--- a/ownedbytes/Cargo.toml
+++ b/ownedbytes/Cargo.toml
@@ -1,7 +1,7 @@
 [package]
 authors = ["Paul Masurel <paul@quickwit.io>", "Pascal Seitz <pascal@quickwit.io>"]
 name = "ownedbytes"
-version = "0.9.0"
+version = "0.7.0"
 edition = "2021"
 description = "Expose data as static slice"
 license = "MIT"
--- a/query-grammar/Cargo.toml
+++ b/query-grammar/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy-query-grammar"
-version = "0.24.0"
+version = "0.22.0"
 authors = ["Paul Masurel <paul.masurel@gmail.com>"]
 license = "MIT"
 categories = ["database-implementations", "data-structures"]
@@ -13,5 +13,3 @@ edition = "2021"

 [dependencies]
 nom = "7"
-serde = { version = "1.0.219", features = ["derive"] }
-serde_json = "1.0.140"
--- a/query-grammar/src/infallible.rs
+++ b/query-grammar/src/infallible.rs
@@ -3,7 +3,6 @@
 use std::convert::Infallible;

 use nom::{AsChar, IResult, InputLength, InputTakeAtPosition};
-use serde::Serialize;

 pub(crate) type ErrorList = Vec<LenientErrorInternal>;
 pub(crate) type JResult<I, O> = IResult<I, (O, ErrorList), Infallible>;
@@ -16,8 +15,7 @@ pub(crate) struct LenientErrorInternal {
 }

 /// A recoverable error and the position it happened at
-#[derive(Debug, PartialEq, Serialize)]
-#[serde(rename_all = "snake_case")]
+#[derive(Debug, PartialEq)]
 pub struct LenientError {
    pub pos: usize,
    pub message: String,
@@ -355,21 +353,3 @@ where
 {
    move |i: I| l.choice(i.clone()).unwrap_or_else(|| default.parse(i))
 }
-
-#[cfg(test)]
-mod tests {
-    use super::*;
-
-    #[test]
-    fn test_lenient_error_serialization() {
-        let error = LenientError {
-            pos: 42,
-            message: "test error message".to_string(),
-        };
-
-        assert_eq!(
-            serde_json::to_string(&error).unwrap(),
-            "{\"pos\":42,\"message\":\"test error message\"}"
-        );
-    }
-}
--- a/query-grammar/src/lib.rs
+++ b/query-grammar/src/lib.rs
@@ -1,7 +1,5 @@
 #![allow(clippy::derive_partial_eq_without_eq)]

-use serde::Serialize;
-
 mod infallible;
 mod occur;
 mod query_grammar;
@@ -14,8 +12,6 @@ pub use crate::user_input_ast::{
    Delimiter, UserInputAst, UserInputBound, UserInputLeaf, UserInputLiteral,
 };

-#[derive(Debug, Serialize)]
-#[serde(rename_all = "snake_case")]
 pub struct Error;

 /// Parse a query
@@ -28,31 +24,3 @@ pub fn parse_query(query: &str) -> Result<UserInputAst, Error> {
 pub fn parse_query_lenient(query: &str) -> (UserInputAst, Vec<LenientError>) {
    parse_to_ast_lenient(query)
 }
-
-#[cfg(test)]
-mod tests {
-    use crate::{parse_query, parse_query_lenient};
-
-    #[test]
-    fn test_parse_query_serialization() {
-        let ast = parse_query("title:hello OR title:x").unwrap();
-        let json = serde_json::to_string(&ast).unwrap();
-        assert_eq!(
-            json,
-            r#"{"type":"bool","clauses":[["should",{"type":"literal","field_name":"title","phrase":"hello","delimiter":"none","slop":0,"prefix":false}],["should",{"type":"literal","field_name":"title","phrase":"x","delimiter":"none","slop":0,"prefix":false}]]}"#
-        );
-    }
-
-    #[test]
-    fn test_parse_query_wrong_query() {
-        assert!(parse_query("title:").is_err());
-    }
-
-    #[test]
-    fn test_parse_query_lenient_wrong_query() {
-        let (_, errors) = parse_query_lenient("title:");
-        assert!(errors.len() == 1);
-        let json = serde_json::to_string(&errors).unwrap();
-        assert_eq!(json, r#"[{"pos":6,"message":"expected word"}]"#);
-    }
-}
--- a/query-grammar/src/occur.rs
+++ b/query-grammar/src/occur.rs
@@ -1,12 +1,9 @@
 use std::fmt;
 use std::fmt::Write;

-use serde::Serialize;
-
 /// Defines whether a term in a query must be present,
 /// should be present or must not be present.
-#[derive(Debug, Clone, Hash, Copy, Eq, PartialEq, Serialize)]
-#[serde(rename_all = "snake_case")]
+#[derive(Debug, Clone, Hash, Copy, Eq, PartialEq)]
 pub enum Occur {
    /// For a given document to be considered for scoring,
    /// at least one of the queries with the Should or the Must
--- a/query-grammar/src/user_input_ast.rs
+++ b/query-grammar/src/user_input_ast.rs
@@ -1,13 +1,9 @@
 use std::fmt;
 use std::fmt::{Debug, Formatter};

-use serde::Serialize;
-
 use crate::Occur;

-#[derive(PartialEq, Clone, Serialize)]
-#[serde(tag = "type")]
-#[serde(rename_all = "snake_case")]
+#[derive(PartialEq, Clone)]
 pub enum UserInputLeaf {
    Literal(UserInputLiteral),
    All,
@@ -111,16 +107,14 @@ impl Debug for UserInputLeaf {
    }
 }

-#[derive(Copy, Clone, Eq, PartialEq, Debug, Serialize)]
-#[serde(rename_all = "snake_case")]
+#[derive(Copy, Clone, Eq, PartialEq, Debug)]
 pub enum Delimiter {
    SingleQuotes,
    DoubleQuotes,
    None,
 }

-#[derive(PartialEq, Clone, Serialize)]
-#[serde(rename_all = "snake_case")]
+#[derive(PartialEq, Clone)]
 pub struct UserInputLiteral {
    pub field_name: Option<String>,
    pub phrase: String,
@@ -158,9 +152,7 @@ impl fmt::Debug for UserInputLiteral {
    }
 }

-#[derive(PartialEq, Debug, Clone, Serialize)]
-#[serde(tag = "type", content = "value")]
-#[serde(rename_all = "snake_case")]
+#[derive(PartialEq, Debug, Clone)]
 pub enum UserInputBound {
    Inclusive(String),
    Exclusive(String),
@@ -195,38 +187,11 @@ impl UserInputBound {
    }
 }

-#[derive(PartialEq, Clone, Serialize)]
-#[serde(into = "UserInputAstSerde")]
+#[derive(PartialEq, Clone)]
 pub enum UserInputAst {
    Clause(Vec<(Option<Occur>, UserInputAst)>),
+    Leaf(Box<UserInputLeaf>),
    Boost(Box<UserInputAst>, f64),
-    Leaf(Box<UserInputLeaf>),
-}
-
-#[derive(Serialize)]
-#[serde(tag = "type", rename_all = "snake_case")]
-enum UserInputAstSerde {
-    Bool {
-        clauses: Vec<(Option<Occur>, UserInputAst)>,
-    },
-    Boost {
-        underlying: Box<UserInputAst>,
-        boost: f64,
-    },
-    #[serde(untagged)]
-    Leaf(Box<UserInputLeaf>),
-}
-
-impl From<UserInputAst> for UserInputAstSerde {
-    fn from(ast: UserInputAst) -> Self {
-        match ast {
-            UserInputAst::Clause(clause) => UserInputAstSerde::Bool { clauses: clause },
-            UserInputAst::Boost(underlying, boost) => {
-                UserInputAstSerde::Boost { underlying, boost }
-            }
-            UserInputAst::Leaf(leaf) => UserInputAstSerde::Leaf(leaf),
-        }
-    }
 }

 impl UserInputAst {
@@ -320,126 +285,3 @@ impl fmt::Debug for UserInputAst {
        }
    }
 }
-
-#[cfg(test)]
-mod tests {
-    use super::*;
-
-    #[test]
-    fn test_all_leaf_serialization() {
-        let ast = UserInputAst::Leaf(Box::new(UserInputLeaf::All));
-        let json = serde_json::to_string(&ast).unwrap();
-        assert_eq!(json, r#"{"type":"all"}"#);
-    }
-
-    #[test]
-    fn test_literal_leaf_serialization() {
-        let literal = UserInputLiteral {
-            field_name: Some("title".to_string()),
-            phrase: "hello".to_string(),
-            delimiter: Delimiter::None,
-            slop: 0,
-            prefix: false,
-        };
-        let ast = UserInputAst::Leaf(Box::new(UserInputLeaf::Literal(literal)));
-        let json = serde_json::to_string(&ast).unwrap();
-        assert_eq!(
-            json,
-            r#"{"type":"literal","field_name":"title","phrase":"hello","delimiter":"none","slop":0,"prefix":false}"#
-        );
-    }
-
-    #[test]
-    fn test_range_leaf_serialization() {
-        let range = UserInputLeaf::Range {
-            field: Some("price".to_string()),
-            lower: UserInputBound::Inclusive("10".to_string()),
-            upper: UserInputBound::Exclusive("100".to_string()),
-        };
-        let ast = UserInputAst::Leaf(Box::new(range));
-        let json = serde_json::to_string(&ast).unwrap();
-        assert_eq!(
-            json,
-            r#"{"type":"range","field":"price","lower":{"type":"inclusive","value":"10"},"upper":{"type":"exclusive","value":"100"}}"#
-        );
-    }
-
-    #[test]
-    fn test_range_leaf_unbounded_serialization() {
-        let range = UserInputLeaf::Range {
-            field: Some("price".to_string()),
-            lower: UserInputBound::Inclusive("10".to_string()),
-            upper: UserInputBound::Unbounded,
-        };
-        let ast = UserInputAst::Leaf(Box::new(range));
-        let json = serde_json::to_string(&ast).unwrap();
-        assert_eq!(
-            json,
-            r#"{"type":"range","field":"price","lower":{"type":"inclusive","value":"10"},"upper":{"type":"unbounded"}}"#
-        );
-    }
-
-    #[test]
-    fn test_boost_serialization() {
-        let inner_ast = UserInputAst::Leaf(Box::new(UserInputLeaf::All));
-        let boost_ast = UserInputAst::Boost(Box::new(inner_ast), 2.5);
-        let json = serde_json::to_string(&boost_ast).unwrap();
-        assert_eq!(
-            json,
-            r#"{"type":"boost","underlying":{"type":"all"},"boost":2.5}"#
-        );
-    }
-
-    #[test]
-    fn test_boost_serialization2() {
-        let boost_ast = UserInputAst::Boost(
-            Box::new(UserInputAst::Clause(vec![
-                (
-                    Some(Occur::Must),
-                    UserInputAst::Leaf(Box::new(UserInputLeaf::All)),
-                ),
-                (
-                    Some(Occur::Should),
-                    UserInputAst::Leaf(Box::new(UserInputLeaf::Literal(UserInputLiteral {
-                        field_name: Some("title".to_string()),
-                        phrase: "hello".to_string(),
-                        delimiter: Delimiter::None,
-                        slop: 0,
-                        prefix: false,
-                    }))),
-                ),
-            ])),
-            2.5,
-        );
-        let json = serde_json::to_string(&boost_ast).unwrap();
-        assert_eq!(
-            json,
-            r#"{"type":"boost","underlying":{"type":"bool","clauses":[["must",{"type":"all"}],["should",{"type":"literal","field_name":"title","phrase":"hello","delimiter":"none","slop":0,"prefix":false}]]},"boost":2.5}"#
-        );
-    }
-
-    #[test]
-    fn test_clause_serialization() {
-        let clause = UserInputAst::Clause(vec![
-            (
-                Some(Occur::Must),
-                UserInputAst::Leaf(Box::new(UserInputLeaf::All)),
-            ),
-            (
-                Some(Occur::Should),
-                UserInputAst::Leaf(Box::new(UserInputLeaf::Literal(UserInputLiteral {
-                    field_name: Some("title".to_string()),
-                    phrase: "hello".to_string(),
-                    delimiter: Delimiter::None,
-                    slop: 0,
-                    prefix: false,
-                }))),
-            ),
-        ]);
-        let json = serde_json::to_string(&clause).unwrap();
-        assert_eq!(
-            json,
-            r#"{"type":"bool","clauses":[["must",{"type":"all"}],["should",{"type":"literal","field_name":"title","phrase":"hello","delimiter":"none","slop":0,"prefix":false}]]}"#
-        );
-    }
-}
--- a/src/aggregation/agg_result.rs
+++ b/src/aggregation/agg_result.rs
@@ -125,9 +125,26 @@ impl MetricResult {
 }

 /// BucketEntry holds bucket aggregation result types.
+// the order of fields is important to deserialize properly
+// Terms must be first because all Terms are valid Range (we ignore unknown fields)
+// Range and Histogram are always ambiguous, they contain the same 3 required fields, and all else
+// is optional Having Range is usually more useful (contains more fields, missing field from
+// Histogram can be obtained by key.to_string())
 #[derive(Clone, Debug, PartialEq, Serialize, Deserialize)]
 #[serde(untagged)]
 pub enum BucketResult {
+    /// This is the term result
+    Terms {
+        /// The buckets.
+        ///
+        /// See [`TermsAggregation`](super::bucket::TermsAggregation)
+        buckets: Vec<BucketEntry>,
+        /// The number of documents that didn’t make it into to TOP N due to shard_size or size
+        sum_other_doc_count: u64,
+        #[serde(skip_serializing_if = "Option::is_none")]
+        /// The upper bound error for the doc count of each term.
+        doc_count_error_upper_bound: Option<u64>,
+    },
    /// This is the range entry for a bucket, which contains a key, count, from, to, and optionally
    /// sub-aggregations.
    Range {
@@ -144,18 +161,6 @@ pub enum BucketResult {
        /// See [`HistogramAggregation`](super::bucket::HistogramAggregation)
        buckets: BucketEntries<BucketEntry>,
    },
-    /// This is the term result
-    Terms {
-        /// The buckets.
-        ///
-        /// See [`TermsAggregation`](super::bucket::TermsAggregation)
-        buckets: Vec<BucketEntry>,
-        /// The number of documents that didn’t make it into to TOP N due to shard_size or size
-        sum_other_doc_count: u64,
-        #[serde(skip_serializing_if = "Option::is_none")]
-        /// The upper bound error for the doc count of each term.
-        doc_count_error_upper_bound: Option<u64>,
-    },
 }

 impl BucketResult {
--- a/src/aggregation/mod.rs
+++ b/src/aggregation/mod.rs
@@ -366,12 +366,8 @@ impl PartialEq for Key {
    fn eq(&self, other: &Self) -> bool {
        match (self, other) {
            (Self::Str(l), Self::Str(r)) => l == r,
-            (Self::F64(l), Self::F64(r)) => l.to_bits() == r.to_bits(),
-            (Self::I64(l), Self::I64(r)) => l == r,
-            (Self::U64(l), Self::U64(r)) => l == r,
-            // we list all variant of left operand to make sure this gets updated when we add
-            // variants to the enum
-            (Self::Str(_) | Self::F64(_) | Self::I64(_) | Self::U64(_), _) => false,
+            (Self::F64(l), Self::F64(r)) => l == r,
+            _ => false,
        }
    }
 }
--- a/src/core/executor.rs
+++ b/src/core/executor.rs
@@ -41,12 +41,16 @@ impl Executor {
    ///
    /// Regardless of the executor (`SingleThread` or `ThreadPool`), panics in the task
    /// will propagate to the caller.
-    pub fn map<A, R, F>(&self, f: F, args: impl Iterator<Item = A>) -> crate::Result<Vec<R>>
-    where
+    pub fn map<
        A: Send,
        R: Send,
+        AIterator: Iterator<Item = A>,
        F: Sized + Sync + Fn(A) -> crate::Result<R>,
-    {
+    >(
+        &self,
+        f: F,
+        args: AIterator,
+    ) -> crate::Result<Vec<R>> {
        match self {
            Executor::SingleThread => args.map(f).collect::<crate::Result<_>>(),
            Executor::ThreadPool(pool) => {
--- a/src/fastfield/mod.rs
+++ b/src/fastfield/mod.rs
@@ -942,7 +942,7 @@ mod tests {

        let numbers = [100, 200, 300];
        let test_range = |range: RangeInclusive<u64>| {
-            let expected_count = numbers.iter().filter(|num| range.contains(*num)).count();
+            let expected_count = numbers.iter().filter(|num| range.contains(num)).count();
            let mut vec = vec![];
            field.get_row_ids_for_value_range(range, 0..u32::MAX, &mut vec);
            assert_eq!(vec.len(), expected_count);
@@ -1020,7 +1020,7 @@ mod tests {

        let numbers = [1000, 1001, 1003];
        let test_range = |range: RangeInclusive<u64>| {
-            let expected_count = numbers.iter().filter(|num| range.contains(*num)).count();
+            let expected_count = numbers.iter().filter(|num| range.contains(num)).count();
            let mut vec = vec![];
            field.get_row_ids_for_value_range(range, 0..u32::MAX, &mut vec);
            assert_eq!(vec.len(), expected_count);
--- a/src/indexer/index_writer.rs
+++ b/src/indexer/index_writer.rs
@@ -2553,7 +2553,7 @@ mod tests {
    #[test]
    fn test_writer_options_validation() {
        let mut schema_builder = Schema::builder();
-        let _field = schema_builder.add_bool_field("example", STORED);
+        let field = schema_builder.add_bool_field("example", STORED);
        let index = Index::create_in_ram(schema_builder.build());

        let opt_wo_threads = IndexWriterOptions::builder().num_worker_threads(0).build();
--- a/src/indexer/segment_updater.rs
+++ b/src/indexer/segment_updater.rs
@@ -1,4 +1,3 @@
-use std::any::Any;
 use std::borrow::BorrowMut;
 use std::collections::HashSet;
 use std::io::Write;
@@ -24,9 +23,7 @@ use crate::indexer::{
    DefaultMergePolicy, MergeCandidate, MergeOperation, MergePolicy, SegmentEntry,
    SegmentSerializer,
 };
-use crate::{FutureResult, Opstamp, TantivyError};
-
-const PANIC_CAUGHT: &str = "Panic caught in merge thread";
+use crate::{FutureResult, Opstamp};

 /// Save the index meta file.
 /// This operation is atomic:
@@ -290,15 +287,6 @@ impl SegmentUpdater {
        let merge_thread_pool = ThreadPoolBuilder::new()
            .thread_name(|i| format!("merge_thread_{i}"))
            .num_threads(num_merge_threads)
-            .panic_handler(move |panic| {
-                // We don't print the panic content itself,
-                // it is already printed during the unwinding
-                if let Some(message) = panic.downcast_ref::<&str>() {
-                    if *message != PANIC_CAUGHT {
-                        error!("uncaught merge panic")
-                    }
-                }
-            })
            .build()
            .map_err(|_| {
                crate::TantivyError::SystemError(
@@ -518,34 +506,11 @@ impl SegmentUpdater {
            // Its lifetime is used to track how many merging thread are currently running,
            // as well as which segment is currently in merge and therefore should not be
            // candidate for another merge.
-            let merge_panic_res = std::panic::catch_unwind(std::panic::AssertUnwindSafe(|| {
-                merge(
-                    &segment_updater.index,
-                    segment_entries,
-                    merge_operation.target_opstamp(),
-                )
-            }));
-            let merge_res = match merge_panic_res {
-                Ok(merge_res) => merge_res,
-                Err(panic_err) => {
-                    let panic_str = if let Some(msg) = panic_err.downcast_ref::<&str>() {
-                        *msg
-                    } else if let Some(msg) = panic_err.downcast_ref::<String>() {
-                        msg.as_str()
-                    } else {
-                        "UNKNOWN"
-                    };
-                    let _send_result = merging_future_send.send(Err(TantivyError::SystemError(
-                        format!("Merge thread panicked: {panic_str}"),
-                    )));
-                    // Resume unwinding because we forced unwind safety with
-                    // `std::panic::AssertUnwindSafe` Use a specific message so
-                    // the panic_handler can double check that we properly caught the panic.
-                    let boxed_panic_message: Box<dyn Any + Send> = Box::new(PANIC_CAUGHT);
-                    std::panic::resume_unwind(boxed_panic_message);
-                }
-            };
-            match merge_res {
+            match merge(
+                &segment_updater.index,
+                segment_entries,
+                merge_operation.target_opstamp(),
+            ) {
                Ok(after_merge_segment_entry) => {
                    let res = segment_updater.end_merge(merge_operation, after_merge_segment_entry);
                    let _send_result = merging_future_send.send(res);
--- a/src/postings/skip.rs
+++ b/src/postings/skip.rs
@@ -15,7 +15,7 @@ fn encode_bitwidth(bitwidth: u8, delta_1: bool) -> u8 {
 }

 fn decode_bitwidth(raw_bitwidth: u8) -> (u8, bool) {
-    let delta_1 = ((raw_bitwidth >> 6) & 1) != 0;
+    let delta_1 = (raw_bitwidth >> 6 & 1) != 0;
    let bitwidth = raw_bitwidth & 0x3f;
    (bitwidth, delta_1)
 }
--- a/src/schema/document/default_document.rs
+++ b/src/schema/document/default_document.rs
@@ -15,7 +15,7 @@ use crate::schema::field_type::ValueParsingError;
 use crate::schema::{Facet, Field, NamedFieldDocument, OwnedValue, Schema};
 use crate::tokenizer::PreTokenizedString;

-#[repr(C, packed)]
+#[repr(packed)]
 #[derive(Debug, Clone)]
 /// A field value pair in the compact tantivy document
 struct FieldValueAddr {
@@ -480,7 +480,7 @@ impl<'a> CompactDocValue<'a> {
 type Addr = u32;

 #[derive(Clone, Copy, Default)]
-#[repr(C, packed)]
+#[repr(packed)]
 /// The value type and the address to its payload in the container.
 struct ValueAddr {
    type_id: ValueType,
@@ -734,7 +734,7 @@ mod tests {

    #[test]
    fn test_json_value() {
-        let json_str = r#"{
+        let json_str = r#"{ 
            "toto": "titi",
            "float": -0.2,
            "bool": true,
--- a/sstable/Cargo.toml
+++ b/sstable/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy-sstable"
-version = "0.5.0"
+version = "0.3.0"
 edition = "2021"
 license = "MIT"
 homepage = "https://github.com/quickwit-oss/tantivy"
@@ -10,10 +10,10 @@ categories = ["database-implementations", "data-structures", "compression"]
 description = "sstables for tantivy"

 [dependencies]
-common = {version= "0.9", path="../common", package="tantivy-common"}
+common = {version= "0.7", path="../common", package="tantivy-common"}
 futures-util = "0.3.30"
 itertools = "0.14.0"
-tantivy-bitpacker = { version= "0.8", path="../bitpacker" }
+tantivy-bitpacker = { version= "0.6", path="../bitpacker" }
 tantivy-fst = "0.5"
 # experimental gives us access to Decompressor::upper_bound
 zstd = { version = "0.13", features = ["experimental"] }
--- a/sstable/src/delta.rs
+++ b/sstable/src/delta.rs
@@ -89,7 +89,7 @@ where

    fn encode_keep_add(&mut self, keep_len: usize, add_len: usize) {
        if keep_len < FOUR_BIT_LIMITS && add_len < FOUR_BIT_LIMITS {
-            let b = (keep_len | (add_len << 4)) as u8;
+            let b = (keep_len | add_len << 4) as u8;
            self.block.extend_from_slice(&[b])
        } else {
            let mut buf = [VINT_MODE; 20];
--- a/sstable/src/dictionary.rs
+++ b/sstable/src/dictionary.rs
@@ -1,5 +1,3 @@
-#![allow(clippy::needless_borrows_for_generic_args)]
-
 use std::cmp::Ordering;
 use std::io;
 use std::marker::PhantomData;
--- a/stacker/Cargo.toml
+++ b/stacker/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy-stacker"
-version = "0.5.0"
+version = "0.3.0"
 edition = "2021"
 license = "MIT"
 homepage = "https://github.com/quickwit-oss/tantivy"
@@ -9,7 +9,7 @@ description = "term hashmap used for indexing"

 [dependencies]
 murmurhash32 = "0.3"
-common = { version = "0.9", path = "../common/", package = "tantivy-common" }
+common = { version = "0.7", path = "../common/", package = "tantivy-common" }
 ahash = { version = "0.8.11", default-features = false, optional = true }
 rand_distr = "0.4.3"

--- a/stacker/src/expull.rs
+++ b/stacker/src/expull.rs
@@ -160,7 +160,7 @@ mod tests {
        {
            let mut buffer = Vec::new();
            stack.read_to_end(&arena, &mut buffer);
-            assert_eq!(&buffer[..], &[] as &[u8]);
+            assert_eq!(&buffer[..], &[]);
        }
    }

--- a/stacker/src/memory_arena.rs
+++ b/stacker/src/memory_arena.rs
@@ -54,7 +54,7 @@ impl Addr {

    #[inline]
    fn new(page_id: usize, local_addr: usize) -> Addr {
-        Addr(((page_id << NUM_BITS_PAGE_ADDR) | local_addr) as u32)
+        Addr((page_id << NUM_BITS_PAGE_ADDR | local_addr) as u32)
    }

    #[inline]
--- a/tokenizer-api/Cargo.toml
+++ b/tokenizer-api/Cargo.toml
@@ -1,6 +1,6 @@
 [package]
 name = "tantivy-tokenizer-api"
-version = "0.5.0"
+version = "0.3.0"
 license = "MIT"
 edition = "2021"
 description = "Tokenizer API of tantivy"