mirror of
https://github.com/meilisearch/meilisearch.git
synced 2025-01-18 08:48:32 +08:00
fix split_query_string
This commit is contained in:
parent
c6434f609c
commit
b574960755
@ -882,6 +882,7 @@ mod tests {
|
|||||||
|
|
||||||
// even try to search for a document
|
// even try to search for a document
|
||||||
let reader = db.main_read_txn().unwrap();
|
let reader = db.main_read_txn().unwrap();
|
||||||
|
println!("here");
|
||||||
let SortResult {documents, .. } = index.query_builder().query(&reader, Some("21 "), 0..20).unwrap();
|
let SortResult {documents, .. } = index.query_builder().query(&reader, Some("21 "), 0..20).unwrap();
|
||||||
assert_matches!(documents.len(), 1);
|
assert_matches!(documents.len(), 1);
|
||||||
|
|
||||||
|
@ -181,26 +181,9 @@ fn split_query_string<'a, A: AsRef<[u8]>>(s: &str, stop_words: &'a fst::Set<A>)
|
|||||||
analyzer
|
analyzer
|
||||||
.analyze(s)
|
.analyze(s)
|
||||||
.tokens()
|
.tokens()
|
||||||
.scan((0, false), |(offset, is_hard_sep), mut token| {
|
.filter(|t| t.is_word())
|
||||||
match token.kind {
|
.map(| Token { word, .. }| word.to_string())
|
||||||
TokenKind::Word | TokenKind::StopWord | TokenKind::Any => {
|
.enumerate()
|
||||||
if *is_hard_sep {
|
|
||||||
*offset += 8;
|
|
||||||
} else {
|
|
||||||
*offset += 1;
|
|
||||||
}
|
|
||||||
*is_hard_sep = false;
|
|
||||||
token.char_index += *offset;
|
|
||||||
}
|
|
||||||
TokenKind::Separator(SeparatorKind::Hard) => {
|
|
||||||
*is_hard_sep = true;
|
|
||||||
}
|
|
||||||
_ => (),
|
|
||||||
}
|
|
||||||
Some((*offset, token))
|
|
||||||
})
|
|
||||||
.filter(|(_, t)| t.is_word())
|
|
||||||
.map(|(i, Token { word, .. })| (i, word.to_string()))
|
|
||||||
.collect()
|
.collect()
|
||||||
}
|
}
|
||||||
|
|
||||||
|
@ -55,13 +55,13 @@ where
|
|||||||
.scan((0, false), |(offset, is_hard_sep), mut token| {
|
.scan((0, false), |(offset, is_hard_sep), mut token| {
|
||||||
match token.kind {
|
match token.kind {
|
||||||
TokenKind::Word => {
|
TokenKind::Word => {
|
||||||
|
token.char_index += *offset;
|
||||||
if *is_hard_sep {
|
if *is_hard_sep {
|
||||||
*offset += 8;
|
*offset += 8;
|
||||||
} else {
|
} else {
|
||||||
*offset += 1;
|
*offset += 1;
|
||||||
}
|
}
|
||||||
*is_hard_sep = false;
|
*is_hard_sep = false;
|
||||||
token.char_index += *offset;
|
|
||||||
}
|
}
|
||||||
TokenKind::Separator(SeparatorKind::Hard) => {
|
TokenKind::Separator(SeparatorKind::Hard) => {
|
||||||
*is_hard_sep = true;
|
*is_hard_sep = true;
|
||||||
@ -110,13 +110,13 @@ where
|
|||||||
.scan((0, false), |(offset, is_hard_sep), mut token| {
|
.scan((0, false), |(offset, is_hard_sep), mut token| {
|
||||||
match token.kind {
|
match token.kind {
|
||||||
TokenKind::Word | TokenKind::StopWord | TokenKind::Any => {
|
TokenKind::Word | TokenKind::StopWord | TokenKind::Any => {
|
||||||
|
token.char_index += *offset;
|
||||||
if *is_hard_sep {
|
if *is_hard_sep {
|
||||||
*offset += 8;
|
*offset += 8;
|
||||||
} else {
|
} else {
|
||||||
*offset += 1;
|
*offset += 1;
|
||||||
}
|
}
|
||||||
*is_hard_sep = false;
|
*is_hard_sep = false;
|
||||||
token.char_index += *offset;
|
|
||||||
}
|
}
|
||||||
TokenKind::Separator(SeparatorKind::Hard) => {
|
TokenKind::Separator(SeparatorKind::Hard) => {
|
||||||
*is_hard_sep = true;
|
*is_hard_sep = true;
|
||||||
|
Loading…
Reference in New Issue
Block a user