news 2026/5/1 5:09:44

前端字符串排序搜索可以更加细化了

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
前端字符串排序搜索可以更加细化了

大家好,我是CC,在这里欢迎大家的到来~

开场

书接上文,Intl下的Segmenter对象可以实现对文本的分割,除此之外,还有对字符串比较、数字格式化、日期格式化等其他功能。

这篇文章先来看看字符串比较,现在来理论加实践一下。

字符串比较

Intl.Collator用于语言敏感的字符串比较。

比较

基于Collator对象的排序规则进行比较。第一个字符串出现在第二个字符串之前则为负值,否则为正则,相等时则返回 0。

console.log(new Intl.Collator().compare("a", "c")); // -1 console.log(new Intl.Collator().compare("c", "a")); // 1 console.log(new Intl.Collator().compare("a", "a")); // 0

基于语言比较

// 德语中,ä 使用 a 的排序 console.log(new Intl.Collator("de").compare("ä", "z")); // -1 // 在瑞典语中,ä 排在 z 之后 console.log(new Intl.Collator("sv").compare("ä", "z")); // 1

配置项

  • localeMatcher
    • 使用的区域匹配算法,可选的值包括:
    • 默认值为best fit-使用浏览器最佳匹配算法,还有lookup-使用 BCP 47 规范的标准查找
const testStrings = ['苹果', '香蕉', '橙子']; // lookup:使用 BCP 47 规范的标准查找 const lookupCollator = new Intl.Collator('zh', { localeMatcher: 'lookup' }); // best fit:使用浏览器的最佳匹配算法(默认) const bestFitCollator = new Intl.Collator('zh', { localeMatcher: 'best fit' }); console.log(testStrings.sort(lookupCollator.compare)); console.log(testStrings.sort(bestFitCollator.compare)); // ["橙子","苹果","香蕉"] // ["橙子","苹果","香蕉"]
  • usage
    • 是用于排序还是用于搜索匹配的字符串,可选的值包括:
    • 默认值是 sort,还有 search
const words = ['数据', '数据库', '数学', '数字', '数值']; // 用于排序的 Collator const sortCollator = new Intl.Collator('zh-CN', { usage: 'sort', sensitivity: 'variant' }); // 用于搜索的 Collator const searchCollator = new Intl.Collator('zh-CN', { usage: 'search', sensitivity: 'base' // 搜索时更宽松 }); console.log('排序结果:', words.sort(sortCollator.compare)); // ["数据", "数据库", "数值", "数字", "数学"] const searchTerm = '数'; const searchResults = words.filter(word => searchCollator.compare(word.slice(0, searchTerm.length), searchTerm) === 0 ); console.log(`搜索"${searchTerm}"的结果:`, searchResults); // ["数据", "数据库", "数学", "数字", "数值"]
  • sensitivity
    • 字符串中哪些差异应导致结果值为非零,可能的值包括:
    • base: 只有字母不同的字符串比较时不相等,像 a ≠ b、a = á、a = A。
    • accent: 只有不同的基本字母或重音符号和其他变音符号的字符串比较时不相等,例如:a ≠ b、a ≠ á、a = A。
    • case: 只有不同的基本字母或大小写的字符串比较时不相等,例如:a ≠ b、a = á、a ≠ A。
    • variant: 字符串的字母、重音和其他变音富豪,或不同大小写比较不相等,例如:a ≠ b、a ≠ á、a ≠ A。
    • usage 是 sort 时默认值是 variant,search 时默认值取决于区域。
const pinyinExamples = [ ['mā', 'ma'], // 声调差异 ['lǜ', 'lu'], // 特殊字符差异 ['zhōng', 'zhong'] // 音调符号差异 ]; const pinyinAccentCollator = new Intl.Collator('zh-CN', { sensitivity: 'accent', // 忽略声调差异 usage: 'search' }); pinyinExamples.forEach(([a, b]) => { const result = pinyinAccentCollator.compare(a, b); console.log(`"${a}" vs "${b}": ${result === 0 ? '匹配' : '不匹配'}`); }); // "mā" vs "ma": 不匹配 // "lǜ" vs "lu": 不匹配 // "zhōng" vs "zhong": 不匹配 const pinyinBaseCollator = new Intl.Collator('zh-CN', { sensitivity: 'base', // 忽略声调差异 usage: 'search' }); pinyinExamples.forEach(([a, b]) => { const result = pinyinBaseCollator.compare(a, b); console.log(`"${a}" vs "${b}": ${result === 0 ? '匹配' : '不匹配'}`); }); // "mā" vs "ma": 匹配 // "lǜ" vs "lu": 匹配 // "zhōng" vs "zhong": 匹配 const pinyinCaseCollator = new Intl.Collator('zh-CN', { sensitivity: 'case', // 忽略声调差异 usage: 'search' }); pinyinExamples.forEach(([a, b]) => { const result = pinyinCaseCollator.compare(a, b); console.log(`"${a}" vs "${b}": ${result === 0 ? '匹配' : '不匹配'}`); }); // "mā" vs "ma": 匹配 // "lǜ" vs "lu": 匹配 // "zhōng" vs "zhong": 匹配 const pinyinVariantCollator = new Intl.Collator('zh-CN', { sensitivity: 'variant', // 忽略声调差异 usage: 'search' }); pinyinExamples.forEach(([a, b]) => { const result = pinyinVariantCollator.compare(a, b); console.log(`"${a}" vs "${b}": ${result === 0 ? '匹配' : '不匹配'}`); }); // "mā" vs "ma": 不匹配 // "lǜ" vs "lu": 不匹配 // "zhōng" vs "zhong": 不匹配
  • ignorePunctuation
    • 是否忽略标点
    • 默认是 false
const texts = [ '你好,世界!', '你好世界', '你好-世界', '你好。世界', '你好——世界' ]; const withPunctuation = new Intl.Collator('zh-CN', { ignorePunctuation: false // 不忽略标点(默认) }); const withoutPunctuation = new Intl.Collator('zh-CN', { ignorePunctuation: true // 忽略标点 }); console.log(texts.sort(withPunctuation.compare)); console.log(texts.sort(withoutPunctuation.compare)); // [ // "你好-世界", // "你好——世界", // "你好,世界!", // "你好。世界", // "你好世界" // ] // [ // "你好,世界!", // "你好世界", // "你好-世界", // "你好。世界", // "你好——世界" // ]
  • numeric
    • 是否使用数字对照,使得“1”<“2”<“10”
    • 默认是 false
    • 同 locales 的 Unicode 扩展键 kn 设置,但优先级高于他
const items = [ '第1章 引言', '第10章 总结', '第2章 正文', '第11章 附录', '第20章 参考文献' ]; // 普通排序(字符串方式) const regularCollator = new Intl.Collator('zh-CN', { numeric: false // 默认 }); // 数字感知排序 const numericCollator = new Intl.Collator('zh-CN', { numeric: true }); console.log(items.slice().sort(regularCollator.compare)); console.log(items.slice().sort(numericCollator.compare)); // [ // "第10章 总结", // "第11章 附录", // "第1章 引言", // "第20章 参考文献", // "第2章 正文" // ] // [ // "第1章 引言", // "第2章 正文", // "第10章 总结", // "第11章 附录", // "第20章 参考文献" // ]
  • caseFirst
    • 是否首先根据大小写排序,可选的值包括:
    • upper
    • lower
    • false
    • 同 locales 的 Unicode 扩展键 kf 设置,但优先级高于他
const mixedList = [ 'Apple', 'apple', 'Banana', 'banana', '中文', 'China', 'china', '苹果' ]; // 大写优先 const upperFirst = new Intl.Collator('zh-CN', { caseFirst: 'upper', sensitivity: 'case' // 需要区分大小写 }); console.log(mixedList.slice().sort(upperFirst.compare)); // ["Apple", "Banana", "China", "apple", "banana", "china", "中文", "苹果"] // [ // "苹果", // "中文", // "Apple", // "apple", // "Banana", // "banana", // "China", // "china" // ] // 小写优先 const lowerFirst = new Intl.Collator('zh-CN', { caseFirst: 'lower', sensitivity: 'case' }); console.log(mixedList.slice().sort(lowerFirst.compare)); // ["apple", "banana", "china", "Apple", "Banana", "China", "中文", "苹果"] // [ // "苹果", // "中文", // "apple", // "Apple", // "banana", // "Banana", // "china", // "China" // ] // 不优先(默认) const noCaseFirst = new Intl.Collator('zh-CN', { caseFirst: false, sensitivity: 'case' }); console.log(mixedList.slice().sort(noCaseFirst.compare)); // [ // "苹果", // "中文", // "apple", // "Apple", // "banana", // "Banana", // "china", // "China" // ]
  • collation
    • 区域的变体
    • 同 locales 的 Unicode 扩展键 co 设置,但优先级高于他
const words = ['张三', '李四', '王五', '赵六', '孙七']; // 默认拼音排序 const defaultCollator = new Intl.Collator('zh-CN'); console.log(words.slice().sort(defaultCollator.compare)); // 尝试不同的 collation(如果支持) try { // 笔画排序(如果支持) const strokeCollator = new Intl.Collator('zh-CN-u-co-stroke'); console.log(words.slice().sort(strokeCollator.compare)); } catch (e) { console.log('\n笔画排序不支持:', e.message); } // 通过 Unicode 扩展键设置 collation const localeWithCollation = 'zh-CN-u-co-pinyin'; // 拼音排序(默认) const collator1 = new Intl.Collator(localeWithCollation); console.log('\n通过 Unicode 扩展键设置 (拼音):', collator1.resolvedOptions().collation); // 通过 options 参数覆盖 const collator2 = new Intl.Collator('zh-CN-u-co-stroke', { collation: 'pinyin' // options 优先级更高 }); console.log('Options 覆盖 Unicode 扩展键:', collator2.resolvedOptions().collation);

获取配置项

const options = collator.resolvedOptions(); usedOptions.locale; // "de" usedOptions.usage; // "sort" usedOptions.sensitivity; // "base" usedOptions.ignorePunctuation; // false usedOptions.collation; // "default" usedOptions.numeric; // false

判断返回支持的 locale

在给定的locales数组中判断出Collator支持的locales。但是可能每个浏览器支持的不大一样。

const locales = ["ban", "id-u-co-pinyin", "de-ID"]; const options = { localeMatcher: "lookup" }; console.log(Intl.Collator.supportedLocalesOf(locales, options)); // ["id-u-co-pinyin", "de-ID"]

总结

Intl.Collator可以根据当前环境或者手动设置的Locale以及字符串的大小写、音标、声调、标点符号和数字敏感度来实现字符串的排序和搜索;在构建国际化应用中,特别是在处理用户生成内容、搜索排序、数据展示等场景中,能确保应用遵循目标语言的正确规则。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/30 3:54:54

2258xt量产工具在U盘生产线的实际应用案例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个2258xt量产工具的实战应用演示项目。包含&#xff1a;1.模拟U盘生产线场景 2.展示完整量产流程(识别-擦除-烧录-校验) 3.常见问题解决方案库 4.生产数据统计分析面板 5.生成…

作者头像 李华
网站建设 2026/5/1 5:09:34

Python 和 PyTorch 的核心区别(零基础秒懂)

很多零基础同学会把 Python 和 PyTorch 搞混&#xff0c;核心结论先摆清楚&#xff1a;Python 是一门通用编程语言&#xff0c;PyTorch 是基于 Python 开发的、专门用于深度学习的 “工具库 / 框架” —— 就像 “普通话” 和 “医学专用术语 手术工具包” 的区别&#xff1a;…

作者头像 李华
网站建设 2026/4/28 16:30:46

Ubuntu 调用显卡 vs CUDA 调用显卡:核心区别(零基础秒懂)

很多同学会混淆 “Ubuntu 能看到显卡” 和 “CUDA 能调用显卡干活”&#xff0c;核心结论先摆清楚&#xff1a;Ubuntu&#xff08;通过显卡驱动&#xff09;对显卡的调用是「操作系统层面的基础管理」&#xff08;能 “看见”、能 “控制” 但不能 “高效用”&#xff09;&…

作者头像 李华
网站建设 2026/4/18 4:43:40

PSQL高效命令大全:比传统方法快10倍的技巧

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 开发一个PSQL效率工具包&#xff0c;包含以下功能&#xff1a;1) 常用命令快捷键 2) 复杂查询模板 3) 批量操作脚本 4) 性能分析工具 5) 自动补全功能 6) 历史命令搜索 7) 结果格式…

作者头像 李华
网站建设 2026/4/28 13:36:37

正则化在数据清洗中的5个实战技巧

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 开发一个数据清洗工具&#xff0c;内置常见正则表达式模板&#xff08;去空格、标准化日期、提取关键信息等&#xff09;。用户上传CSV文件后&#xff0c;可选择预处理模板或自定义…

作者头像 李华
网站建设 2026/4/28 21:45:30

电商系统中的MyBatis模糊搜索实战案例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个电商商品搜索系统&#xff0c;功能要求&#xff1a;1. 商品多条件模糊搜索&#xff08;名称、分类、描述&#xff09;&#xff1b;2. 搜索建议功能&#xff08;输入时实时提…

作者头像 李华