EmoArt
发布
术语表

什么是 CLDR (Common Locale Data Repository)

最近更新: 2026-05-20·约 4 分钟

本文约 4 分钟读完。

🌸 被屏幕阅读器朗读为「樱花」。这个中文译名的来源就是 CLDR。CLDR 是 Unicode Consortium 运营的全球最大多语言本地化数据库,提供 emoji 名称、日期格式、数值表示、货币符号等 所有依赖语言和地区的信息的事实标准。虽然普通用户看不到它,但它是 OS、浏览器和各类库背后广泛使用的基础设施。

定义

CLDR (Common Locale Data Repository) 是 Unicode Consortium 提供的多语言本地化数据官方仓库。 它以 XML 格式涵盖了各语言和地区的日期时间、数值、货币、单位的表示方式、字符串排序规则、人名地名翻译,以及 emoji 的名称和关键词。 覆盖全球 700 多个区域设置 (语言与地区的组合)。

CLDR 提供的信息

类别示例
日期时间「2026年5月27日」「May 27, 2026」「27/05/2026」
数值「1,234.56」(美国)、「1.234,56」(德国)、「1 234,56」(法国)
货币「¥1,000」「$1,000.00」「1.000,00 €」
语言与地区名「日本語」「Japanese」「日本」「Japan」
emoji 名称🌸 →「樱花」(zh) / "cherry blossom" (en)
emoji 关键词🌸 →「樱花, 春天, 花」(zh) / "cherry, flower, spring" (en)

与 emoji 的关系

emoji 名称 (CLDR Short Names)

每个 emoji 都有 CLDR 定义的简短名称。屏幕阅读器朗读 emoji 时、 OS 的 emoji 选择器搜索时、搜索引擎索引 emoji 时,都以此为基准数据。 各语言版本独立管理,英语的 "cherry blossom" 和中文的「樱花」各自都是正式名称。

emoji 搜索关键词

CLDR Annotations 为每个 emoji 定义了多个关键词。 🌸 的英语关键词包括 cherry, blossom, flower, spring 等。 用户在 OS 的 emoji 选择器中输入「flower」时,🌸、🌹、🌷 都会出现在结果中,正是依靠这些数据。

选择器的分类

emoji 选择器中「Smileys & Emotion」「Animals & Nature」等分类,也是以 CLDR 的分组为基础。

使用场景

  • 操作系统:macOS、iOS、Windows、Android、ChromeOS 均内置 CLDR 数据
  • 编程语言:通过 ICU (International Components for Unicode) 库被众多语言使用
  • 浏览器Intl API 的各种格式化功能 (Intl.DateTimeFormat, Intl.NumberFormat, Intl.RelativeTimeFormat) 均依赖 CLDR
  • 屏幕阅读器:VoiceOver、TalkBack、NVDA、JAWS 朗读 emoji 时使用 CLDR 数据
  • OS emoji 选择器:将 CLDR Annotations 作为搜索关键词加载

更新周期

CLDR 每年发布两次 (春季和秋季)。 Unicode 新增 emoji、新地区代码、术语改进、翻译修正等都会在更新中体现。 中文翻译也会在每次更新中进行审校,随着 emoji 的增加补充自然的中文译名。

谁在做翻译

CLDR 的翻译由 Unicode 注册志愿者和部分付费语言专家共同完成。 Apple、Google、Microsoft、IBM 等企业的本地化团队是主要贡献者, 许多语言都提供了商业品质的翻译。中文、英语、日语、德语、法语等主要语言 并非简单的机器翻译,而是由专家精心翻译。不过,资源较少的语言中 仍可能存在机器翻译痕迹或空白字段。

实务中的使用方式

  • 多语言网站开发:在自行创建翻译表之前先查阅 CLDR,尤其是日期和货币格式
  • JavaScript 的 Intl API:浏览器原生支持,无需额外库即可处理多种格式
  • emoji 搜索 UI:实现选择器或建议功能时,可直接使用 CLDR Annotations 或其封装库
  • 无障碍:编写包含 emoji 的内容时,要意识到屏幕阅读器会以 CLDR 名称朗读

常见误解

  • ❌「CLDR 是 Unicode 规范的一部分」→ ✅ 它是关联项目,但与 Unicode 核心规范是不同的成果
  • ❌「emoji 的名称全球统一」→ ✅ 各语言版本独立管理,译名不同是正常的
  • ❌「翻译是机器生成的」→ ✅ 主要语言由专家翻译

相关术语

  • Unicode - CLDR 的母项目
  • emoji - CLDR 为其定义名称和关键词的对象

这篇文章对你有帮助吗?