EmoArt
发布
术语表

标签序列 - 次国家旗帜 emoji 背后的机制

最近更新: 2026-05-13·约 4 分钟

本文约 4 分钟读完。

🏴󠁧󠁢󠁥󠁮󠁧󠁿 (英格兰) 不是单个字符。它由一个黑旗基础、四个拼写 "gbeng" 的不可见标签字符和一个取消标签终止符组成。一面旗帜需要六个码位。标签序列是 Unicode 中用于表示国家以下级别旗帜的机制 - 地区、州和较大国家内的组成国。 它比用于国旗的地区标识符号系统更复杂,而这种复杂性正是各平台支持参差不齐的主要原因。

定义

标签序列是一种 Unicode emoji 构造,使用标签字符 (U+E0020 到 U+E007F) 在基础 emoji 旁编码次国家标识符。 其通用结构为:基础 emoji + 标签字符序列 + 取消标签 (U+E007F)。 对于次国家旗帜,基础 emoji 是黑旗 (🏴 U+1F3F4),标签字符拼写出 ISO 3166-2 行政区划代码。

次国家旗帜的结构

以英格兰旗帜 🏴󠁧󠁢󠁥󠁮󠁧󠁿 为例,它由以下部分组成:

  1. 🏴 (U+1F3F4) - 黑旗基础
  2. 标签 g (U+E0067) - 小写字母 "g" 作为标签字符
  3. 标签 b (U+E0062) - 小写字母 "b"
  4. 标签 e (U+E0065) - 小写字母 "e"
  5. 标签 n (U+E006E) - 小写字母 "n"
  6. 标签 g (U+E0067) - 小写字母 "g"
  7. 取消标签 (U+E007F) - 终止符

第二个 "g" 和取消标签之间的标签字符拼写出 "gbeng",即英格兰的 ISO 3166-2 代码。 "GB" 是国家 (英国),"ENG" 是行政区划。组合起来标识「英国境内的英格兰」。

为什么选择这种设计

用于国旗的地区标识符号系统只适用于 ISO 3166-1 国家代码 (A-Z 字母对)。 次国家实体不适合这种两字母方案。Unicode 本可以为每面行政区划旗帜分配单独的码位, 但全球有数千个行政区划,为每个都分配码位会迅速耗尽增补平面。 标签序列通过将标识符编码为不可见标签字符串来解决这个问题。

代价是复杂性:每面旗帜需要 6 个以上的码位而非 2 个,平台必须同时实现地区标识符号和标签序列两种机制才能支持所有旗帜。

官方支持的旗帜

Unicode 的「推荐用于通用交换」(RGI) 列表很保守:只有满足广泛支持标准的旗帜才被推荐。 目前只有三面行政区划旗帜是 RGI:

  • 🏴󠁧󠁢󠁥󠁮󠁧󠁿 - 英格兰 (gbeng)
  • 🏴󠁧󠁢󠁳󠁣󠁴󠁿 - 苏格兰 (gbsct)
  • 🏴󠁧󠁢󠁷󠁬󠁳󠁿 - 威尔士 (gbwls)

其他行政区划 (美国各州、加拿大各省、德国各联邦州、日本各都道府县等) 在技术上可以编码为标签序列, 但它们不是 RGI,主流平台也不支持。发送给大多数用户时会显示为黑旗加上一串方块字符。

为什么支持参差不齐

  • 实现复杂度:厂商必须解析多码位序列并查找行政区划代码
  • 资源膨胀:每面支持的旗帜都需要独立的字形资源;支持数百个行政区划成本高昂
  • 政治敏感性:承认某个行政区划旗帜可能涉及政治争议;厂商态度谨慎
  • 需求有限:大多数用户不会请求次国家旗帜;对厂商来说投入产出比低

结果是,即使在现代 Apple、Google、Samsung 和 Microsoft 设备上,也只有三面 RGI 行政区划旗帜能可靠渲染。 其他标签序列通常回退为黑旗字形加上可见的标签字符方块。

标签字符简史

标签字符 (U+E0000 区块) 最初在 Unicode 3.1 中为「语言标记」而添加 - 一种现已废弃的在纯文本中标记语言切换的机制。 它们闲置了十多年,直到在 Unicode 9.0 (2016) 中被重新用于 emoji 标签序列。 这就是为什么这个码位范围对于 emoji 用途来说看起来有些奇怪;它是一个旧功能获得新生的遗产。

实务注意事项

  • 不要依赖三面 RGI 以外的行政区划旗帜:在大多数设备上渲染会失败
  • 字符计数开销大:每面行政区划旗帜有 6-7 个码位,超过 14 个 UTF-16 代码单元
  • 复制粘贴能保留:标签序列是标准 Unicode 的一部分,在现代系统间能正常传递
  • 屏幕阅读器表现不一:对行政区划旗帜的朗读质量从「英格兰旗帜」(支持时) 到「黑旗」加逐个拼读标签字母不等

常见误解

  • ❌「所有次国家旗帜都是 emoji」→ ✅ 只有英格兰、苏格兰和威尔士是 RGI;其他在技术上可编码但不被支持
  • ❌「标签序列和地区标识符号是一回事」→ ✅ 不同的机制;地区标识符号是字母对,标签序列是更长的字符串
  • ❌「添加更多行政区划旗帜只是字体资源的问题」→ ✅ 厂商需要综合权衡资源成本、政治考量和用户需求

相关术语

  • 地区标识符号 - 用于国家级旗帜的更简单机制
  • 码位 - 每个标签字符所占据的单位
  • ZWJ - 类似的组合机制,但用于 ZWJ 序列而非标签序列

这篇文章对你有帮助吗?