语言代码与 ISO 639 | Jim Zhang's blog
语言代码与 ISO 6392021-01-28

昨天 Jim 调用一个翻译 API 时,惊异地发现日语的语言代码是 "ja",而不是 "jp",这是为什么呢?经过一番探索,原来是国际标准化组织 ISO 早就制定好了语言代码的统一标准:ISO 639

浮皇("Levitating",意为漂浮)是我最希望 Billboard 冠军的单曲啦(本周榜单查看链接),正如大宝贝 Da Baby 的开头那句 "Billboard Baby, Dua Lipa make 'em dance when it come on"(👴的翻译:Dua Lipa 来了,整个 B 榜也得跟着摇起来),呜呜呜呜好听的舞曲怎么可以不冠呢?!(截止撰文时,处在第六名位置)Dua Lipa 二专 Future Nostalgia 一二三四五单都好好听(首单:"Don't Start Now"、二单 "Physical"、三单 "Break My Heart"、四单 "Hallucinate"、五单 "Levitating";其中四单欠佳,但是四单总在 BBC Radio 1 上放,也还不错;总之,肯定是我 2021 必买专辑)!建议没有听的赶快去听,好趴。

ISO 639 是一个系列标准,包括 ISO 639-1 至 ISO 639-6 共六个。但是常用的有 ISO 639-1(2 字符代码),ISO 639-2(3 字符代码),ISO 639-3(3 字符代码,语言全面覆盖)

下表列出了标准的一些详细信息:

标准名称注册机构当前版本涵盖语言数目
ISO 639-1Part 1: Alpha-2 code国际术语信息中心(Infoterm)2002184
ISO 639-2Part 2: Alpha-3 code美国国会图书馆(Library of Congress)1998>450
ISO 639-3Part 3: Alpha-3 code for comprehensive coverage of languagesSIL 国际(SIL International)2007>7000

在这里列出母语者人数前二十的语言和语言代码:

语系语族1语言语言自称ISO 639-1ISO 639-2ISO 639-3母语人数(百万)
汉藏语系汉语族普通话(官话)官话zhzhocmn918
印欧语系罗曼语族西班牙语Españolesspaspa480
印欧语系日耳曼语族英语Englishenengeng379
印欧语系印度-伊朗语族印地语हिन्दी, हिंदीhihinhin341
印欧语系印度-伊朗语族孟加拉语বাংলাbnbenben228
印欧语系罗曼语族葡萄牙语Portuguêsptporpor221
印欧语系斯拉夫语族俄语русскийrururus154
日本-琉球语系——日语ほんjajpnjpn128
印欧语系印度-伊朗语族西旁遮普语پنجابی, ਪੰਜਾਬੀpapanpnb92.7
印欧语系印度-伊朗语族马拉地语मराठीmrmarmar83.1
达罗毗荼语系中南部语族泰卢固语తెలుగుteteltel82.0
汉藏语系汉语族吴语吴语zhzhowuu81.4
突厥语系乌古斯语族土耳其语Türkçetrturtur79.4
韩语系(朝鲜语系,高丽语系)朝鲜语族韩语, kokorkor77.3
印欧语系罗曼语族法语françaisfrfrafra77.2
印欧语系罗曼语族德语(标准德语)Deutsch (Standarddeutsch)dedeudeu76.1
南亚语系孟-高棉语族越南语TiếngViệtvivievie76.0
达罗毗荼语系南部语族泰米尔语தமிழ்tatamtam75.0
汉藏语系汉语族粤语粤语zhzhoyue73.1
印欧语系印度-伊朗语族乌尔都语اردوururdurd68.6

参考资料

Footnotes

  1. 谢来喜.语系、语族和语支[J].上饶师专学报,1995(01):77-81+86.