作為一個非營利性組織,UnicodeConsortium致力於開發、拓展和促進相關全球化標準的采用。聯盟成員中有許多企業和組織代表,且其中不少來自計算機和信息處理行業。而在15.0新標準中,Unicode聯盟繼續實施針對核心規范、附件和數據文件的改進——為其引入4489個新字符,且總數達到14萬9186個。
首先,本次新增內容包括兩組新腳本(總計 161 個)、20 個新的表情符號(Emoji)、以及 4393 個中日韓(CJK)表意文字。
其次,Unicode 15.0 版本中的新腳本和字符增加對更多現代語言的支持:
● 包括在印度地區使用的 Nag Mundari;
● 在印度使用的 Kannada 字符(用於書寫 Konkani、Awadhi 和 Havyaka Kannada);
● 以及由阿拉斯加卡克托維克的伊努皮亞克人設計、用於因紐特語和尤皮克語的 Kaktovik 數字。
新增的 20 個表情符號,包括發夾(hair pick)、沙錘(maracas)、水母(jellyfish)、khanda(印度的一種古老武器)、以及粉色愛心(pink heart)。
其它新增符號還包括:
● 九顆尖白星(巴哈伊信仰者使用)
● 八個天體符號(天文學傢和占星者使用)
● 29 個額外的埃及象形文字(格式控件)
針對其它語言和學術工作的支持:
● 在東南亞發現的歷史文字 Kawi(用於書寫古爪哇語和其它語言)
● 三個附加的阿拉伯文字(土耳其使用的古蘭經標記)
● 三個 Khojki 字符(在手寫和印刷文件中被發現)
● 十個梵文字符(用於表示在土耳其發現的吉祥標志銘文和手稿)
● 六個拉丁字母(馬拉雅拉姆語的音譯使用)
● 63 個西裡爾字母修飾符(音標中使用)
重要的圖表字體更新:
● 一組埃及象形文字(除支持文本中旋轉字形的標準化變體序列外)
● 統一加拿大土著音節的字形(為 Carrier 和其它語言提供更好的支持)
● 一套 Wancho 新字體(具有改進和簡化的形狀)
● 針對中日韓(CJK)語言的更新添加:
● H 塊中的 CJK 統一表意文字擴展(4192 個字符)
● C 塊中的一個統一表意文字擴展
最後,Unicode 屬性和規范決定文本在計算機(包括手機)上的行為,以下 15.0 版新標準的重要更新。
【UAX #9】Unicode 雙向算法,修改 UAX9-C2 中的註釋,以強調使用更高級別的協議來減輕潛在的源代碼欺騙攻擊。
【UAX #31】Unicode 標識符與模式參數,提供更多關於默認標識符配置文件的指導,闡明標識符中默認可忽略代碼點的使用,並討論 Pattern_White_Space 與編程語言中的雙向排序問題之間的關系。
【UAX #38】Unicode Han 數據庫,增加 kAlternateTotalStrokes 屬性。將 kCihaiT 屬性的類別變更為字典索引、擴展 kKangXi 屬性,並且加入第 3.0、3.10 和 4.5 節。
【UTS #39】Unicode 安全機制,將零寬度連接符(ZWJ)和零寬度非連接符(ZWNJ)字符從 Identifier_Status=Allowed 變更為 Identifier_Status=Restricted,默認情況下的通用安全配置文件將不再允許。
【UAX #45】U-Source 語義符,在其數據文件中記錄新的表意文字、添加 ExtH 作為新狀態、改進現有 CJK 統一表意文字塊的狀態標識符、並添加第 2.5 節。
【UTS #46】Unicode IDNA 兼容性處理,澄清 ToASCII 中空標簽的邊緣情況、並添加有關新 IDNA 派生屬性數據文件的文檔。