読者です 読者をやめる 読者になる 読者になる

ゆとりーなの日記

日記的な事を書いて行くと思はれる

Twitterでツヰートすると新字に直される舊字の話

舊字體でツヰートした筈なのに何故か新字體でツヰートされると云ふ現象がいつの頃からかTwitter上で起󠄁るやうになつた。つい最近󠄁もそれに關するツヰートを見掛けたのでこゝにそれに關する情󠄁報を纏めておくことにする。猶󠄂、この情󠄁報に就いてだが、Twitterの公󠄁式ドキユメント等にあたつてみたものと云ふ訣ではないので飽󠄁迄現象を見ての假說であることに注󠄁意󠄁されたし。
まづ、舊字體でツヰートして新字體に直される字には「神」や「飯」があることが知られてゐる。これらは機󠄁種依存文󠄁字であり、Unicodeになつてから追󠄁加された字形である。では、これら機󠄁種依存文󠄁字の總てが新字體に直されるかと云ふとさうではなく、「增」や「狀」、「靑」などはそのまゝツヰートされる。これらの字の區󠄁別に法則性はあるかと云ふと實はあつて、前󠄁者󠄁はAdobeJapan-1の異體字セレクタでも同樣の形を持つ文󠄁字、後者󠄁は持たない字なのである。例へば「神󠄀」には「神(U+FA19)」「神󠄀(U+795E U+E0100) 」の2つがある。この場合「神(U+FA19)」は「神」に直され、「神󠄀(U+795E U+E0100) 」はそのまゝ「神󠄀」とツヰートされると云ふ工合である。
以上のことから我々がやるべきことは、Unicode追󠄁加文󠄁字とAdobeJapan-1での追󠄁加文󠄁字で同じ形の漢󠄁字がある場合、AdobeJapan-1の方でツヰートすることを心掛けると云ふことである。この現象を發見して以降󠄁、當初はUnicode追󠄁加文󠄁字を優先して登錄してゐた舊字體辭書を急󠄁遽AdobeJapan-1を優先するやうに書換へた。他の環󠄁境ではフオントを設定せずともできるだけこちらが意󠄁圖した漢󠄁字の形で表示される文󠄁字種が殖えるUnicode追󠄁加文󠄁字を使󠄁ひたいところなのだが、よく使󠄁ふTwitterがこれでは流石にAdobeJapan-1を優先せざるを得ない。しかしAdobeJapan-1にしかない漢󠄁字も多く、これらを使󠄁ふ以上はどうせフオントを設定しないと適󠄁切に表示されないのだからそこまで實害󠄂はないとも云へよう。
−追󠄁記−
Twitterで新字に直されるUnicode追󠄁加文󠄁字なる舊字はCJK互換漢󠄁字なのではないかと云ふ指摘を受けたのでその一覽に當つてみたのだが、どうも見た感じそれで間違󠄂ひなささうである。CJK互換漢󠄁字は昔からブラウザに依つてはポストするとCJK統合漢󠄁字に變換されることがあつたやうである(CJK互換漢󠄁字は元々CJK統合漢󠄁字と區󠄁別されることを期待して良い代物ではないとのことである。據つて勝󠄁手に直されても文󠄁句は言へないと云ふことになるのだらう。)。現狀この現象はChromeから投稿する場合に於てもTwitterでは見られるがFacebookでは見られない等サービス每に差がある爲、ブラウザが原因ではないやうにも思はれる。對策としては異體字セレクタを使󠄁へば回避󠄁できると云ふことになるのだが、意󠄁圖してさうなつてゐるのかどうかは規格を追󠄁つた訣ではないので分󠄁らないが、CJK互換漢󠄁字の形をカバーしてゐるのはAdobeJapan-1の方の規格のみである。2つある規格のうちのもう一方である文󠄁字情󠄁報の方の規格ではカバーしきれない文󠄁字がいくつかある爲それらはAdobeJapan-1の方で對應するしかない。