Handling Unicode #5

GraphemeBreakProperty.txt、WordBreakProperty.txt、Scripts.txt から生成するデータの 1 エントリに従来 8 バイトを割いていたのを、5 バイトまで詰めてみた。

ただ、これで最適だというわけではない。npmjs.com 上のライブラリ grapheme-breaker では Trie 木の構造で GraphemeBreakProperty データを保持していて、そのサイズは約 3KB だ。同じデータが Unistring では約 6KB。すごい。

それはそれとして、そろそろ wasavi に組み込んでみたい。

Leave a Reply

Your email address will not be published. Required fields are marked *