拼音拆分算法

拼音拆分算法

之前做一个诗词相关的网站时( 诗词歌赋 ),本预想添加拼音,数据来源为hanlp或google翻译,但一直拖着没做。最近看到html对注音的支持,包括和标签,便写个demo看看效果。

数据来源使用google翻译,发现有些排版问题,有些拼音会进行分词并连接在一块,就算在汉字中间添加空格也不行,于是网上找找拼音拆分的算法,基本上都是根据声母和韵母回溯判断,例如:拼音拆分算法,我自己尝试用正则表达式直接拆分,发现效果不错。

See the Pen
拼音拆分
by snowtraces (@snowtraces)
on CodePen.