前回に引き続き、シーソング石窟の文字を 言語を超える力(Language Echo) に入れていこうと思います。
今回で全文入れていこうと思います。
やってみた
2行目
本文「I am the winds that guide」
言語を超える力「i1 s a」
3行目
本文「I am the evening stars」
言語を超える力「M ve eeatS aars」
4行目
本文「I am the morning sky」
言語を超える力「R eae eEa aea」
5行目
本文「I am born of the sea」
言語を超える力「ao r o A」
6行目
本文「and there shall I die」
言語を超える力「and rite Saa e」
感想
うーん・・・・文字区切りが怪しいのはしかたないとして、多くの文字が「a」と解釈されやすい傾向にありますね。学習データ量として「a」が多いから、偏りが出てしまっているのかな。
文字区切りに関しては何かしら考えます。大抵2文字がくっついているパターンなので、2文字ラベルをつけるとか・・・・かなぁ
それでは