日曜プログラミング

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

更新情報 : 言語を超える力 : ひんがしの文字対応状況について

ひんがしの国の文字の言語を超える力対応、現在遂行中です。
現在の対応状態について報告します。

進捗報告

とりあえず、小さなモデルは作った

以前の記事で紹介させていただきました先人様の記事を再掲します。

このツィートおよびレスにいくつか既に翻訳していただいた文字を載せていただいていますので、そのデータを参考にデータの打ち込みを行いました。
また、翻訳結果を日本語で表示、縦読み対応などを行いました。
ただやはり、文字区切りは難しいです。 日本語の達筆文化・崩し文字文化がががー (まぁ英語にも筆記体・サインなどありますけどね

別アプリとして分けました

URLは以下になります。
http://languageecho.com/hingashi

URLは、「エオルゼア文字版:言語を超える力」とは分けています。「ひんがしの国版:言語を超える力」と言ったところでしょうか。
一つのアプリで実装しても良かったのですが、

  • 明らかにエオルゼア文字の方がデータが多いので、その情報に引っ張られる
  • 機械学習の分類は、種類数が少ない方が精度が上がる。(ただでさえエオルゼア文字だけでも多いのに・・・、ひらがなはもっと多いよ・・・
  • エオルゼア文字とひんがしの国の文字が混ざることは今の所はなさそう

ここで、吉田プロデューサーが「エオルゼアとひんがしの国で異文化交流しようかー」とか言い出したら私は泣きます。


ちなみに、アプリとして分けたといえ、内部的なものはほぼ一緒で共有している部分も多いです。

現在の動作状況

これはまぁ試してほしいということでいいでしょうか・・・・ひどい状態です。
特に文字区切りはほぼできないので、1文字ずつテストしてください。

例えば
f:id:gelehrtecrest:20170711165742p:plain
Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.

これは「よ」です。言語を超える力にかけると

「よ」と翻訳されました http://languageecho.com #FF14 #エオルゼア文字 #言語を超える力 #LanguageEcho

一応正解は出してくれます。
ただ連続した文字とすると、大きく崩れます。ノイズが多いのか、うーん、パラメータ調節だけじゃなんともならなさそうだしなぁ。

今後の予定

とにかくモデルを成長させるためにデータの打ち込みを続けます。
エオルゼア版の方も同時に行いますので、徐々にと御考えください。

それではー


スポンサーリンク