ひんがしの国の文字の言語を超える力対応、現在遂行中です。
現在の対応状態について報告します。
進捗報告
とりあえず、小さなモデルは作った
以前の記事で紹介させていただきました先人様の記事を再掲します。
50音表(暫定版)できたよ!
— れっといっとびぃ💠Ele槍 (@Levi_gungnir) June 23, 2017
※推測部分もあり、100%合っているとは限りません pic.twitter.com/kH7tdvkoHo
このツィートおよびレスにいくつか既に翻訳していただいた文字を載せていただいていますので、そのデータを参考にデータの打ち込みを行いました。
また、翻訳結果を日本語で表示、縦読み対応などを行いました。
ただやはり、文字区切りは難しいです。 日本語の達筆文化・崩し文字文化がががー (まぁ英語にも筆記体・サインなどありますけどね
別アプリとして分けました
URLは以下になります。
http://languageecho.com/hingashi
URLは、「エオルゼア文字版:言語を超える力」とは分けています。「ひんがしの国版:言語を超える力」と言ったところでしょうか。
一つのアプリで実装しても良かったのですが、
- 明らかにエオルゼア文字の方がデータが多いので、その情報に引っ張られる
- 機械学習の分類は、種類数が少ない方が精度が上がる。(ただでさえエオルゼア文字だけでも多いのに・・・、ひらがなはもっと多いよ・・・
- エオルゼア文字とひんがしの国の文字が混ざることは今の所はなさそう
ここで、吉田プロデューサーが「エオルゼアとひんがしの国で異文化交流しようかー」とか言い出したら私は泣きます。
ちなみに、アプリとして分けたといえ、内部的なものはほぼ一緒で共有している部分も多いです。
現在の動作状況
これはまぁ試してほしいということでいいでしょうか・・・・ひどい状態です。
特に文字区切りはほぼできないので、1文字ずつテストしてください。
例えば
Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.
これは「よ」です。言語を超える力にかけると
「よ」と翻訳されました http://languageecho.com #FF14 #エオルゼア文字 #言語を超える力 #LanguageEcho
一応正解は出してくれます。
ただ連続した文字とすると、大きく崩れます。ノイズが多いのか、うーん、パラメータ調節だけじゃなんともならなさそうだしなぁ。