私が個人的にエオルゼア文字翻訳アプリ「言語を超える力」のために、FF14の画像データを物体認識によってエオルゼア文字を英数字にクラス分けするためのデータとして、TensorFlowのファイル形式TFRecordにより画像データを作成しました。
私自身が完成した「言語を超える力」を作れれば良いのですが、他の方により、より良いものが作れるかもしれません。作者としては私よりもより良い翻訳アプリが作成できれば幸いだと考えていますので、画像データを公開したいと思います。
FF14の文字の画像データセット
GitHubのこちらからダウンロード可能です
github.com
公開目的
誰かがエオルゼア文字の翻訳アプリを完成できればそれでいい
基本目的は以前ツイートした内容通りで
「誰でもエオルゼア文字を読める世界を!」
— ゲレの工房 (@gelehrte_crest) 2020年5月31日
「 #言語を超える力 」というアプリを制作しています#FF14 のSSからエオルゼア文字を英数字に変換します
現在アプリ開発のためにエオルゼア文字が入っているSSを募集中#言語を超える力でこのSS読んで
もしくは#languageecho_testSS
でレスお願いします pic.twitter.com/RPzWZ1yKX5
だれでもエオルゼア文字が読める世界ができればそれで良いと考えています。
物体認識や画像認識の一般データとしても使ってもらいたい
TensorFlowでは物体認識や画像認識のデータの需要があります。手書き文字ではMNISTが有名ですね。
yann.lecun.com
本データセットも、画像認識の練習として用いれると思います。もしよろしければ試していただけると幸いです。
tfrecordの見方
tfrecord-viewerなどを使えば見れると思います。こんな感じです。
短いブログですが、今回はここまで。