「誰でもエオルゼア文字を読める世界を!」
私は「言語を超える力」というアプリの開発を進めています。
FF14のSSからエオルゼア文字を英数字に変換することを考えています。
そこで、今日の昼間にこのような記事を見かけました。
nlab.itmedia.co.jp
記事と、DeepLのサイトを少し読ませていただきましたので、その感想と「言語を超える力」にどのように組み込むかについて書きたいとおもいます。
はじめに
私が開発している「言語を超える力」とは
エオルゼア文字を英数字に変換するアプリを作ろうとしています。
エオルゼア文字とはFF14というゲームに使われている文字で、英数字に1対1対応されます。
画像引用元はこちら エオルゼア文字対照表で新しい地図を解読しよう!【2017】 | のほほん旅日記
変換のために、現在画像認識を利用することを考えていて、Watson Visual Recognitionの利用を試しているところです。
www.ibm.com
現在は、有志の方の助けを借りて、FF14のスクリーンショットを集め、そのスクリーンショットに画像認識のためのタグ付けを行っています。
日々の作業経過については私の過去の記事を読んでいただけると嬉しいです。
blog.gelehrte.com
「言語を超える力」で「DeepL API」をどう使うか
「DeepL Pro」
「DeepL Pro」はDeepLが提供する有料のサービスです。
データの機密性確保や翻訳支援ツールなど様々なサービスを提供してくれます。
画像引用元 DeepL Pro
「DeepL Pro」は個人向け・チーム向け・開発者向けのそれぞれに対してサービスを提供していますが、この中の開発者向けに提供されている「DeepL API」に今回注目しました。
「言語を超える力」で「DeepL API」をどう使うか
機械翻訳を使わなかった場合、「言語を超える力」は
- スクリーンショットを読み込む
- 画像認識で英数字だと判定する
- 英数字を表示する
という流れになります。
もちろんこれでもいいのですが、これだと正しい英数字になっているか不明です。
というのも、画像認識は複数の候補を出すことがあるので、その候補の中から正しい英数字の羅列を選択する必要があるのです。
ここで「DeepL API」を使うことで
- スクリーンショットを読み込む
- 画像認識で英数字の候補を出力する
- 英数字を「DeepL API」で日本語に変換する
- 変換した後、正しい日本語になっている英数字を選び出す
- 選び出された英数字を正しい変換として表示する
などができそうです。
また、そのまま日本語として変換された結果を表示するだけでも十分なツールになるとも思います。
まぁ、上記の「正しい日本語になっている英数字を選び出す」をどうやるかが不明ですけどね。
自然言語処理的に、正しい日本語になっている文字列を調べるのかなぁ・・・・うーん。
もちろん、DeepLで日本語にする前に、正しい英数字になっているかをチェックする機能があってもいいですけどね・・・・うーん。
少なくとも、「言語を超える力」に組み込むと面白そうな機能であることは確かです。
比較:Google翻訳で同じことはできないか?
もちろんGoogle翻訳で同じことができます。
が、大きな違いとして、Google翻訳は従量課金なのです。
とても多くの人が利用した場合、月々の使用料金が大変なことになるのです。
cloud.google.com
対して「DeepL API」は月額固定なのである程度安心できます。
この差は大きいと思います。
終わりに
現状、まだ私の開発している「言語を超える力」は「DeepL API」を使用して開発ができるほど、開発進捗が進んでいません。
今回の記事は備忘録として、今の私の考えを残しておきたいと思い書きました。
また今後の予定が見えてきた時に、主に自分の役に立てればいいなと思っています。