ゲレの工房

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

試行錯誤編: IBMのWatson Visual Recognition(画像認識)でエオルゼア 文字を認識させようとしてみた(その4)

前回の記事の続き
blog.gelehrte.com

IBMのWatsonの画像認識を使って、FF14で使われているエオルゼア文字を英数字に変換するアプリ「言語を超える力」を作ろうとしています。
今回の記事は、どんな作業をやっているかのお話です。
WatsonのVisual Recognitionがどんな作業になるかの参考にもなれば幸いです。

前提知識:エオルゼア文字と英数字の関係性について

エオルゼア文字は英数字に1対1対応しています。
対応表についてはこちらのブログが参考になります。

aruhya.net

WatsonのVisual Recognitionを使って、どうやってエオルゼア文字を英数字に変換するか

スクリーンショットから英数字に対応する部分を取り出して学習させる

WatsonにFF14スクリーンショットを学習させて、その中のエオルゼア文字部分を英数字に分類させることを目指します。

実際にどんな作業になるか

まず、FF14スクリーンショットを用意

これは、FF14のナル回廊という場所の地図です。
ウルダハのナル回廊

1文字ずつエオルゼア文字に英数字のタグをつける

私は小文字の「o」に「small-o」というタグをつけています。
WatsonのVisual Recognitionでエオルゼア文字に「small-o」のタグをつける

これを1文字ずつやりますノ`・ω・)ノ

なかなか大変です。
WatsonのVisual Recognitionには自動タグ付けも用意されていますが、学習データが少ない状態ではほとんど機能しません。
特に今回は英数字の分類ですからね。
分類数が多すぎます。

タグ途中でVisual Recognitionの画面が重くなる

一つの画像にタグを沢山つけようとすると、ブラウザが重くなります。
一つの画像にタグを沢山つけようとすると、Visual Recognitionのブラウザが重く

これは、契約しているプランによって違うと思います。
前回の記事で書きましたが、私はLiteプランで作業をしています。
Visual Recognition Liteプラン

標準プランだと軽くなるかもしれません。
ただ、Liteプランでもストレスがかかるほどの時間はかかりません。個人の感想ですけどね。

待てば固まった状態から戻ってきます。
ゆっくり待ちましょう。

一つの地図にタグ付けした状態がこちら

こんな感じになります。
WatsonのVisual Recognitionで一つの地図にタグ付けした状態
四角い色のついたマーク一つ一つがタグですノ`・ω・)ノ
多いですね!

一つの画像が終わったら、次の画像へ

ただひたすら続けるしかないですね。
タグ付けは地道な作業です。

あと、この方法が将来的に上手くいくかどうかは不明ですノ`・ω・)ノw
正直不安です。

でもWatsonを信じて、タグ付けを頑張り続けたいと思います。
応援いただければ嬉しいです。

終わりに

随時、進捗状況などを公開したいと思います。
こういう方法がいいよ、とか、こんな方法があるよなど、色々な情報もお待ちしていますノ`・ω・)ノ
また、本当に応援いただけるととても嬉しいですノ`・ω・)ノ

また何か、進展が見られたらいいな。


広告