試行錯誤編： IBMのWatson Visual Recognition（画像認識）でエオルゼア文字を認識させようとしてみた（その４）

前回の記事の続き
blog.gelehrte.com

IBMのWatsonの画像認識を使って、FF14で使われているエオルゼア文字を英数字に変換するアプリ「言語を超える力」を作ろうとしています。
今回の記事は、どんな作業をやっているかのお話です。
WatsonのVisual Recognitionがどんな作業になるかの参考にもなれば幸いです。

エオルゼア文字は英数字に1対1対応しています。
対応表についてはこちらのブログが参考になります。

WatsonにFF14のスクリーンショットを学習させて、その中のエオルゼア文字部分を英数字に分類させることを目指します。

これは、FF14のナル回廊という場所の地図です。
ウルダハのナル回廊

私は小文字の「o」に「small-o」というタグをつけています。
WatsonのVisual Recognitionでエオルゼア文字に「small-o」のタグをつける

これを1文字ずつやりますﾉ`・ω・)ﾉ

なかなか大変です。
WatsonのVisual Recognitionには自動タグ付けも用意されていますが、学習データが少ない状態ではほとんど機能しません。
特に今回は英数字の分類ですからね。
分類数が多すぎます。

一つの画像にタグを沢山つけようとすると、ブラウザが重くなります。
一つの画像にタグを沢山つけようとすると、Visual Recognitionのブラウザが重く

これは、契約しているプランによって違うと思います。
前回の記事で書きましたが、私はLiteプランで作業をしています。
Visual Recognition Liteプラン

標準プランだと軽くなるかもしれません。
ただ、Liteプランでもストレスがかかるほどの時間はかかりません。個人の感想ですけどね。

待てば固まった状態から戻ってきます。
ゆっくり待ちましょう。

こんな感じになります。
WatsonのVisual Recognitionで一つの地図にタグ付けした状態
四角い色のついたマーク一つ一つがタグですﾉ`・ω・)ﾉ
多いですね！

ただひたすら続けるしかないですね。
タグ付けは地道な作業です。

あと、この方法が将来的に上手くいくかどうかは不明ですﾉ`・ω・)ﾉｗ
正直不安です。

でもWatsonを信じて、タグ付けを頑張り続けたいと思います。
応援いただければ嬉しいです。

随時、進捗状況などを公開したいと思います。
こういう方法がいいよ、とか、こんな方法があるよなど、色々な情報もお待ちしていますﾉ`・ω・)ﾉ
また、本当に応援いただけるととても嬉しいですﾉ`・ω・)ﾉ

また何か、進展が見られたらいいな。

ゲレの工房