ゲレの工房

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

IBMのWatson Visual Recognition(画像認識)でエオルゼア 文字を認識させようとしてみた(その2)

前回の記事の続きです。FF14エオルゼア文字を英字に翻訳するアプリ「言語を超える力」のシステムに、Watsonを組み込もうという話です。
今回の記事は進捗報告および備忘録になります。

blog.gelehrte.com

進捗報告

単体の文字はできるようになりました

実際にどれくらいの画像認識ができるのかを見てみました。
例えば次の文字は「a」に当たる文字なのですが
f:id:gelehrtecrest:20200201171900p:plain

認識結果でちゃんと「a」ですよというスコアが返ってきました。
f:id:gelehrtecrest:20200201171955p:plain
ひとまず、かなりの精度でWatsonは画像認識してくれることが確認できました。

単語列ではこのままでは出来なさそう

このまま複数の文字列を認識させようかと思ったのですがどうやらうまく行かない様子。
これは「ab」という文字列
f:id:gelehrtecrest:20200201172058p:plain

うまく行きませんね
f:id:gelehrtecrest:20200201172113p:plain

解決策

複数の画像を扱うときはDetect Objects

今まではVisual RecognitionのモデルをClassify Imagesで作っていました。どうやらDetect Objectsでモデルを作る必要があるようです。私の勉強不足ですね。
f:id:gelehrtecrest:20200201172631p:plain

Detect Objectsでモデルを作り始めました

ということで作業中です。
数千の画像を一つずつラベル付けせねば・・・・・結構手間がかかりそうです。
f:id:gelehrtecrest:20200201173006p:plain

参考記事

こちらの記事を参考にしています。
qiita.com

どうやら、ある程度ラベル付けをサポートしてくれる機能もあるようですね。活用してみたいと思います。

終わりに

実は、Watsonでの作業を行う前に、クレジットカードの関係でIBMアカウントが凍結したりなど、作業が滞っていました。
それも一段落したし、やっと作業に打ち込めそうです。
がんばろー


広告