IBMのWatson Visual Recognition（画像認識）でエオルゼア文字を認識させようとしてみた（その２）

前回の記事の続きです。FF14のエオルゼア文字を英字に翻訳するアプリ「言語を超える力」のシステムに、Watsonを組み込もうという話です。
今回の記事は進捗報告および備忘録になります。

実際にどれくらいの画像認識ができるのかを見てみました。
例えば次の文字は「a」に当たる文字なのですが
f:id:gelehrtecrest:20200201171900p:plain

認識結果でちゃんと「a」ですよというスコアが返ってきました。
f:id:gelehrtecrest:20200201171955p:plain
ひとまず、かなりの精度でWatsonは画像認識してくれることが確認できました。

このまま複数の文字列を認識させようかと思ったのですがどうやらうまく行かない様子。
これは「ab」という文字列
f:id:gelehrtecrest:20200201172058p:plain

うまく行きませんね
f:id:gelehrtecrest:20200201172113p:plain

今まではVisual RecognitionのモデルをClassify Imagesで作っていました。どうやらDetect Objectsでモデルを作る必要があるようです。私の勉強不足ですね。
f:id:gelehrtecrest:20200201172631p:plain

ということで作業中です。
数千の画像を一つずつラベル付けせねば・・・・・結構手間がかかりそうです。
f:id:gelehrtecrest:20200201173006p:plain

こちらの記事を参考にしています。
qiita.com

どうやら、ある程度ラベル付けをサポートしてくれる機能もあるようですね。活用してみたいと思います。

実は、Watsonでの作業を行う前に、クレジットカードの関係でIBMアカウントが凍結したりなど、作業が滞っていました。
それも一段落したし、やっと作業に打ち込めそうです。
がんばろー

ゲレの工房