私は画像認識技術を使って、FF14というゲームに使われている文字「エオルゼア文字」を英数字に変換するアプリ「言語を超える力」を作ろうとしています。
エオルゼア文字と英数字は1対1対応しているので、画像認識で英数字のクラスに分類するシステムを作ればいいという発想です。
今までは自分でTensorFlowを使ってディープラーニングを行っていたのですが、私の技術不足だと思いますが、精度が低いものになってしまいました。
そこで、次の記事を注目。
blog.apar.jp
IBMの画像認識ツールを試せるようですね。
そこで早速試してみました。今回はその話です。
まずは何も学習させない状態でテスト
下記の結果が得られました。ちょっと長いけどご容赦を。
中身を見る限り、「electrical device」(電気デバイス?)と認識されてしまったようです。
{ "images": [ { "classifiers": [ { "classifier_id": "default", "name": "default", "classes": [ { "class": "circuit board", "score": 0.578, "type_hierarchy": "/electrical device/computer circuit/circuit board" }, { "class": "computer circuit", "score": 0.755 }, { "class": "electrical device", "score": 0.757 }, { "class": "disk controller", "score": 0.553, "type_hierarchy": "/controller/disk controller" }, { "class": "controller", "score": 0.558 }, { "class": "central processing unit", "score": 0.535 }, { "class": "PC board", "score": 0.501, "type_hierarchy": "/electrical device/computer circuit/PC board" }, { "class": "CPU board", "score": 0.5, "type_hierarchy": "/electrical device/computer circuit/CPU board" }, { "class": "electronic equipment", "score": 0.6 }, { "class": "memory device", "score": 0.599 }, { "class": "microchip", "score": 0.592 }, { "class": "jade green color", "score": 0.838 }, { "class": "emerald color", "score": 0.787 } ] } ], "source_url": "https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/640px-IBM_VGA_90X8941_on_PS55.jpg", "resolved_url": "https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/640px-IBM_VGA_90X8941_on_PS55.jpg" } ], "images_processed": 1, "custom_classes": 0 }
学習させてみた
画像認識の学習データは揃っている
今までの「言語を超える力」アプリ制作活動で、学習データは揃っています。
もしダウンロードしてみたい方は、下記のURLからどうぞ。
blog.gelehrte.com
Watsonで学習
ブラウザ上で学習作業ができるのはありがたいですね。
クラスを作って、そこに画像データを入れて、あとは学習させるだけ。
ただ時間はかかるようです。まぁ画像データが多いですからね。当たり前か。
Freeプランでやっているのでしょうがないですね。ゆっくり待ちましょう。
またいずれ結果が出たら報告したいと思います。
今回はここまで。
それではー