ゲレの工房

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

エオルゼア翻訳:文字認識したいだけなんだ:

ゲレです。

人工知能の一分野として画像認識があります。

最近では、スマホアプリレベルでも顔認識とかで使われていて、馴染み深いかと思います。

 

今回は画像認識を文字認識として使います。

文字認識のチュートリアルとしてMINSTというのがあります。MNISTとは、手書きの数字を学習して判別するものです。TensorflowのチュートリアルにMNISTが含まれているのですぐにテストできます。

 Tensorflowのインストールはここの記事を参考にしました。

senyoltw.hatenablog.jp

 

次に、MINSTを学習させてみます。

以下の記事を参考にしました。

nextdeveloper.hatenablog.com

 

で、試してみたのですが、うまく動きませんでした。

どうやらデータセットをダウンロードするときに、データセットダウンロード先が落ちている様子。

github.com

また明日やろう。 

 

予定:

  • MINSTと同じようにエオルゼアの文字データセットを作れば、エオルゼアの文字認識できるんじゃないかな。
  • データセットは、エオルゼアの文字フォントを作っているひとがいるので、フォントを利用してみよう。
  • カラーの文字を認識させるのは難しいから、canvas上の画像を白黒に変換させたい。

白黒変換はこの辺りを参考に

www.moongift.jp

 

余談:

ここのまでの記事を読んで、「え、そこからの勉強?」ってツッコミが来るかもしれません。はい、そこからの勉強です。

Tensorflowの存在自体は知っていましたし、私自身人工知能の勉強はしてきていたのである程度の用語は理解できるのですが、リアル仕事でTensorflowを使う機会がなかったのです。この機会に使ってみたかったのですよ。


広告