ゲレの工房

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

FF14雑記:本日の「言語を超える力」精度テストと画像認識で必要なデータ数のお話 2020/06/14

私は「言語を超える力」というFF14用アプリを開発しています。
「言語を超える力」とはFF14スクリーンショットに書かれてあるエオルゼア文字を英数字に変換するためのアプリです。

詳しくはこの記事を
blog.gelehrte.com

さて今日も精度を計るためにテストを行いたいと思います。

また今日は、画像データをなぜたくさん集めなきゃいけないのか、同じ文字の画像データがどうしてたくさん必要なのかについて話をしたいと思います。
あといつものお願いに、お手伝いしやすいお願いを1件増やしました!

画像認識でデータ数はどれくらい必要か

手書き文字認識で使われるMNISTのデータ数はどれくらいか

まずMNISTというのをご存じでしょうか?
MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
簡単に言うと、画像認識のシステムをテストするために使われる、手書き文字のデータセットです。
画像認識で使われるMINSTのデータセット
エオルゼア文字を英数字に変換する「言語を超える力」を考える場合、よいサンプルデータ数になると思います。

このデータセットは初心者向けで、実際にはもっとたくさんのデータが必要と言われています。

そのMINSTデータですら

  • 6万枚の訓練データ用(画像とラベル)
  • 1万枚のテストデータ用(画像とラベル)
  • 合計7万枚

ほどの画像データが入っているのです!

現在どれくらいのデータが集まっているか

Watson Visual Recognitionの場合、1枚の画像に対して複数のラベルを付けているので一概に評価できないのですが
2020/06/14時点で

  • 画像は275枚
  • 1枚の画像あたり、平均20個のラベル
  • 275*20=5500

現在、約5500枚のデータが集まっていることになります。

足りないですね!

むしろこの計算をしてみて、私、自分でよくこれだけのデータを集めたなと驚いていたりしますノ`・ω・)ノ
それはさておき、今後も皆さんのご協力によって成り立ちますので、画像データの収集にご協力願えればと思います。

2020/06/14の進捗

テストしようとした画像

こちらでテスト。
FF14雑記:本日の「言語を超える力」精度テストと画像認識で必要なデータ数のお話 2020/06/14
今日のテスト評価はどうなるでしょうか?

「言語を超える力」の結果

FF14雑記:本日の「言語を超える力」精度テストと画像認識で必要なデータ数のお話 2020/06/14
Copyright (C) SQUARE ENIX CO., LTD. All Rights Reserved.

評価

  • エオルゼア文字 6文字
  • 「言語を超える力」が文字と認識できた数:2文字=約33.3% (誤認識0文字)
  • 「言語を超える力」が正しい英数字を判別できた数:1文字=約16.7%

考察

下段の数字がたまたま正しい英数字が当たったパターンですね。
こういうパターンでもいいから、成功率を上げていきたいものですノ`・ω・)ノ
毎日お祈りモードです。

お手伝いして欲しいこと

ここからはいつものお願いです。
皆様にお手伝いして欲しいことがあります。

記事の一番下のブログランキングボタン

ブログランキングに参加するようにしました。
ボタンをポチっと押していただけるだけでも、いろんな人にこの記事を見てもらえる、この活動を見てもらえるので、お手伝いとしても嬉しいです!
スクリーンショットの提供が難しい場合は、ポチっと押していただけるだけでも励みになります!

皆様の読んでもらいたいエオルゼア文字の入ったスクリーンショットの提供

「言語を超える力」はたくさんのスクリーンショットを読み込み、学習し、より精度を増します。
もしよろしければ、皆様のエオルゼア文字の入ったスクリーンショットを提供していただけると嬉しいです。

最近少しずつスクリーンショットをいただけるようになりました!ありがとうございます!

ハッシュタグ#言語を超える力でこのSS読んで もしくは #languageecho_testSS で投稿していただけると嬉しいです。
できるだけ毎日ハッシュタグをチェックして、学習データに組み込みたいと思います。

お返しに何かできれば良いのですが、申し訳ないですが無償の提供をいただければ幸いです。
より良い「言語を超える力」のアプリ提供をできることが、何よりの感謝の気持ちの表現とさせていただければ嬉しいです。

どうぞよろしくお願いします。

過去の関連記事

過去の関連記事はこちらです。
blog.gelehrte.com


広告