ゲレの工房

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

FF14雑記:「Object Detection API」で物体検出し「言語を超える力」でFF14のスクショから英数字をつけたファイルを書き出す進捗報告

前回の記事はこちら

blog.gelehrte.com

今回も私の備忘録です。

前回との変更点

静止画を入力として静止画を出力できるようにしました

前回参考にしたサイトでは、カメラや動画を入力とし、その画面を表示するのをテストコードとして紹介していました。
qiita.com

このテストコードの「object_detection_tf2.py」を改造し、「object_detection_tf2_image2image.py 」としました。

テスト

テストスクリプト
.\env\Scripts\activate
cd .\models\research\object_detection_tools\
python .\scripts\object_detection_tf2_image2image.py -l='../exported_graphs/labels.txt' -m='../exported_graphs/saved_model/' -i='../../../test/input.png' -o='../../../test/output.png'
入力

こちらが

出力

このように表示されます

こう見ると、まだ精度低いですね

今後の予定

AWS Lambda + ECR + S3を使って公開したい

まずはAWS Lambda + ECRの勉強ですね。サーバーレスの開発環境ってまだあまり構築したことないのです。試したいですね。そこから勉強です。

作成したスクリプト

このブログを見に来る人はFF14プレイヤーが多く、プログラマーは少ないと思いますので、最後にスクリプトだけ紹介を。ご興味のある方だけ読んでいただければ嬉しいです。文字に影つけたり、かなり余計なこともしていますけどね。

object_detection_tf2_image2image.py


広告