ゲレの日曜工作プログラミング

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

エオルゼア翻訳:データの収集について

エオルゼア翻訳の経過報告続きです。
データセットの拡充が必須なので、増やしていっています。地道な作業です。

記載されている会社名・製品名・システム名などは、各社の商標、または登録商標です。

まず、スクリーンショットから文字画像を切り出します。

f:id:gelehrtecrest:20170508225302p:plain

Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.

これは「Paglthan」と書いてあります。書いてある文字は、なんとかフォント表とか対訳表などで解読します。
あまり聞いたことない地名だったりする場合は、ググります。すると、ある程度のことはわかります。
地名・国名/パガルザン - FF14 Online Wiki

ここで、解読間違っていたら検索にヒットしないです。どうやら今回は解読成功したみたいですね。


次の文字を切り出します。
f:id:gelehrtecrest:20170508230530j:plain

Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.

この文字は「P」です。ラベルづけをします。私はファイル名でラベルづけしました。

P-1494251913-90.jpg

という具合です。

このような地道な作業を繰り返して画像データを集めています。
本当は自動収集できるツールなどがあればいいのですが、難しいですね。

がんばろー