エオルゼア翻訳の経過報告続きです。
データセットの拡充が必須なので、増やしていっています。地道な作業です。
記載されている会社名・製品名・システム名などは、各社の商標、または登録商標です。
まず、スクリーンショットから文字画像を切り出します。
Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.
これは「Paglthan」と書いてあります。書いてある文字は、なんとかフォント表とか対訳表などで解読します。
あまり聞いたことない地名だったりする場合は、ググります。すると、ある程度のことはわかります。
地名・国名/パガルザン - FF14 Online Wiki
ここで、解読間違っていたら検索にヒットしないです。どうやら今回は解読成功したみたいですね。
次の文字を切り出します。
Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.
この文字は「P」です。ラベルづけをします。私はファイル名でラベルづけしました。
P-1494251913-90.jpg
という具合です。
このような地道な作業を繰り返して画像データを集めています。
本当は自動収集できるツールなどがあればいいのですが、難しいですね。
がんばろー