ゲレの工房

ゲーム好きの中の人が、自分が作りたいアプリを作る記録です

機械学習 : 言語を超える力のデータセット公開について

今回はアンケートを取りたいなと思っています。
これまで私は、独学で機械学習・TensorFlow・ディープラーニングなどを学んできました。(これらは並列して並べるものではない気がしますが
エオルゼア翻訳 カテゴリーの記事一覧 - 日曜プログラミング
Neural Network Console カテゴリーの記事一覧 - 日曜プログラミング

そのなかで感じたこととしては、機械学習に使うデータセットって重要だね。」ということです。
今回は、言語を超える力のデータセットを公開しようかなと考えています。
データはこんな画像ファイルです。

f:id:gelehrtecrest:20170420174755p:plain

記載されている会社名・製品名・システム名などは、各社の商標、または登録商標です。
Copyright (C) 2010 - 2017 SQUARE ENIX CO., LTD. All Rights Reserved.

経緯と目的

前述のとおりですが、データセットの重要性を考えてのことです。ここで2つの目的があります。

データの改善

自分のデータセットを見てもらって、おかしい点などをツッコミ入れてもらったり、新たにデータセットの追加協力をお願いしたいということもあります。
私の一番の目的がここにあると思っています。

データの再利用

私以外にデータセットを使って、何らかのシステムを組みたい人用にデータを使ってもらいたい。たぶんテスト用になら使えるはず。
現在はTensorFlow用とNeural Network Console用を考えています。(わける理由もないですが)

利用規約

データセットファイナルファンタジーXIVの二次創作にあたります。
(まず間違いないと思います。このあたりはもう少し調べます。)
ですので、二次創作を利用するにあたっての利用規約などを準拠する必要があります。

ファイナルファンタジーXIV サポートセンター

特に「商用・営利目的に使用しないこと」、「権利表記を表記すること」などが重要になると思います。
スクウェア・エニックス様から警告が来たらサービス停止・公開停止を行います。

アンケート

アンケートを取りたいと思います。アンケートはTwitter上で行います。(はてなでのアンケートは有料っぽいし、Twitterなら無料でできるかなと。あと拡散しやすい。)
主に3つです。
アンケート開始は本日夜から2017/09/01までには行います。(リアルな予定次第)
回答期限は一週間としますが、期限後もアンケートにレスもしくはこのブログにコメント・DM・メールなども受け付けます。
本ブログにもアンケートを追記します。

そもそもデータセット欲しい?

あまり欲しい人がいなければ公開しないようにしたいと思います。
また利用規約や法律に反する形にはしたくないので、その他も聞きたいと思います。

  • あなたの好きにすればいい
  • 欲しい
  • 必要ない/利用規約や法律に反するので公開しないほうがいい
  • その他(レスに詳細を書いてください)

追記:アンケート公開

欲しい場合に公開方法について

堂々と欲しい人や、こっそり欲しい人もいるかもしれませんので

  • GitHub
  • 固定ページにダウンロードリンク
  • 何らかの共有クラウドサービス
  • その他(レスに詳細を書いてください)

追記:アンケート公開


配布に関する問題

  • 特に問題ないと思う
  • FF14利用規約に抵触している気がする。
  • 配布しないほうが、あなたの功績的にいいんじゃないの?
  • その他(レスに詳細を書いてください)

そもそも功績があるのかどうか不明ですが・・・・

追記:アンケート公開


個人的には、GitHub上と固定ページで公開予定。
固定ページは、はてなブログと言語を超える力アプリに置きたいと思っています。

アンケートの評価基準は、私の独断と偏見で決めさせてください。(本当に使いたい人が少しでもいれば、何らかの形で公開しようかなと考えています。)
なお、ソースコード(言語を超える力)の方の公開は考えていません。ご了承ください。(ソースコードがあまりに汚いので、人に見せられない。)

今後とも、ご迷惑をおかけすると思いますが、よろしくお願いします。

雑感

思えば、大学時代もデータセットの開発を研究課題にしてたなぁ・・・・これも運命か


広告