ラフ集合は初めてです。統計かな?と思っていましたが、集合論でしょうか。難しい理論や数式はなく、数学というよりは国語の問題を扱っている感覚でした。
R でラフ集合を扱えるパッケージは以下の2種類のようです。
・RoughSetKnowledgeReduction
・RoughSets
マニュアルの薄い前者のほうから試用してみました。
が、計算遅すぎ。数千のテストデータのルール抽出計算が1日で終わりません。シングルコアで頑張っていたようですが、2日目にオーバーフローを吐き出し止まっていました。
次に、後者を試用。
こちらはリファレンスを追いながら、なんとか1日で上近似・下近似・極小条件を出すところまで到達。こちらもシングルコアでしたが、C++ を利用しているのか計算が早い。同じ数千のデータでも、読み込み~計算~結果の書き出しまで20秒ぐらいでした(ルール抽出は行っていませんので負荷が異なりますが)。こちらをメインに触っていきましょう。
R も 並列化、GPU利用などによる高速化に着手されているようですが、全体的にはこれからのようです。Web・Twitter などのビッグデータを収集・分析するようなことも始められていますので、今後、適用は進むでしょう。
RoughSet のいくつかの計算は、並列化・高速化の組み込みに関して有利だと思います。今後に期待しましょう。
0 件のコメント:
コメントを投稿