分類学習は、実用レベルにちかづいてきている。
たくさんの認識/分類すべき対象が映り込んでいる画像から、正しくそれらを認識することは難しいが、ここ数年で、SSDやらMask RCNNなどの手法が出てきて見通しが明るくなってきているようだ。幾つか実装がGITHUBなどで公開されているが、Mask RCNNはメモリをアホのように喰うので私の環境のみならず、Google Colaboratoryでも動かない。
FacebookのFAIRグループが提供しているPyTorchベースのDetectronだと動くのかもしれないが、まだ手を付けていない。でもFast-RCNNは動いたと思う。
それに対して、若干落ちるSSDは、Caffeをいじって提供されているが、TensorflowやKerasでも実装されており、こちらはどうにかColabでも動作する。が、計算量が半端なくて1週間ほどかかりそうだ。
このような分類学習を突き詰めていくと、実社会では3次元空間の中にどう存在するのかというのまで行かなければならないし、先は長い。でも流石に金が集まっているだけ有って進みは速い。Google、Facebook, Microsoftなどが進んでいるのは流石。
0 件のコメント:
コメントを投稿