【雑記】kaggleで遂にCompetitions Expertになった

kaggle By Output不足なエンジニア

※やったぜって思った勢いで書いただけなので中身ないです。(いつもないかも知れませんが。。)

Deep Learningと機械学習を始めて1年ちょい経過しました。先日終了したSeverstal: Steel Defect Detection コンペでブロンズだったので以前のHumpback Whale Identification でのシルバーと合わせて2メダル獲得したのでCompetitions Expertとなりました。

コンペ終了間際に追加したモデルを含めたアンサンブル結果がPublic LB低かったので「せっかく作ったのにな〜」とか思いながら最終評価に使わない選択をしてしまったのですが、使わなかったsubmitを選んでいたらシルバーだっただけに、ちょっと悔しいです。
ただ、実際にモデルを組み込んだアプリケーションをデプロイするときも同じですよね。本番での成績って学習と評価データでは測れないので、いかにOverfittingを抑えて学習させられるか、強固なCVを作るかが重要なんだと思います。
それにしても今回のshakeは酷いと思いますが。。。Top5のうち3人が40位以上ランク上がってますからね。。。Top1は10位しか上がってないのでかなり強固な評価方法を確立できていたのだと思います。

また、実際のアプリケーションではリリースして思ったほど精度が出ない場合に簡単にモデルを差し替え可能とするような設計が重要だと思っています。
会社でAWS利用のバッドプラクティス代表例みたいなシステムの改修をしていますが、ちょっとした変更にソースの大改造が発生してしまうシステムなので、気軽な変更ができません。
マイクロサービス化、疎結合って設計・製造時は苦労しますが、その他の全工程が楽になるのでもう少しその良さを周りに訴えかけて文化として根付かせていきたいところです。
(もっと仕事が楽になれば定期的にkaggleコンペ出れると思うのですが、、、流石に電車ないでコンペのソースを書くのはきつい。)


カテゴリー:kaggle

Output不足なエンジニア

統計が好きになれず、機械学習やったら必然的に統計が必要になるだろうと思ったら想像以上に機械学習にハマる。数学は芸術なので商売にするつもりはないけど、DeepLearningは数学じゃないし商売にしたいと思っているところ。画像処理がメイン。