テスト

テスト

2016-11-01から1ヶ月間の記事一覧

面白そうなブログをリンクしとくの巻

https://dnc1994.com/about/How to Rank 10% in Your First Kaggle Competition | Wille

predict_proba

boschの続きさて相変わらずxgboostと格闘してるわけですが、ふつーにモデル作って、ふつーにfitさせて、predictするんですが、 全然スコアが上がらないんですよねー。 それで、kaggleや、コンペでは常識的なテクニックなのかもしれないですが、どうやらみな…

BOSCHは続く

相変わらず自分用の備忘録こちらのコードを参考にお勉強しております今回のデータは2GBくらいある巨大なデータで、サンプルデータを抽出するにも一苦労なわけですが、迂回するにはこんな風に書くといいよというメモ X = pd.concat([pd.concat([dchunk, nchun…

XGBoostをmacにインストール(python)

python, mac, osxで、XGBoostを導入します。 正確にはwrapperらしいてすが。公式の、gitからcloneするやり方だと、xgboostはインポートできるけど、XGBClassifierが読み込めないよくわからんバグに悩まされたので、メモっときます。 やり方pyplからファイル…

BOSCH その2

それではboschやってきます。参考にしたカーネル https://www.kaggle.com/mmueller/bosch-production-line-performance/road-2-0-4今回のデーターはいかんせん巨大ということで・・・pandas でメモリに乗らない 大容量ファイルを上手に扱う - StatsFragments…

bosch

しばらくRのお勉強をしていました、のでkaggleとpyとは疎遠だったのですが、BOSCHに取り組んでいこうと思います。 Bosch Production Line Performance | Kaggle 僕は右も左もわからんので、まずは人様のカーネルを丸パクリすることから始めようと思います。

House Price3

HousePriceの順位が 324/1441で、 rmse が 0.12102にまで上がったので、一旦まとめようと思います。こんな感じのコードですデータのインポート import pandas as pd import matplotlib.pyplot as plt import numpy as np from scipy.stats import skew train…

パラメーターチューニング

特に書く内容があるわけではないのですが、自分用にパラメーターチューニングのリンク集couseraで、学習曲線の話は一度習ったのですが、忘れかけているので復習。Machine Learning with Scikit Learn (Part II) - 人工知能に関する断創録当面は「sklearnを使…

houses prices2

引き続きhose priseやっていきます。とりあえずlassoとridgeとやらを勉強します。https://www.youtube.com/watch?v=ipb2MhSRGdw簡単に教材ビデオが見つかるなんて良い時代ですね〜http://highschoolstudent.hatenablog.com/entry/2015/02/08/142354 Ridgeと…