テスト

テスト

2016-01-01から1年間の記事一覧

outbrain、一週間経過

outbrain やってまーすhttps://www.kaggle.com/c/outbrain-click-predictionBOSCHはデータが大きすぎて勉強には向いてないかなー、 あと飽きてきてたので、コンペ変えました。 なんというか、一週間かかって、ようやく全体像がわかったような感じです。フォ…

面白そうなブログをリンクしとくの巻

https://dnc1994.com/about/How to Rank 10% in Your First Kaggle Competition | Wille

predict_proba

boschの続きさて相変わらずxgboostと格闘してるわけですが、ふつーにモデル作って、ふつーにfitさせて、predictするんですが、 全然スコアが上がらないんですよねー。 それで、kaggleや、コンペでは常識的なテクニックなのかもしれないですが、どうやらみな…

BOSCHは続く

相変わらず自分用の備忘録こちらのコードを参考にお勉強しております今回のデータは2GBくらいある巨大なデータで、サンプルデータを抽出するにも一苦労なわけですが、迂回するにはこんな風に書くといいよというメモ X = pd.concat([pd.concat([dchunk, nchun…

XGBoostをmacにインストール(python)

python, mac, osxで、XGBoostを導入します。 正確にはwrapperらしいてすが。公式の、gitからcloneするやり方だと、xgboostはインポートできるけど、XGBClassifierが読み込めないよくわからんバグに悩まされたので、メモっときます。 やり方pyplからファイル…

BOSCH その2

それではboschやってきます。参考にしたカーネル https://www.kaggle.com/mmueller/bosch-production-line-performance/road-2-0-4今回のデーターはいかんせん巨大ということで・・・pandas でメモリに乗らない 大容量ファイルを上手に扱う - StatsFragments…

bosch

しばらくRのお勉強をしていました、のでkaggleとpyとは疎遠だったのですが、BOSCHに取り組んでいこうと思います。 Bosch Production Line Performance | Kaggle 僕は右も左もわからんので、まずは人様のカーネルを丸パクリすることから始めようと思います。

House Price3

HousePriceの順位が 324/1441で、 rmse が 0.12102にまで上がったので、一旦まとめようと思います。こんな感じのコードですデータのインポート import pandas as pd import matplotlib.pyplot as plt import numpy as np from scipy.stats import skew train…

パラメーターチューニング

特に書く内容があるわけではないのですが、自分用にパラメーターチューニングのリンク集couseraで、学習曲線の話は一度習ったのですが、忘れかけているので復習。Machine Learning with Scikit Learn (Part II) - 人工知能に関する断創録当面は「sklearnを使…

houses prices2

引き続きhose priseやっていきます。とりあえずlassoとridgeとやらを勉強します。https://www.youtube.com/watch?v=ipb2MhSRGdw簡単に教材ビデオが見つかるなんて良い時代ですね〜http://highschoolstudent.hatenablog.com/entry/2015/02/08/142354 Ridgeと…

houses prises

https://www.kaggle.com/c/house-prices-advanced-regression-techniqueshouses prisesをやっていきます。 と思ったのですが、あまりに知識がないので、couseraを二週間強ぐらいやってました。Ang先生に、とりあえず動くものを作るのがいいよと習ったので、…

こんな私でもDeepNN

本日のタスク https://www.kaggle.com/najeebkhan/leaf-classification/neural-network-through-keras/commentsこちらの記事を参考にDNNがどんなものなのかぼんやりと把握しようと思います。とりあえず、pyenv→anaconda→theano→kerasの順番でインストールし…

leaf classification

https://www.coursera.org/learn/machine-learning/home couseraのmachine learnigコースやってました。 Andrew Ng先生の説明が直感的で非常に分かりやすいです。 日本語の字幕もあるし、機会学習を始めた時に、一番最初にやれば良かったなってくらい良い教…

pythonとkaggle

をやっていこうと思います。 全くの初心者から独学を始めてから半年が過ぎ、多数のブログに散々お世話になってきたので、自分の勉強内容をまとめてみたら、どこかの誰かの役に立つのかなと。 あまりにも初歩的な内容で記事にするのが恥ずかしいですが・・・。