エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
train_test_split() の stratify パラメータを使って層化サンプリングをする - kakakakakku blog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
train_test_split() の stratify パラメータを使って層化サンプリングをする - kakakakakku blog
データセットを分割するときに scikit-learn の train_test_split() をよく使う.今回は train_test_spl... データセットを分割するときに scikit-learn の train_test_split() をよく使う.今回は train_test_split() に設定できる stratify パラメータを試す.stratify は「層化」という意味で「データセットの特性を考慮した分割」とも言える.特に「不均衡データセット」を使うときに重要になる. scikit-learn.org train_test_split() をデフォルト設定で使う train_test_split() のデフォルト設定を抜粋すると以下のようになる.stratify はデフォルトで None になる. train_size = 0.75(トレーニングデータ 75 %) test_size = 0.25(テストデータ 25 %) shuffle = True(ランダムに分割する) stratify = None(層化なし