エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
queryとbool型のSeries指定によるDataFrameのからのデータ抽出速度の差【pandas】 - ぴよぴよ.py
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
queryとbool型のSeries指定によるDataFrameのからのデータ抽出速度の差【pandas】 - ぴよぴよ.py
pandasで条件を指定して抽出を行うとき、df[df['Age'] < n]とdf.query('Age < @n') で同じことができる... pandasで条件を指定して抽出を行うとき、df[df['Age'] < n]とdf.query('Age < @n') で同じことができるけれど、 どれくらい実行時間に差があるか気になったので調べた。 使用データ 使ったデータ: 2000行弱のデータ。 Colon function | R Documentation import pandas as pd df = pd.read_csv('colon.csv', index_col=0) df.loc[0:3, ['id', 'study', 'rx', 'sex', 'age']] id study rx sex age 1 1 1 Lev+5FU 1 43 2 1 1 Lev+5FU 1 43 3 2 1 Lev+5FU 1 63 測定 Seriesを指定して抽出 %%time for i in range(20): for ag