コード生成モデルがどんどん進化しているので、簡単にお試しします。そこで、自動でコード生成させるサンプルとして、Karaageさんのcode cokerの記事を思い出しました。有難く利用させていただきます。今回は、githubにあったもともとのnotebookのコードをベースにします。Colab L4環境でQwen2.5-coder:34Bで挑戦です。
結果としては・・・。Kaggleでも有名な解析はやってくれるだろうとは思いましたが、さくっと一通りのコードを提案してくれます。エラーの訂正も頑張ります。データ自体の流出を嫌うケースありますし、ローカルでこのレベルのモデルが使えるのは便利です。CLINEで使ってもかなり実力がありました。
結果:
ollama-pythonで動くように少しだけ手を入れて、あらかじめ、タイタニックデータをtitanic.csvとして用意しました。
kaggleのtitanicを分析してください。対象のデータはtitanic.csvです。
train, testデータに分離して予測モデルを立てて、評価や重要度までグラフ化しました。(結果の一部です)
Accuracy: 0.8212290502793296
Confusion Matrix:
[[91 14]
[18 56]]
Classification Report:
precision recall f1-score support0 0.83 0.87 0.85 105
1 0.80 0.76 0.78 74accuracy 0.82 179
macro avg 0.82 0.81 0.81 179
weighted avg 0.82 0.82 0.82 179
可視化してください。
架空の国の地域ごとの人口比率のデータを可視化してください。日本語でお願いします。
日本の人口の時系列予測をしてくください。20年後までお願いします。
SARIMAモデルを使って以下のように予測しています。