2020年1月29日水曜日

pandas

1日 pandas を触っていました。

データラングリング。近年こう呼ばれているそうです。
今回は機械学習ではなくデータ分析です。以前は EXCEL+VBA で行っていましたが、最近は Python。EXCEL には大きすぎるデータも pandas 一文で読めます。強力ですね。

pandas では EXCELよりも時系列データを扱いやすいと感じています。四半期や曜日で集計したり、移動平均のように起点日を動かしながら過去数日で集計といった処理も可能。多くの機能があり、チートシートも出されています。https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

できたデータを csv や EXCEL のブックにまとめて保存できるので、Python を利用されていない他の方ともデータを共有できます。重宝しています。

他のライブラリも触っていますので、その「作法」に戸惑うこともあります。が、手放せないツールとなりました。
これからもお世話になりましょう。

*****************************************
20200215
基本操作をまとめ直しました。
https://phreeqc.blogspot.com/2020/02/python3-pandas.html

0 件のコメント:

コメントを投稿