Python復帰1日目の感想:モダンExcel vs pandas/matplotlib/seaborn

モダンExcelでストレスだったのは、何でも、テーブルで物事を考えなければならないこと。ピボットグラフもピボットテーブルから生成され、テーブルの方をソートするとグラフにも反映されるしくみ。計算列を追加するのも、テーブルのGUIを操作。メジャーはテーブルの下のスペースに追加。試行錯誤しながらデータの特徴を掴むような操作には非効率的。ちょっと計算列を追加しただけで、計算に時間がかかる。コードはバラバラにテーブルの中に埋め込まれ、ロジックの全体像を掴みにくい。コードを追加した履歴も見えない。1日もすると、何をやったのか忘れてしまう。メンテナンスしにくい。

 

プログラミングが出来る人間としては、データとコードがきれいに分離されている方が、頭の整理が出来てよい。一晩、Jupyter Notebookを使い、pandas/matplotlib/seabornで、モダンExcelでやったのと同じ作業をやってみた。確かに、最初は、pandasの関数を覚えるのに手間取ったが、一度覚えてしまうと、試行錯誤の作業が楽。Jupyter Notebookだと、レポート形式でロジック全体を掴めるのが良い。

 

なので、結論としては、試行錯誤しながらデータ分析する作業では、Pythonの方が良い。

 

一番問題なのは、プログラミングと言うとアレルギー反応を起こす職場でPython使えば、差別を受けたり、孤立化したりすることになる。Excelを使うのは良し、Pythonを使うと差別される。Pythonでデータ分析するほうが、遥かに高度なスキルが必要なのに、日本は変な社会だ。IT企業は村社会で、表面上は、多様な人材が必要と言うが、実際には違う。特に、管理職が技術音痴だと、多様な人材を認めない職場になる。はー。。。。ため息をついてしまう。技術音痴の人たちは、肩書でしか人材を判断できない。研究職だと格上、肩書なしで技術の作業すると格下。

 

やっぱり、IT後進国の日本企業で働くには、データサイエンスの資格をとるしかない。

 

(追記)モダンExcelをディスりすぎた。二つの良いところを組み合わせて使うと良いと思う。ETLとグラフ化まではモダンExcelでやってみて、データサイエンスの領域まで踏み込むならPython。モダンExcelで、データサイエンスまで踏み込むために、ある程度見通しをつけると良い。Pythonで分析するとき、そういう見通しが役に立つ。自動化の観点では、Power Automate、モダンExcelPythonを組み合わせると良いのかもしれない。