Pythonデータ分析入門 pandasとmatplotlib
Pythonはデータ分析の分野でも広く使われています。 pandasはデータ操作・集計、matplotlibは可視化のための代表的なライブラリです。 この2つを組み合わせることで、データの読み込みから可視化まで一貫して行えます。
インストール
pip install pandas matplotlib
CSVの読み込みと基本操作
import pandas as pd
df = pd.read_csv('sales.csv')
# 先頭5行を表示
print(df.head())
# 基本統計量
print(df.describe())
# 欠損値の確認
print(df.isnull().sum())
データの絞り込みと集計
# 条件フィルタ
high_sales = df[df['sales'] > 10000]
# グループ集計
monthly = df.groupby('month')['sales'].sum()
# 複数カラムで集計
summary = df.groupby(['region', 'product']).agg({
'sales': 'sum',
'quantity': 'mean'
})
matplotlibで可視化
import matplotlib.pyplot as plt
# 棒グラフ
monthly.plot(kind='bar', title='月別売上', figsize=(10, 5))
plt.xlabel('月')
plt.ylabel('売上(円)')
plt.tight_layout()
plt.savefig('monthly_sales.png')
plt.show()
まとめ
pandasとmatplotlibはPythonデータ分析の基礎ツールです。 より高度な可視化にはseaborn、機械学習にはscikit-learnへと展開できます。 まずCSVを読み込んで基本統計量を確認するところから始めてみましょう。