Tech Blog

プログラミングと技術の情報サイト

Pythonデータ分析入門 pandasとmatplotlib

Pythonデータ分析入門 pandasとmatplotlib

Pythonはデータ分析の分野でも広く使われています。 pandasはデータ操作・集計、matplotlibは可視化のための代表的なライブラリです。 この2つを組み合わせることで、データの読み込みから可視化まで一貫して行えます。

インストール

pip install pandas matplotlib

CSVの読み込みと基本操作

import pandas as pd

df = pd.read_csv('sales.csv')

# 先頭5行を表示
print(df.head())

# 基本統計量
print(df.describe())

# 欠損値の確認
print(df.isnull().sum())

データの絞り込みと集計

# 条件フィルタ
high_sales = df[df['sales'] > 10000]

# グループ集計
monthly = df.groupby('month')['sales'].sum()

# 複数カラムで集計
summary = df.groupby(['region', 'product']).agg({
    'sales': 'sum',
    'quantity': 'mean'
})

matplotlibで可視化

import matplotlib.pyplot as plt

# 棒グラフ
monthly.plot(kind='bar', title='月別売上', figsize=(10, 5))
plt.xlabel('月')
plt.ylabel('売上(円)')
plt.tight_layout()
plt.savefig('monthly_sales.png')
plt.show()

まとめ

pandasとmatplotlibはPythonデータ分析の基礎ツールです。 より高度な可視化にはseaborn、機械学習にはscikit-learnへと展開できます。 まずCSVを読み込んで基本統計量を確認するところから始めてみましょう。

← 記事一覧に戻る