本日は、年度ごとの売上データを可視化するために、部屋タイプ別および予約・キャンセル別の売上を分析し、グラフを作成した。棒グラフと線グラフを活用し、見やすい形でデータを表示することに注力した。また、グラフの色設定や凡例の表示順序に関する問題を修正し、視覚的なわかりやすさを向上させた。
コード修正・エラー対応
- 部屋タイプ別売上が正しく表示されない問題
- フィルタリング処理を修正し、room_name を正しく反映するよう対応。
- 予約とキャンセルの色設定が逆になる問題
- データの並び順を明示的に指定(
reindex(columns=["予約", "キャンセル"])
)。 - 凡例の順番が逆になっていたため、適切な順番に修正。
- データの並び順を明示的に指定(
- キャンセルだけが表示される問題
unstack(fill_value=0)
を適用し、値が欠損しないように調整。
データ処理・分析・可視化の進捗
- 年度別売上の可視化
groupby(["年度", "room_name"])
で集計し、部屋ごとの売上を表示。groupby(["年度", "status"])
で集計し、予約とキャンセルの売上を比較。- 棒グラフと線グラフを試し、適切な視覚化手法を検討。
- 凡例・カラーマッピングの最適化
sns.color_palette("tab20", num_rooms)
を用いて部屋タイプごとの色を統一。- 予約は水色、キャンセルは赤色とし、一貫性を持たせた。
今後の進め方
- 「Data is Boss」の本を参考に、線グラフをさらに活用
- 予約とキャンセルの売上推移を時系列で分析。
- 異なる指標の可視化を試し、データのインサイトを深める。
- データの前処理を見直し、より適切な集計ができるよう調整
- 欠損値や異常値の処理を追加。
- フィルタリング条件を明確にし、不要なデータを除外。
- 次回の作業予定
- 過去数年間の売上推移を分析し、傾向を把握。
- グラフの見た目を調整し、プレゼンテーションに適した形に仕上げる。
- 他の可視化手法(例えばヒートマップや散布図)の導入を検討。