IMDb 電影評分資訊視覺化

探索全球電影評分分佈與時間趨勢

資料篩選控制

1900 1950 2000 2025
1 5 10
0 50K 100K
選擇要排除的區域,例如排除印度電影可選擇 "IN"

目前顯示:0 部電影

電影評分熱力圖

較少電影 較多電影

詳細電影資料

點擊熱力圖上的區塊以查看該區間的電影清單。

專案說明

🎬 IMDb 電影評分與區域分析熱力圖

設計過程與任務抽象化

本專案從使用者需求出發,針對評分分布的探索與比較,抽象出篩選、比較、概括等任務,並設計熱力圖與排序表作為視覺與互動方式,幫助使用者直覺地分析 IMDb 資料、掌握不同年代與區域的評分趨勢,並發現潛在的特例與偏差現象。

視覺編碼選擇 (Mark & Channel)

在熱力圖中,採用方格(mark)表示每個年份與評分區間的交叉格點,並以色彩深淺(channel)編碼電影數量,利用顏色的連續變化呈現密度分布;在資料表中,使用文字與數值(mark)搭配位置與排序(channel)強調比較性。


🚀 專案概覽

本專案提供兩種視覺化工具:

  • 熱力圖(Heatmap):展示 IMDb 電影評分隨年份的分布。
  • 可排序資料表(Sortable Table):提供電影詳細資訊,支援點擊排序。

📈 視覺化說明

🔥 熱力圖(Heatmap)

  • X 軸:電影上映年份 (startYear),每 5 年標記一次。
  • Y 軸:IMDb 平均評分 (averageRating),刻度以 0.5 分間隔。
  • 顏色深淺:表示該區間的電影數量(電影數量越多,顏色越深)。

📋 可排序詳細資料表

  • 提供電影名稱、上映年份、平均評分與評價人數。
  • 支援點擊表頭排序,例如依評分從高到低排序。

📂 資料來源

使用 IMDb 提供的非商業用途官方數據集,包含以下檔案:


🛠 互動功能

🎚️ 年份篩選

透過雙向滑桿設定上映年份範圍(每 5 年一個間隔)。

⭐️ 評分篩選

調整 IMDb 評分區間,例如僅顯示 7.5 分以上的高分電影。

👥 評價人數篩選

設定最低評價人數,例如輸入 10000,僅顯示評價人數超過 10,000 的電影。

🌍 排除特定區域

透過區域代碼(如 IN)排除大量印度電影,改善區域分布分析。


🔍 觀察結果

(a) IMDb 高分電影包含許多印度電影
問題點:
觀察 IMDb 高分電影發現,大量印度電影評分偏高,且出現在 "Top Rated Movies" 清單,這導致高分電影的區域分佈嚴重偏向印度,影響全球影視趨勢分析。
目前的 title.akas.tsv 無法準確排除印度電影,因為同一部電影可能橫跨多個 region。
解決方案:
加入「排除區域」選項(可過濾 region = IN),但仍需進一步完善數據,建議參考以下文章: 「为什么 IMDB 要把"最受欢迎的印度电影"单列出来?」

(b) 高分電影與年代無絕對相關
不同年代都存在相對高分的電影,並非某個時期的電影絕對較高分。
例如:
- 1940 年代有高評價經典電影,如《卡薩布蘭卡》(1942)
- 1990 年代有高分電影,如《刺激1995》(1994)
- 2010 年代也有高評價影片,如《星際效應》(2014)

(c) 評分分布符合直覺
整體 IMDb 評分呈現常態分布:
- 大部分電影評分落在 6-6.5 分(中心區間)。
- 極高分(9.0 以上)電影較少;極低分(3.0 以下)電影也相對較少。
評分分布類似鐘形曲線,隨著評分升高或降低,電影數量逐漸減少。

(d) 評價人數對評分的影響
調高評價人數門檻(如 numVotes ≥ 10,000)會有以下現象:
- 低分電影減少 → 因為低評價電影通常評價人數較少
- 評分分布整體上移 → 低評價電影減少後,整體平均評分提升
原因:
高評價電影通常由大量用戶參與評分,而低分電影往往來自小眾觀眾群體,評價人數較少。


📌 結論

  • 印度電影偏高分:IMDb 高分電影大量為印度電影,影響全球電影趨勢分析。
  • 年代與高分電影無絕對相關:1940 年代《卡薩布蘭卡》、1990 年代《刺激1995》、2010 年代《星際效應》等高分影片跨越不同年代。
  • 評分常態分布:電影評分主要落在 6 - 6.5 分區間,高分或低分電影皆較少,呈鐘型分布。
  • 評價人數對評分影響:提高評價人數門檻會排除低分小眾電影,導致整體評分向上移動。

🚩 注意:IMDb 的區域資料仍需進一步完善,以提高分析精度。