探索全球電影評分分佈與時間趨勢
目前顯示:0 部電影
點擊熱力圖上的區塊以查看該區間的電影清單。
本專案從使用者需求出發,針對評分分布的探索與比較,抽象出篩選、比較、概括等任務,並設計熱力圖與排序表作為視覺與互動方式,幫助使用者直覺地分析 IMDb 資料、掌握不同年代與區域的評分趨勢,並發現潛在的特例與偏差現象。
在熱力圖中,採用方格(mark)表示每個年份與評分區間的交叉格點,並以色彩深淺(channel)編碼電影數量,利用顏色的連續變化呈現密度分布;在資料表中,使用文字與數值(mark)搭配位置與排序(channel)強調比較性。
本專案提供兩種視覺化工具:
startYear
),每 5 年標記一次。averageRating
),刻度以 0.5 分間隔。使用 IMDb 提供的非商業用途官方數據集,包含以下檔案:
region
)
透過雙向滑桿設定上映年份範圍(每 5 年一個間隔)。
調整 IMDb 評分區間,例如僅顯示 7.5 分以上的高分電影。
設定最低評價人數,例如輸入 10000,僅顯示評價人數超過 10,000 的電影。
透過區域代碼(如 IN
)排除大量印度電影,改善區域分布分析。
(a) IMDb 高分電影包含許多印度電影
問題點:
觀察 IMDb 高分電影發現,大量印度電影評分偏高,且出現在 "Top Rated Movies" 清單,這導致高分電影的區域分佈嚴重偏向印度,影響全球影視趨勢分析。
目前的 title.akas.tsv
無法準確排除印度電影,因為同一部電影可能橫跨多個 region。
解決方案:
加入「排除區域」選項(可過濾 region = IN),但仍需進一步完善數據,建議參考以下文章:
「为什么 IMDB 要把"最受欢迎的印度电影"单列出来?」
(b) 高分電影與年代無絕對相關
不同年代都存在相對高分的電影,並非某個時期的電影絕對較高分。
例如:
- 1940 年代有高評價經典電影,如《卡薩布蘭卡》(1942)
- 1990 年代有高分電影,如《刺激1995》(1994)
- 2010 年代也有高評價影片,如《星際效應》(2014)
(c) 評分分布符合直覺
整體 IMDb 評分呈現常態分布:
- 大部分電影評分落在 6-6.5 分(中心區間)。
- 極高分(9.0 以上)電影較少;極低分(3.0 以下)電影也相對較少。
評分分布類似鐘形曲線,隨著評分升高或降低,電影數量逐漸減少。
(d) 評價人數對評分的影響
調高評價人數門檻(如 numVotes ≥ 10,000)會有以下現象:
- 低分電影減少 → 因為低評價電影通常評價人數較少
- 評分分布整體上移 → 低評價電影減少後,整體平均評分提升
原因:
高評價電影通常由大量用戶參與評分,而低分電影往往來自小眾觀眾群體,評價人數較少。
🚩 注意:IMDb 的區域資料仍需進一步完善,以提高分析精度。