Взято з Том 28, № 2, 2025
Сторінки 140 -150
Отримано 14.09.2025
Доопрацьовано 02.12.2025
Прийнято 29.12.2025
Взято з Том 28, № 2, 2025
Сторінки 140 -150
Анотація
Ця стаття пропонує комплексний порівняльний аналіз трьох відомих метрик оцінки якості зображення (IQA): PSNR, SSIM та LPIPS. У ній досліджуються їхні основні принципи, математичні основи, переваги та обмеження, зокрема, що стосуються їхньої кореляції зі зоровим сприйняттям людини. Обговорюється еволюція метрик IQA від простих попіксельних порівнянь (PSNR) до структурних підходів (SSIM) та, нещодавно, до метрик вивченого сприйняття (LPIPS). Представлено критичний аналіз ефективності кожної метрики в оцінці різних візуальних спотворень, включаючи шум, розмиття та артефакти стиснення. Притаманні людському зоровому сприйняттю проблеми, такі як роль семантики, текстури, кольору та візуальних артефактів, досліджуються як фундаментальні причини розбіжностей між об'єктивними метричними оцінками та суб'єктивними людськими судженнями. У статті висвітлюється «необґрунтована ефективність» глибоких ознак у LPIPS, а також розглядаються його вразливості, такі як атаки з боку суперників та обмеження в глобальному семантичному розумінні. Зрештою, у ньому окреслено напрямки майбутніх досліджень, спрямованих на розробку більш надійних, інтерпретованих та перцептивно узгоджених метрик IQA, які можуть краще враховувати складність зорової системи людини та мінливі вимоги сучасних технологій обробки зображень та генеративного штучного інтелекту
Ключові слова:
оцінка якості зображень; PSNR; SSIM; LPIPS; людське сприйняття; візуальні спотворення; генеративні моделі; об'єктивні метрики; суб'єктивна оцінка