自译 | HDR和显示器的感知问题

  1. 观察者同色异谱
  2. 阈值模型
  3. 色貌标尺和色域体积
  4. 结论
  5. 参考文献

作者: Mark D. Fairchild, Fu Jiang, Hao Xie
原文链接:https://sid.onlinelibrary.wiley.com/doi/full/10.1002/msid.1211
译者:Horace Lu

尽管这个世界自始至终都是高动态范围(HDR)的,但商用 HDR 显示器的蓬勃发展还是为色度测量(colorimetry)和感知建模(perceptual modeling)提供了全新的有趣挑战。最大的挑战来源于大范围亮度变化在空间和时间尺度上相对于自然界的压缩方式,这导致真实的亮度/色度复现(luminance/chromaticity reproduction)并不意味着准确的色貌复现(appearance reproduction)。在本文中,作者回顾了一些感知和色度测量问题,这些问题为 HDR 图像复现带来了挑战。

众所周知,从星光闪烁的夜晚到阳光明媚的白天,人类的视觉系统可以在亮度水平约为 14 个数量级的范围内有效地工作。然而,视觉系统并不能同时检测到所有这些亮度水平的有效信息。相反,光与暗适应机制起到一种自动曝光控制的作用,能够将视觉系统的平均响应置于任何特定场景或环境的平均亮度水平附近。这些机制包括:瞳孔直径的变化,从视杆细胞(夜间)到视锥细胞(白天)光感受器的转换,光感受器中的生理增益控制,以及视网膜和大脑神经回路中的其他生理与心理处理机制。

因此,当我们思考高动态范围(HDR)显示器对感知造成的挑战时,应该记住我们在日常生活中对世界的所有自然感知都是 HDR 的。事实上,历史上的标准动态范围(SDR)显示器(在模拟自然环境时)才是经常出现偏差的。对于 HDR 显示器而言,视觉感知的以下几个方面是十分重要的:光感受器的初始视觉响应,适应机制,刺激的时空变化,刺激的呈现方式等。

探讨该问题的第一步是定义平均观察者和真实观察者的视锥细胞响应(cone response)或颜色匹配函数(CMFs),并分析不同光谱刺激(或不同显示基色的集合)所能产生的差异。这就是所谓的观察者同色异谱(observer metamerism),即由于观察者的视觉敏感度不同,不同观察者的色觉存在差异。这个过程的下一步涉及到观察者如何适应真实场景与显示器中的光照,以及这两种适应方式之间的差异。适应的复杂性在于,它在空间和时间的维度上都可以是局部化的(locallized),这增加了视觉系统的整体动态范围,使其超出了在观察单一静态场景或图像时的动态范围。最后,在描述和编码颜色信息时,对于上述适应状态是固定不变还是动态可变的假设,会对选择最佳颜色测量指标产生重大影响。

我们稍后在本文中会更详细地讨论这些话题。通过该领域的多篇相关文献[1][2][3][4],可以了解到感知概念在复现 HDR 感知方面的研究与应用历史。尽管这些历史常常早于 HDR 显示技术本身,但感知的基本概念并没有改变。

观察者同色异谱

如同人类的其他属性一样,色觉也是因人而异的,即使是对拥有所谓正常色觉的人而言也不例外。在色度学中,我们使用颜色匹配函数(CMFs,图 1)来量化这些色觉响应。在实际的色彩测量工作中,通常使用代表平均人类观察者的平均函数,如 CIE 1931 标准色度观察者函数。近年来,研究者开发了新的生理学模型,用于定义人类 CMFs 的组成元素 [5],从而可以预测在个体中可能存在的 CMFs 的范围。这些模型可以结合人口统计信息,创建大量 CMFs 以供统计分析。其中一种分析方法已经得出了 10 种分类观察者(catagorical observers)的集合(图 1)[6],这些分类观察者代表了在人群中发现的大部分差异,并且代表了评估颜色匹配中的个体差异的一种实用方法,这在 HDR 和广色域(WCG)显示中可能非常关键。

图 1:Asano 和 Fairchild 的 10 种 2 度分类观察者的类 XYZ 颜色匹配函数

为了量化观察者同色异谱(OM),并以此优化显示器基色设计、色彩转换以及其他可能影响光谱输出的显示参数,研究者提出了不同的度量标准 [7]。CIE 推荐了一种基于 CIE 标准偏差观察者(CIE Standard Deviate Observer)的指标 [8],但其低估了观察者的变化,因此 Asano 模型进行了改进 [5]。Long 和 Fairchild 提出了两种类型的 OM 指标, [9]。对于一组 CMFs 测试人群,这两个指标分别量化了最差的颜色不匹配(the worst color mismatch)和色差方差体积(variance volume of color difference),并产生了不同的影响。最近,Xie 等人使用商用 sRGB 显示器进行实验,并提出了一个更好的与心理物理相关的 OM 指数,即 ,它从 修正而来,并将感知到的不匹配大于阈值 的观察者所占的百分比考虑在内 [10]。他们还指出 OM 在整个色域中的分布很重要,因此设想了一种衡量图像质量的指标,该指标是观察者 CMFs 与图像内容的函数。图 2 展示了这种度量标准在显示中的重要性,图中呈现的颜色范围都是图 1 的 10 种分类观察者认为与中性日光照明(D65)相匹配的颜色刺激。关键在于,不匹配的范围差异显著,并且取决于显示器的基色。Rec. 2020 推荐的基色(单色光)具有最稀疏的光谱功率分布,因此出现观察者差异的可能性最大,这一点应该理解为与色域体积大小的一种权衡。广色域(WCG)显示器可能会引入更多的观察者差异,而在可复现的色貌范围方面获得的收益同样甚微。

图 2:图中模拟了 CIE D65 光谱及其条件等色(metamer)的观察者同色异谱。图中的(a)至(f)代表了 6 种具有不同基色的显示器,其中 (a) 至 (d) 是从 Xie 等人的论文中选择的四种 sRGB 色域的显示器,(e) 是 DCI-P3 色域显示器,(f) 是使用单色光(monochromatic)基色模拟的 Rec. 2020 色域显示器。每个正方形代表 10 种分类观察者之一认为与 D65 匹配的条件等色,从左到右、从上到下按照分类观察者的重要性排序。图中将正方形的颜色及其近场背景(proximal background)同时展示,是为了表现分类观察者的条件等色以及 CIE D65 在 CIE 1931 标准观察者的眼中是怎样的。

关于个体 CMFs 或分类 CMFs,值得考虑的最后一点是个人色度学或色彩管理系统的研发。这种系统基于已开发的原型观察者校准器(prototype observer calibrators),为参与色彩成像或制作过程的利益相关者提供了工具,让他们可以根据个性化的色度测量结果对显示器和其他成像设备进行校准。这种系统可以在 HDR 和 WCG 显示器上发挥更大的作用,因为这些显示器有可能出现较大的观察者差异。虽然个性化的色度测量不能解决大规模人群分布或多人同时观看的问题,但它可以为当前的工作流程和最终用户的体验提供潜在的改进措施。

阈值模型

在研究了初始的视觉敏感度之后,就必须要考虑对于显示器上亮度变化的感知了。与这一讨论相关的有两种类型的模型:阈值模型(threshold models)和色貌标尺(appearance scales)。阈值模型给出了在特定情况下可以感知到的最小亮度变化,这对于颜色编码很重要,而且可以确保在适应的动态变化范围内不会出现伪影。下一节讨论的色貌标尺,则可以用来预测在给定的观看条件下,哪些刺激物看起来是中等灰度的,这是阈值模型无法做到的。

阈值模型和色貌标尺的共同点是,需要了解在任何特定瞬间可以感知的亮度范围。人类的视觉系统可以适应大约 14 个对数单位的亮度范围。对于低亮度水平,在光线较暗时激活的感光细胞是视杆细胞,其活跃范围大约在 10 -6 至 10 cd/㎡ 亮度范围内。在高亮度水平下工作的感光细胞是视锥细胞,主要活跃于 0.01 至 10 8 cd/㎡ 亮度范围内。只有在刺激物具有足够的视角间隔以避免眩光,并且在观看每个区域时有足够的时间进行适应时,如此大的亮度范围才是有效的。要感知这个全动态范围,需要较大的空间范围或时间过渡(从非常明亮的区域到非常黑暗的区域,需要 20 分钟的适应时间)。因此,把这种全范围的亮度称为视觉系统的动态范围有点不准确。当明亮和黑暗的刺激同时呈现时,人类视觉系统的动态范围要窄得多,因为明亮的刺激会引起眩光,并且人眼的同时适应能力有限。作者最近进行的实验(尚未发表)利用图 3 中的图案在不同的空间范围下研究了人类视觉系统的同时动态范围。观察者对于空间 Gabor 图案目标的辨别能力是有限制的。在这些实验中发现,在这种明暗交替的图案中感知 10% 对比度图案的最大值为 3.3 个对数单位。(In such experiments, a maximum value of 3.3 log units was found for perception of a 10% contrast pattern in such bright-dark alternating patterns.)因此,对显示器而言,在任何瞬间观察静态图像时,大于这个值的动态范围都是被浪费的。此外,同时动态范围还与刺激大小以及最大亮度水平有关。这一点的实际意义在于,一个亮度动态范围超过 3 个对数单位的明亮显示器,结合一些能够控制适应状态的巧妙处理,就可以合理地模拟大多数感知体验。当显示器的显示能力超过这个范围时,可能会引入其他伪影,导致实际上降低了观看者的体验。

图 3:在动态范围感知实验中使用的刺激样本。不断降低较暗斑块的亮度,直到可以在其中一个斑块上看到 Gabor 图案。明亮斑块与确定的暗斑块的亮度之比,定义了特定空间尺度下的同时感知动态范围。

这就是“浮动适应水平”(floating adaptation levels)这一重要概念的来源。在随时间变化的图像,如视频和电影中,不存在单一的适应状态,因为观众可能有时间适应非常暗的场景,将他们的同时动态范围下降到暗场景的水平,随后再适应一个非常亮的场景,将他们的同时动态范围提升到更高的亮度水平。因此,我们的 HDR 显示器的亮度范围远远超过了 3 个对数单位,并且有能力在高亮度和低亮度水平上对这 3 个对数单位的动态范围进行编码。虽然视觉系统无法同时感知所有这些信息,但在某些场景中黑暗区域是关键,而在其他场景中明亮区域是关键。这种情况在非常大的显示器上也可能遇到,不过程度较轻。因此,系统工程师要么编码和显示非常大的动态范围,使其超过任何单个瞬间的可见范围,要么开发一种算法,在具有较小动态范围的硬件上模拟适应过程。这是图像复现历史上的一项长期任务。[1][2][3][4]

阈值/编码模型和色貌模型之间的这种区别,导致了多种色彩系统的存在,比如可编码 HDR 图像内容而不出现可见伪影的模型(如 ICtCp),以及描述刺激物在观察者眼中的外观的色貌相关模型(如 CIELAB 和 CIECAM02),以及重要的规范(如显示器色域体积)。这两种类型的模型在 HDR 显示技术中都有重要的应用。

色貌标尺和色域体积

在固定的适应水平下,色貌模型是十分适用于显示器评价的。(或者,它们能以动态方式实现,模型中的适应参数以空间和时间上的局部化方式设置。)如 CIELAB 和 CIECAM02 的色彩空间,可以准确和适当地表示显示器的色貌 [11]。它们的亮度传递函数(明度和视亮度的预测器)已经证明可以平滑地扩展到 HDR 内容以及高于漫反射白或 L*= 100 的水平上。在这种情况下使用这些色彩空间是没有限制的,并且认为它们仅适用于反射材料是不正确的。事实上,它们已经在自发光和 HDR 显示器上进行了开发和严格的测试。最近,研究人员正在寻求对明度(lightness)和视亮度(brightness)函数进行微调,并开发这些空间和标尺的 HDR 版本 [4]

图 4:本图是一种简化的比较,展示了 HDR 图像渲染到 RGB 显示器(其中 R、G、B 基色的最大亮度加起来等于白点亮度)与渲染到 RGBW 显示器(在显示器上增加白色通道来产生最大亮度)的对比。在这个模拟当中,假设白色通道产生 50% 的显示亮度,并且没有为了补偿色彩减弱而对图像数据进行任何调整。这只是一种最坏情况,用于说明问题,并非典型商业显示器的结果。

图 4 通过模拟显示技术的简单变化(RGB 显示器和 RGBW 显示器的差异)来说明这种色貌空间的应用。在 CIELAB 和 CIECAM02 等色貌空间中,可以完全预测和量化视觉差异(图 4)。图像数据最初是以 HDR 格式拍摄的,随后为了制作插图而在视觉上渲染成了更有限的动态范围。上图是 RGB 显示器的模拟,其中最大白色亮度是每个 RGB 通道的最大亮度之和。下图是 RGBW 显示器的简化模拟,其中一半的亮度是通过增加一个额外的白色通道引入的。在 RGBW 显示器中,颜色丰富以及亮度高的区域无法复现。虽然两种显示器具有相同的亮度动态范围和色域,但由于漫反射白和图像各个区域之间的关系明显不同,因此两张图像的外观也有显著的差别。这说明了为什么表示显示器可产生的色度的三角形区域(在 xy 或 u’v’ 图上)并不能定义色域。颜色是一种至少三维的感知,亮度(luminance)和色度(chromaticity)的关系必须在色貌空间中才能确定。

图 5 显示了 RGB 和 RGBW 显示器在 CIELAB 色彩空间中的色域体积。首先请注意,对于显示器的高光区域来说,表达 L*= 100 以上的有意义的 CIELAB 值并不困难;其次,请注意这个三维色域是如何说明 RGBW 显示器中明亮区域的色彩损失的(请记住,这两种显示器的色域,以 RGB 基色来表示的话是相同的)。Masaoka 等人最近探讨了测量和确定 HDR 显示器的色域体积的各种方法所导致的影响 [12]

色域体积是衡量显示器色彩复现能力的指标,衡量这个指标的传统方法是使用 xy 或 u’v’ 色度图中的二维区域所覆盖的范围来表示。因为至少需要三个维度来描述颜色感知,所以计算三维色域体积更有意义。此外,三维色域体积应该在一个相对均匀的色彩空间(即 CILAB 或 CIECAM02)中来计算。图 5 中的两个色域的基色都符合 DCI-P3 标准,具有 1000 cd/㎡ 的峰值亮度水平和 200cd/㎡ 的漫反射白设置。棕色色域是 RGBW 系统,其中 R+G+B = 500 cd/㎡,白色光通道提供另外的 500 cd/㎡。绿色色域是传统的 RGB 系统,其中 R+G+B 可以达到 1000 cd/㎡ 的峰值亮度。

图 5 是典型 RGB 显示器和 RGBW 显示器的色域三视图,其中白色通道产生最亮的高光。图中的绿色区域显示了在 RGB 显示器上可以产生的颜色刺激,但在 RGBW 显示器上则不能。这些图表假设图像中的漫反射白被设定为 L* = 100,而高光部分可以达到 L* = 150。

结论

研究色彩感知,并试图为实际色度学和图像复现建立数学模型,是一个迷人的领域。虽然新的 HDR 和 WCG 显示技术提供了新的挑战,但这并不是在研究真实世界感知时没有考虑到的东西。无论如何,对于人类感知,以及我们用来模拟世界的技术,仍然有很多东西需要学习。

有一个经典的谚语:魔鬼隐藏在细节中。在 HDR 显示器中,更恰当的作法可能是考虑魔鬼藏在阴影、高光和色域边界中。这些区域有时需要特别注意,有时则需要放任不管。还应该注意的是,这个魔鬼非常善于适应变化,无论是感知的变化,还是其他方面的变化。


参考文献


  1. 1.Evans, R.M. (1974). The Perception of Color. John Wiley & Sons, New York.
  2. 2.Hunter, R.S. & Harold, R.W. (1987). The Measurement of Appearance, 2nd Ed., Wiley, New York.
  3. 3.Hunt, R.W.G. (2004). The Reproduction of Colour, 6th Ed. Wiley-IS&T Series in Imaging Science and Technology, Chichester, UK.
  4. 4.Fairchild, M.D. (2013). Color Appearance Models, 3rd Ed. Wiley-IS&T Series in Imaging Science and Technology, Chichester, UK.
  5. 5.Asano, Y., Fairchild, M.D., & Blond é, L. (2016). Individual colorimetric observer model. PLOS ONE 11, e014567.
  6. 6.Asano, Y. & Fairchild, M.D. (2020). Categorical observers for metamerism. Color Res. Appl. 45, 576–585.
  7. 7.Xie, H., Rodr í guez-Pardo, C.E., & Sharma, G. (2017). Multiobjective optimization for color display primary designs. J. Electron. Imaging 26, 063013.
  8. 8.CIE. (1989). Special Metamerism Index: Change in Observer, CIE Publ. No. 80, Central Bureau of the CIE, Vienna.
  9. 9.Long, D.L. & Fairchild, M.D. (2014). Modeling observer variability and metamerism failure in electronic color displays. J. Imaging Sci. & Technol. 58, 030402.
  10. 10.Xie, H., Farnand, S.P. & Murdoch, M.J. (2020). Observer metamerism in commercial displays. J. Opt. Soc. Am. A 37(4), A61–A69.
  11. 11.Fairchild, M.D. & Chen, P.-H. (2011). Brightness, lightness, and specifying color in high-dynamic-range scenes and images. SPIE/IS&T Electronic Imaging Conference, Vol. 7867, San Francisco, 78670O-1-78670O-14.
  12. 12.Masaoka, K., Jiang, F., Fairchild, M.D. & Heckaman, R.L. (2020). Analysis of color volume of multi-chromatic displays using gamut rings. J. Society for Information Display 28, 273–286.

转载请注明来源。欢迎留言评论,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。