关于 AI PC 定义有很多说法,比如在 CPU 中加入专业的 AI 加速引擎,或者提供专业的 AI 优化软件,而在所有方案中,公认通过 GPU 加速是最为高效的。AI PC 概念出现之前在 2018 年,NVIDIA 就已经推出了具备 AI 加速功能的 RTX GPU,并将其带入台式机和笔记本电脑领域,让 PC 一步到位进入到 AI 领域。
那么 AI PC 的硬件门槛究竟在什么地方,即将井喷的 AI 应用究竟会带来什么不一样的体验?借着本文,让我们一起来探讨 AI PC 那份独有的魅力。
非 RTX GPU 不可
无论游戏玩家还是内容创作者,其实都已经感受到 GPU 带来的极高效率。凭借着 GPU 在大规模并行运算上的优势,GPU 可以在短时间内实现海量的图形计算,而 RTX GPU 在原有的基础上加入了 Tensor Core,更是让 RTX GPU 从底层硬件上具备了高效的 AI 加速性能。
Tensor Core 的优势在于,可以高效对应 AI 加速中大量不需要高精度的数据计算,利用优秀的混合精度计算性能,以追求尽可能高的运算吞吐量,从而实现对 AI 应用的专项优化。这是一项需要硬件与软件相互结合才能实现的功能,而 NVIDIA 在 2018 年便透过 B2B 端数据中心的需求发现了这个全新的领域,进而通过 GeForce RTX GPU 将其引入消费端市场,从而实现超前的 AI PC 硬件部署。
衡量 AI 性能的一种方法是以 teraops 为单位。teraops 即“万亿次运算 / 秒”(TOPS),TOPS 可作为单一指标让用户了解 PC 的 AI 性能。在最新一代的 GeForce RTX 40 系列 GPU 中,RTX GPU 已经可以做到从 200 AI TOPS 到 1300 AI TOPS 的覆盖,提供了笔记本和台式机的多样化的选择。相比之下,目前没有独立 GPU 的 AI PC 算力仅为 10 TOPS 到 45 TOPS。
得益于在 CUDA Core 推广上获得的成熟经验,RTX GPU 对 AI 软件层面、生态、用户群进行了更快的推广。想必有很多同学在知道 AI PC 之前,就听说过 NVIDIA Canvas 这个神奇的应用,借助 RTX GPU 的性能,寥寥数笔的简单涂鸦,就能生成一副近似于真实场景照片,重点是全程都是在 PC 离线的状态下,由 RTX GPU 独立完成的。
目前为止,RTX PC 已经拥有超过 1 亿用户和 500 款 AI 应用的生态,这个时间点,距离 AI PC 概念在行业中被正式提出,还不到半年的时间。
显然,AI PC 的概念是新的,但 NVIDIA 的理念更为超前。当下绝大多数的 AI 应用需要依靠 RTX GPU 和 NVIDIA 所打造的 AI 生态下,才可以在离线状态下高效运行。RTX GPU 已经成为了高性能 AI 加速的代名词。
软硬兼施
应该是先有应用还是先有硬件支持,如同“先有鸡蛋还是先有鸡”那般长期困扰着整个行业。如何让潜在用户、应用开发团队认识到 RTX GPU 的优越性是个问题。NVIDIA 选择的是软硬件齐头并进。
近期我们看到 NVIDIA 展示了不少关于 AI 的 DEMO,并且这些应用和 DEMO 可以在短短几个月时间内就发生质的提升,NVIDIA ACE 就是其中很好的例子。
NVIDIA ACE (Avatar Cloud Engine) 可以理解为 NVIDIA 多项 AI 技术应用的组合拳,通过 NVIDIA Audio2Face 实现面部动画自然表现,再由 NVIDIA Riva 自动语音识别(ASR)和文本转语音(TTS)实现接近于真实的数字人物交互。更简单的说,开发者只需要给游戏中 NPC 一个人设,剩下交给 AI 演绎就可以了。
比如你对着餐厅店长说饿了,有什么可以吃的。店长会向你推荐拉面,如果你认可,对方就会走到后厨为你准备饮料、拉面。甚至,如果你觉得店内的氛围不够,还可以让店长把店铺的灯光再关掉一些,店长会不耐烦的絮絮叨叨,但还是按照玩家的要求去后台关灯。
NVIDIA ACE 的部署非常灵活,允许模型根据本地 GPU 的性能在云端和 PC 上运行,并且正以我们无法想象的速度向前进化。
NVIDIA ACE 已经获得了头部开发者和平台的支持,包括米哈游、网易游戏、完美世界游戏、掌趣科技和腾讯。这意味着在不久的将来,我们在国产游戏中,就能与每一个重要或者不重要的 NPC 实现自由交互,与每一个 NPC 的对话都能给你带来如同 ChatGPT 自然交互的感受。
Covert Protocol 是 Inworld AI 公司与 NVIDIA 合作开发的一项全新技术 Demo,它突破了游戏中角色互动的界限。Inworld AI 引擎集成 NVIDIA Riva 和 NVIDIA Audio2Face,前者可实现精确的语音转换文字,后者可提供逼真的面部表情。
Inworld AI 引擎采用多模态方法来展示非玩家角色 (NPC),将认知、感知和行为系统集成在一起,在精心制作的环境中呈现令人惊叹的 RTX 渲染角色,以实现身临其境的叙事效果。
DLSS 3.5 已经成为新的分水岭
当我们还在感叹 RTX GPU 所打造的前瞻性的 AI 技术时,RTX AI 已经以更快的速度融入到我们的娱乐中,DLSS 3.5 就是其中很好的例子。
NVIDIA DLSS 3.5 采用光线重建技术,可进一步提升光线追踪质量,让游戏更加精美、身临其境和逼真。在应用中,光线追踪预览和视窗将得到大幅改进,使创作者能够在耗时的渲染之前更好地可视化最终结果。
在以往的光线追踪技术中,游戏引擎生成场景的几何图形、材质,其实都包含有物理属性,这些物理属性会影响到场景中的物品外观、光线之间的交互方式。依靠游戏视角发射的采样光线,最终确定场景中的光源属性、射线、材质反应,以生成反射、漫反射、折射等多种效果。这个过程如果对屏幕中每个像素发射光线计算都提出很高的要求,那么一帧游戏画面很可能需要几分钟甚至数小时来运行,这样游戏是没法玩的。
DLSS 3.5 的光线重建技术成为很好的补足,它使用一个 AI 模型替换掉游戏中原本用来降噪的人工设计的降噪器。
更重要的是,DLSS 光线重建也是一项离线图像训练技术,它可以从训练数据中识别光照模式,包括全局光照、环境光遮蔽等情况,也避免了因为降噪器的原因导致的画面细节缺失,从而帮助游戏实现更理想的全景光线追踪效果。
DLSS 3.5 带来的效率是惊人的。以《心灵杀手 2》为例,4K 分辨率下,开启全景光线追踪最高画质的状态下,通过 DLSS 3.5 性能模式,GeForce RTX 4090 从卡顿 33FPS 平均帧率提升到了 140FPS 以上,提升幅度超过 300%,同样,在 GeForce RTX 4080 从 27FPS 提升到了 110FPS 以上,GeForce RTX 4070 Ti 提升则从不到 20FPS 提升到了将近 90FPS。
1080p 分辨率全景光线追踪最高画质中,GeForce RTX 4090 提升幅度在 130% 左右,部分 GPU 提升可以达到 2 倍。虽然 1080p 分辨率提升幅度则没有那么明显,但 GeForce RTX 4060 Ti 和 GeForce RTX 4060 从不能玩的程度达到了近 100FPS,已经是愉快玩耍的程度。
同样在《赛博朋克 2077:往日之影》中,DLSS 3.5 也提供了绝佳的视觉呈现,比如广告牌、霓虹灯反射的积水路面都变得更为逼真,金属色泽也变得更有质感。
光线追踪:超速模式 + DLSS 3.5 ON
重点是画质的火力全开没有让游戏帧率有半点下降,无论任何定位 GeForce RTX 40 系列 GPU,都有着更为强力的表现。
自从 2019 年开始,已经有超过 500 款游戏和应用支持 RTX 技术、DLSS 和 AI 技术彻底改变了人们的游戏和创作方式。
创意与效率已无处不在
细心的同学已经发现,RTX GPU for AI 的优势早已跳出了游戏,在更多环境中付诸实践。ChatRTX 就是其中之一。它使用检索增强生成、NVIDIA TensorRT-LLM 软件和 NVIDIA RTX 加速,将本地生成式 AI 功能引入到支持 RTX 的 Windows 系统中。
ChatRTX 其中一个最大特点就是信息整理。比如整理上市公司财报,数百页的财报内容可以直接放到应用中,ChatRTX 在瞬间就可以对财报完成理解,并回答任何你对财报的疑问,以及提供信息来源,具体到哪个报表,哪一页内容。甚至,你也可以让 ChatRTX 帮你完成目的地旅游规划,信息整理等工作。很快,ChatRTX 还会增加对语音、图像、新模型的支持。
AIGC 生成式创作也是 AI 加速体验的重要一环,这个话题自然少不了当红的 Stable Diffusion 应用。作为当下最主流的图生图、文生图应用之一,GeForce RTX GPU 从 Stable Diffusion 1.0 版本到最新的 SDXL,都给做了最充足的适配,每一款 GPU 在加速计算之前,都可以进行针对性的优化,确保 Stable Diffusion 可以充分的利用 CUDA Core、Tensor Core 以及显存资源。
近期,以 PCMark 和 3DMark 闻名的 UL Solutions 也对旗下的专业创作测试软件 Procyon 加入了 AI 图像生成测试,给整个行业提供了基准参考。可以看到,RTX GPU 的性能一骑绝尘。定位主流的 GeForce RTX 4060 Ti 利用 16GB 显存已经可以很好的完成的基础的 AI 加速工作,GeForce RTX 4090 D 则可以在几秒钟内完成一张图片的生成,效率出众。
除此之外,越来越多的专业应用也已经加入到 RTX AI 阵营中,例如 NVIDIA 已通过 TensorRT 推动剪映 AI 艺术字功能上线,并正在通过 RTX AI 平台加速生成式 AI 在剪映产品功能中的应用。
在未来很长一段时间中,AI PC 概念将成为 PC 营销的主导宣传。但不是每一款 AI PC 都真正拥有高效掌控 AI 的能力。关于 AI PC 定义有许多种。但高效、可靠的 AI PC,唯有通过 RTX GPU 才能实现。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。