Habana Gaudi2 AI加速器在BridgeTower模型上的性能优于NVIDIA H100
今年早些时候,英特尔发布了英特尔 Habana Gaudi2 与 GPU 市场领导者 NVIDIA 之间的性能结果,这说明了英特尔对人工智能的承诺,并证明人工智能并不是一刀切的类别。与此同时,英特尔人工智能研究人员和微软研究院联合开发了 BridgeTower,这是一种经过预训练的多模态转换器,可提供最先进的视觉语言任务。Hugging Face 已将该模型集成到其机器学习开源库中。
Hugging Face 在其网站上的博客文章中发布了原始基准测试结果,并更新了 Habana Gaudi2 和 NVIDIA H100 GPU 的 AI 训练性能基准测试结果。根据这些基准测试结果,Gaudi2 在获得多模态变压器 BridgeTower 模型方面优于 H100,但使用Optimum Habana 的Gaudi2实现了比 A100 好 2.5 倍的性能。结果不仅证实了 Gaudi2 在人工智能领域的地位,而且在视觉语言训练领域也证实了 Gaudi2 的地位。
Optimum Habana 是 Tranormers 和 Diffusers 库与 Habana 的 Gaudi 处理器 (HPU) 之间的接口。它提供的工具可以轻松地为各种下游任务在单 HPU 和多 HPU 设置上进行模型加载、训练和推理。
桥塔背景
视觉语言模型使用单模态编码器来获取数据表示。然后数据被组合或输入到跨模式编码器中。BridgeTower 以其独特的桥接层脱颖而出,将单模态编码器的最顶层连接到跨模态编码器的每一层,从而实现不同级别的视觉和文本数据的有效组合。
BridgeTower 仅使用 400 万张图像进行训练,设定了新的性能标准,在视觉问答 (VQAv2) 测试中提供了 78.73% 的准确率。这比之前的最佳模型高出 1.09%。扩大规模后,该模型的准确率甚至高达 81.15%,优于在更大数据集上训练的模型。
作为顶级视觉语言模型,BridgeTower 的性能得益于其使用特殊硬件快速加载数据的能力。这些快速数据加载方法有利于视觉模型,因为视觉模型经常面临数据加载挑战。
硬件洞察
更新后的基准测试基于 NVIDIA 和 Habana Labs 的最新硬件和软件。NVIDIA H100 Tensor Core GPU 是 INVIDIA 最新、最快的 GPU,具有用于专门运行的 Tranormer 引擎和 80GB 内存。Nvidia A100 Tensor Core GPU 采用第三次迭代的 Tensor Core 技术,在云提供商中广泛使用,其 80GB 内存比 40GB 内存具有更高的速度。
Habana Labs Habana Gaudi2 是 Habana Labs 的第二代 AI 硬件,最多可容纳 8 个 HPU,每个 HPU 具有 96GB 内存。它被誉为具有用户友好的功能,并且与 Optimum Habana 相结合,可以更轻松地将基于 Tranormers 的代码传输到 Gaudi。
基准测试详细信息
该测试涉及对具有 8.66 亿个参数的 BridgeTower 模型进行微调,并在多个数据集上使用各种技术进行英语训练。下一步涉及使用纽约客字幕竞赛数据集进行进一步微调。所有平台均使用相同的设置并处理每批 48 个样本,以获得一致的结果。
此类实验的一个挑战是耗时的图像数据加载。最佳情况下,原始数据应直接发送到设备进行解码。现在的重点转移到优化此数据加载过程。
优化数据加载
为了更快地在 CPU 上加载图像,增加子进程会有所帮助。使用Tranormers的TrainingArguments,dataloader_num_workers=N参数可以设置用于数据加载的CPU子进程的数量。默认设置为0,表示数据由主进程加载,但这可能效率不高。增加它可以提高速度,但也会增加 RAM 消耗。推荐的设置是 CPU 核心数。然而,最好先进行试验以确定最佳配置。
该基准测试进行了三个不同的运行:
跨八个设备的混合精度运行,其中数据加载与其他任务共享相同的进程 (dataloader_num_workers=0)。
类似的运行,但具有用于数据加载的专用子进程 (dataloader_num_workers=1)。
相同的设置,但有两个专用子进程 (dataloader_num_workers=2)。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
2025年6月20日,——在世界文化遗产地河南洛阳的光影流转之间,2025年新浪微博旅游之夜盛大举行。作为国内首个...浏览全文>>
-
2025年6月20日,——在世界文化遗产地河南洛阳的光影流转之间,2025年新浪微博旅游之夜盛大举行。作为国内首个...浏览全文>>
-
QQ多米试驾线下预约活动为了让更多用户感受QQ多米的独特魅力,我们特别推出了线下试驾预约活动。这不仅是一次...浏览全文>>
-
阜阳长安启源A07以其卓越的性能和豪华配置吸引了众多消费者的目光。作为一款定位高端市场的新能源车型,长安启...浏览全文>>
-
【安徽淮南大众CC新车报价2025款大公开】大众CC作为一款兼具运动感与豪华质感的轿跑车型,一直深受消费者喜爱...浏览全文>>
-
2025款长安猎手K50在安徽淮南地区的最新价格已新鲜出炉,为准备购车的朋友带来全面解析。这款车型以其高性价比...浏览全文>>
-
在安徽滁州购买长安猎手K50时,了解其落地价和省钱技巧至关重要。长安猎手K50是一款实用性强的皮卡车型,适合...浏览全文>>
-
途锐新能源是大众旗下的一款高端插电混动SUV,目前在安徽阜阳地区有售。其官方指导价约为58万元起,但实际成交...浏览全文>>
-
2025款大众CC作为一款兼具运动与豪华的中型轿车,备受关注。目前市场指导价大约在25万至35万元之间,具体价格...浏览全文>>
-
2024款探岳X作为一款备受关注的中型SUV,在市场上以其时尚的设计和出色的性能吸引了众多消费者。根据最新市场...浏览全文>>
- QQ多米试驾线下预约
- 安徽滁州长安猎手K50落地价,买车省钱秘籍
- 淮南大众CC新款价格2025款多少钱?买车攻略一网打尽
- 瑞虎8 PRO试驾,畅享豪华驾乘,体验卓越性能
- 安徽阜阳长安启源A05多少钱 2025款落地价,换代前的购车良机,不容错过
- 保时捷Macan试驾的流程是什么
- 安徽淮南大众ID.3多少钱?购车攻略在此
- 阜阳揽巡落地价,豪华配置超值价来袭
- 安徽池州威然 2024新款价格与配置的完美平衡
- 奇瑞瑞虎9试驾,新手必知的详细步骤
- QQ多米价格,换代前的购车良机,不容错过
- 池州迈腾GTE新款价格2022款多少钱?选车秘籍与优惠全公开
- 岚图追光多少钱 2024款落地价走势,近一个月最低售价25.28万起,性价比凸显
- 天津滨海威然 2024新款价格,最低售价28.98万起,入手正当时
- 蚌埠途昂新款价格2025款多少钱?购车必看
- 坦克400预约试驾全攻略
- 天津滨海ID.7 VIZZION价格,各配置车型售价全揭晓,性价比之王
- 安庆帕萨特最新价格2025款,最低售价12.35万起,入手正当时
- 亳州宝来新款价格2025款多少钱?选车指南与落地价全解析
- 生活家PHEV 2025新款价格,最低售价63.98万起现在该入手吗?