当前位置:主页 > 业界 > 正文

比OpenAI的DALL-E 3快100多倍!文生图模型测试出现“神秘”王者

发布时间:2024-10-29 已有: 位 网友关注

  Artificial Analysis使用 Elo评级制度比较其测试的各种模型的性能。Elo最初是为衡量国际象棋选手相对技能水平而开发的排名系统。

  与AI标准的测评平台Chatbot Arena 类似,Artificial Analysis 也通过众包对模型进行排名。对于评估图像模型,Artificial Analysis 的做法是,随机选择两个模型,对模型提供独特的提示词,然后展示提示词以及模型生成的结果,由用户选择他们认为哪个模型生成的图像能更好地反映提示词的要求。下图为red_panda生成的图像示例。

  当然,用户的投票评估过程中存在一些偏见。参与Artificial Analysis评测的投票者大多是人工智能爱好者,他们的选择可能无法反映更广泛的生成式AI用户群体有何偏好。

  但red_panda也是排行榜上生成速度最快的模型之一。该模型生成图像的平均耗时7秒左右——比 OpenAI 的 DALL-E 3 快 100 多倍。

  除了性能,red_panda留给大众可查的信息很少,不知道它从哪里来、哪家公司制造、预计什么时候可以正式发布。Artificial Analysis在社交媒体X分享测试结果时也问:什么是 red_panda?

  科技媒体TechCrunch认为,现在AI实验室越来越喜欢在发布产品之前先用业内基准测试激发人们的期望,所以我们可能很快就知道red_panda的“出身”等详情。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。