当前位置:主页 > 聚焦 > 正文

AI生成“暗战”起风

发布时间:2025-09-29 已有: 位 网友关注

  正在冲刺港交所IPO的群核科技亦在研发一款基于3D技术的AI生成产品,有望在年内发布。

  群核科技内部人士向信风透露,该AI生成产品未来将面向C端用户开放。

  群核科技的重要优势在于,庞大且物理正确的室内空间数据集。

  “我们在开发工具的过程当中,积累了海量的数据,这些海量数据与AI直接生成的三维模型不一样,包括有物理正确可交互的模型,材质也都是物理正确的,表面的物理系数都有,里边有结构化的信息,也就有结构化标注。”群核科技董事长黄晓煌指出。

  今年8月,群核科技的数据集InteriorGS还曾一度登上全球最大AI开源社区Hugging Face趋势榜的榜首,成为全球首个适用于智能体自由运动的大规模3D数据集。

  这或许都给不少公司带来更多压力,要求各方进一步拓宽商业化边界。

  目前市场对该行业的想象空间并不止于影视广告行业,还有机器人训练等场景。

  一直以来,机器人训练面临训练数据的稀缺性、场景覆盖局限性、采集成本高等痛点,但AI生成应用可以为机器人提供虚拟场景进行训练,进而更好地了解真实世界的运行规律。

  部分机器人公司正在自研算法。例如今年3月具机器人公司逐际动力发布的具身智能操作算法LimX VGM,正是利用生成技术推动具身大脑突破。

  一名参与该项目人士向信风坦承,受限于数据量的问题,目前生成大模型的泛化程度有限。

  但该人士持乐观态度,颇为看好AI生成模型用于机器人虚拟环境训练的行业趋势。

  此前业绩会上,快手管理层则表示计划扩大“可灵”在游戏制作、专业电影以及

  尽管当前各家AI生成公司均表示提升了空间一致性,但信风实测来看主体运动过程中脸部表情崩坏、背景出现清晰模糊交织的问题层出不穷。

  以拍我为例,信风使用图生的方式生成了一段人物跳舞的短,但出现人物表情变形、物体凭空消失等问题。

  杭州一位行业人士告诉信风,复杂运动场景下偶现的面部细节与背景一致性问题,是行业共同面临的技术挑战,核心难点在于模型对长时序运动轨迹与多尺度语义连贯性的精准建模。

  群核科技产品经理龙天泽认为这与训练的数据

  “核心在于现在的AI算法是基于2D图像序列去学习,所以不可能线D空间和规则,它学会了如何让上一帧图像在

  目前各方主要从优化算法、构建数据集的角度解决空间一致性问题。

  生数科技告诉信风,目前主要通过三大路径进行优化:一是基于自研U-ViT架构的时空联合注意力机制优化,增强模型对主体运动轨迹与背景关联性的预测能力;二是构建超大规模高质量训练数据集,针对性强化复杂运动模式的语义理解;三是引入动态遮罩与一致性补偿算法,在后期生成环节实时修复帧间异常。

  “目前我们的参考生功能已实现从人脸到主体多层次的一致性提升,后续将重点突破大幅度运动下的稳定性边界。”生数科技表示。

  群核科技方面则是在推进3D生成的工作流研发,有望在变化的运境下降低明显的穿模和畸变的反应。

  不过这类方式的挑战在于,使用者需要掌握生成的数据输入等。

  高质量的数据集是当前不少AI生成模型公司渴求的训练素材。

  部分国外大厂为了提升对AI生成模型的人物主体一致性的训练,甚至不惜通过下载成人电影作为训练素材。

  Meta便遭受如此质疑。

  今年7月,两家美国成人电影公司Strike 3 Holdings和Counterlife Media,便以Meta偷偷下载2396部成人电影训练自家的AI模型为由,将其推向了被告席。

  “确实是个很新的案件,涉及,估计Meta还是会主张fair use。”一位在美执业的知识产权律师告诉信风,“现在对于这些训练素材也没有什么统一的规则,只能是争议中前行。”

  相比之下,国内的平台在训练素材方面或许拥有更多弹性的空间,这当中尤以平台独具优势。

  虽然平台并不拥有对用户所发布的独占权,但一般拥有使用权。

  例如快手的中明确指出,为了实现广告推送与投放,并有助于其评估广告投放效果、有效性之目的,可能需要与广告主、服务商、供应商第三方合作伙伴读取用户的部分信息与数据。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。