智谱AI版Sora开源:首个可商用的国产视频生成大模型
在AI技术的浪潮中,智谱AI近日宣布将其视频生成模型——智谱AI版Sora(清影)开源,这是首个可商用的国产视频生成大模型。此举不仅在GitHub上引起了热烈反响,更预示着国产AI视频生成技术的一次重大突破。
产品介绍
智谱AI版Sora(清影)是一款基于大语言模型的视频生成工具,它能够根据用户提供的文本提示(Prompt)生成高质量的视频内容。该模型名为CogVideoX-2B,在GitHub发布仅5个小时便狂揽了3.7K个Star,足以见其受欢迎程度。
技术亮点
三维变分自编码器结构(3D VAE):智谱AI自研的高效3D VAE结构,能够将原始视频空间压缩至2%,大幅降低了视频生成模型的训练成本和难度。
专家Transformer:通过VAE编码器将视频压缩至潜在空间,并结合T5模型处理文本输入,形成一个强大的Transformer架构,以生成高质量的视频。
数据筛选与处理:智谱AI开发了负面标签来识别和排除低质量视频,并通过video-llama训练的过滤器标注和筛选视频数据点,确保生成视频的质量。
应用与发展方向
智谱AI版Sora的开源,不仅为开发者提供了强大的工具,也为视频生成领域带来了新的可能性。模型的易用性和高效性,使得从专业创作到日常娱乐的应用场景都得以拓展。
新功能与用户体验
- 在线可玩:用户可以直接在HuggingFace上体验生成的视频效果。
- 快速生成:在单卡A100显卡上,仅需90秒即可生成视频。
- 多模态融合:智谱AI清影支持文生视频和图生视频,提供了丰富的创作工具和体验。
市场与竞争
在视频生成领域,智谱AI版Sora的开源与OpenAI的Sora和快手可灵的视频生成模型形成了竞争。智谱AI以其开源免费的特点,迅速在市场上占据了一席之地。
结语
智谱AI版Sora的开源,不仅展示了国产AI技术的实力,也为视频生成领域带来了新的活力。未来,随着技术的不断进步和市场需求的增长,我们期待看到更多创新的应用场景和商业模式的出现。
参考链接: