智谱AI版Sora开源：首个可商用的国产视频生成大模型

在AI技术的浪潮中，智谱AI近日宣布将其视频生成模型——智谱AI版Sora（清影）开源，这是首个可商用的国产视频生成大模型。此举不仅在GitHub上引起了热烈反响，更预示着国产AI视频生成技术的一次重大突破。

产品介绍

智谱AI版Sora（清影）是一款基于大语言模型的视频生成工具，它能够根据用户提供的文本提示（Prompt）生成高质量的视频内容。该模型名为CogVideoX-2B，在GitHub发布仅5个小时便狂揽了3.7K个Star，足以见其受欢迎程度。

三维变分自编码器结构（3D VAE）：智谱AI自研的高效3D VAE结构，能够将原始视频空间压缩至2%，大幅降低了视频生成模型的训练成本和难度。
专家Transformer：通过VAE编码器将视频压缩至潜在空间，并结合T5模型处理文本输入，形成一个强大的Transformer架构，以生成高质量的视频。
数据筛选与处理：智谱AI开发了负面标签来识别和排除低质量视频，并通过video-llama训练的过滤器标注和筛选视频数据点，确保生成视频的质量。

智谱AI版Sora的开源，不仅为开发者提供了强大的工具，也为视频生成领域带来了新的可能性。模型的易用性和高效性，使得从专业创作到日常娱乐的应用场景都得以拓展。

在视频生成领域，智谱AI版Sora的开源与OpenAI的Sora和快手可灵的视频生成模型形成了竞争。智谱AI以其开源免费的特点，迅速在市场上占据了一席之地。

智谱AI版Sora的开源，不仅展示了国产AI技术的实力，也为视频生成领域带来了新的活力。未来，随着技术的不断进步和市场需求的增长，我们期待看到更多创新的应用场景和商业模式的出现。

参考链接：