AI快讯

CogVideoX – 智谱AI推出的开源AI视频生成模型

CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词，能生成6秒长、每秒8帧、分辨率为720*480的视频。...

AI快讯

1个月前

PhotoMaker V2是腾讯推出的AI图像生成框架，能在极短的时间内生成逼真的人物照片。与初代相比，V2版本在角色的一致性和可控性上实现了显著提升，用户可以通过...

AI快讯

1个月前

SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型（MLLM），能预测文本和视觉token，通过视觉de-tokenizer生...

AI快讯

1个月前

FlashFace是阿里联合香港大学推出的高保真AI写真工具。能基于用户提供的面部图像和文本提示，快速生成个性化的高保真人像写真图。FlashFace具备高保真度身份...

AI快讯

1个月前

EasyAnimate是阿里推出的AI视频生成工具，支持文生视频和图生视频两种方式，用户可以上传图片作为视频的起始和结束画面，实现更灵活的视频编辑。EasyAnimate...

AI快讯

1个月前

秒画趣拍是商汤推出的AI创意写真小程序，基于商汤科技的'日日新·秒画'文生图大模型，为用户提供了一种新颖的摄影体验。用户可通过上传一张照片，使用小程序提...

AI快讯

1个月前

EmoTalk3D是华为诺亚方舟实验室、南京大学和复旦大学共同推出的3D数字人框架。技术的核心在于能合成具有丰富情感表达的3D会说话头像。EmoTalk3D能捕捉和再现...

AI快讯

1个月前

Stable Fast 3D（SF3D）是Stability AI推出的一种创新3D网格重建技术，能在0.5秒内从单张图片生成高质量的3D模型。Stable Fast 3D采用先进的Transformer网络...

AI快讯

1个月前

Tora是阿里推出的AI视频生成框架，基于轨迹导向的扩散变换器（DiT）技术，将文本、视觉和轨迹条件融合，生成高质量且符合物理世界动态的视频内容。Tora由轨迹...

AI快讯

1个月前

Whisper-Medusa是aiOla推出的开源AI语音识别模型，结合了OpenAI的Whisper技术与aiOla的创新，Whisper-Medusa引入了多头注意力机制，实现了并行处理，显著提升...

AI快讯

1个月前