标签:腾讯

VITA – 腾讯推出的开源多模态AI模型

VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型,扩展了中文词汇量,进行了...

PhotoMaker V2 – 腾讯推出的AI图像生成框架

PhotoMaker V2是腾讯推出的AI图像生成框架,能在极短的时间内生成逼真的人物照片。与初代相比,V2版本在角色的一致性和可控性上实现了显著提升,用户可以通过...

SEED-Story – 腾讯联合港科大、港中文推出的多模态故事生成模型

SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型(MLLM),能预测文本和视觉token,通过视觉de-tokenizer生...

MimicMotion – 腾讯推出的AI人像动态视频生成框架

MimicMotion是腾讯的研究人员推出的一个高质量的人类动作视频生成框架,利用置信度感知的姿态引导技术,确保视频帧的高质量和时间上的平滑过渡。此外,MimicM...

Follow-Your-Emoji – 腾讯等推出的基于扩散模型的人像动画框架

Follow-Your-Emoji是由香港科技大学、腾讯混元和清华大学的研究人员推出的一个基于扩散模型的人像动画框架,利用扩散模型为参考肖像添加目标表情序列,实现动...

ToonCrafter – 腾讯等开源的卡通动画视频插帧工具

ToonCrafter是由腾讯AI实验室、香港中文大学和香港城市大学的研究人员开源的卡通动画视频插值工具,突破了传统卡通动画制作中线性运动的假设限制,采用创新的...