腾讯 - AI导航之家

VITA – 腾讯推出的开源多模态AI模型

VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型（MLLM），能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型，扩展了中文词汇量，进行了...

AI快讯

1个月前

PhotoMaker V2是腾讯推出的AI图像生成框架，能在极短的时间内生成逼真的人物照片。与初代相比，V2版本在角色的一致性和可控性上实现了显著提升，用户可以通过...

AI快讯

1个月前

SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言模型（MLLM），能预测文本和视觉token，通过视觉de-tokenizer生...

AI快讯

1个月前

MimicMotion是腾讯的研究人员推出的一个高质量的人类动作视频生成框架，利用置信度感知的姿态引导技术，确保视频帧的高质量和时间上的平滑过渡。此外，MimicM...

AI快讯

2个月前

Follow-Your-Emoji是由香港科技大学、腾讯混元和清华大学的研究人员推出的一个基于扩散模型的人像动画框架，利用扩散模型为参考肖像添加目标表情序列，实现动...

AI快讯

3个月前

ToonCrafter是由腾讯AI实验室、香港中文大学和香港城市大学的研究人员开源的卡通动画视频插值工具，突破了传统卡通动画制作中线性运动的假设限制，采用创新的...

AI快讯

3个月前