开源 - AI导航之家

Omages – 开源的3D模型生成项目

Omages是一个开源的3D模型生成项目，基于图像扩散技术将3D形状的几何和纹理信息编码进64x64像素的2D图像中，从而简化3D建模流程。

AI快讯

1周前

eSearch – 开源的AI桌面应用，截屏、OCR、搜索、翻译、录屏

eSearch是一款开源的跨平台AI桌面应用，集成了截屏、OCR识别、搜索翻译、贴图、以图搜图和屏幕录制等功能。eSearch基于Electron框架开发，适用于Linux、Windo...

AI快讯

2周前

Dify – 开源的生成式AI应用开发平台

Dify.AI 是开源的生成式AI应用开发平台，提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等一站式服务。Dify.AI 使开发者能够专注于创造应用的核...

AI快讯

2周前

ORMBG – 开源的AI图像分割工具

ORMBG是开源的AI图像分割工具，由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景，用先进的图像处理技术，实现对图像中前景和背景的精...

AI快讯

3周前

Clapper – 免费开源的可视化AI视频编辑工具

Clapper 是一款免费开源的可视化AI视频编辑工具，由 HuggingFace 的AI前端工程师 Julian Bilcke 开发。集成多种生成式 AI 技术，用户通过交互式、迭代和直观...

AI快讯

3周前

Deep-Live-Cam – 开源的 AI 实时换脸工具

Deep-Live-Cam 是开源的AI实时换脸工具，用户仅需一张图片即可在视频中实现实时人脸交换。支持 CPU、NVIDIA CUDA、Apple Silicon、Core ML 等多种硬件平台，...

AI快讯

4周前

CogVideoX – 智谱AI推出的开源AI视频生成模型

CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词，能生成6秒长、每秒8帧、分辨率为720*480的视频。...

AI快讯

1个月前

Whisper-Medusa – aiOla推出的开源AI语音识别模型

Whisper-Medusa是aiOla推出的开源AI语音识别模型，结合了OpenAI的Whisper技术与aiOla的创新，Whisper-Medusa引入了多头注意力机制，实现了并行处理，显著提升...

AI快讯

1个月前

MinerU – OpenDataLab推出的开源智能数据提取工具

MinerU是上海人工智能实验室OpenDataLab团队推出的开源智能数据提取工具，专注于复杂PDF文档的高效解析与提取。MinerU能将包含图片、公式、表格等元素的多模...

AI快讯

1个月前

FLUX.1 – Stable Diffusion创始团队推出的开源AI图像生成模型

FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型，拥有12B参数，是迄今为止最大的文生图模型。包含三种变体：顶级性能的FLUX.1 [pro]、开源非商...

AI快讯

1个月前

标签：开源

Omages – 开源的3D模型生成项目

eSearch – 开源的AI桌面应用，截屏、OCR、搜索、翻译、录屏

Dify – 开源的生成式AI应用开发平台

ORMBG – 开源的AI图像分割工具

Clapper – 免费开源的可视化AI视频编辑工具

Deep-Live-Cam – 开源的 AI 实时换脸工具

CogVideoX – 智谱AI推出的开源AI视频生成模型

Whisper-Medusa – aiOla推出的开源AI语音识别模型

MinerU – OpenDataLab推出的开源智能数据提取工具

FLUX.1 – Stable Diffusion创始团队推出的开源AI图像生成模型

最新文章