ASAM – vivo公司推出的AI图像分割模型

AI快讯1个月前发布 AI导航之家

46 0 0

ASAM是什么

ASAM（Adversarial Adjustment of Segment Anything Model）是vivo公司推出的AI图像分割模型，通过对抗性调整来增强原有SAM模型的性能。ASAM用自然对抗性示例，通过稳定的扩散模型增强数据集，生成能代表自然变化的对抗性实例。这些实例保持照片级真实感，与原始掩模注释对齐，确保了分割任务的完整性。

ASAM – vivo公司推出的AI图像分割模型

ASAM的主要功能

提升能力：ASAM让原本的SAM模型在图像分割任务上做得更好。
不用改变：不需要改变模型的基本结构，就像给汽车换个新轮胎，但车身不变。
增加挑战：通过添加一些特殊的图像（对抗性样本），模型学会在更多不同的情况下工作。
更真实：这些特殊的图像看起来和真的一样，模型学习得更贴近现实。
不用新数据：不需要额外的图片或数据，就像用旧书复习，也能学到新知识。
全面提高：在多种不同的图像分割任务上，ASAM能让模型表现得更出色。

ASAM的技术原理

对抗性训练：ASAM利用对抗性训练的概念，通过向模型输入精心设计的扰动来提高模型泛化能力的方法。
自然对抗性示例：ASAM特别关注自然对抗性示例，示例在视觉上与正常样本相似，在模型的决策边界附近。
稳定扩散模型：ASAM使用稳定扩散模型来增强SA-1B数据集的一个子集，生成对抗性实例。这种方法能在保持图像质量的同时，引入细微的扰动。
照片级真实感：生成的对抗性样本需要保持与原始图像相同的视觉真实性，这样在训练过程中，模型就不会因为不真实的样本而学习到错误的特征。
掩模注释对齐：对抗性样本需要与原始的掩模注释保持对齐，确保在分割任务中，模型能够正确地识别和分割目标对象。
微调过程：ASAM通过用这些对抗性样本对原有的SAM模型进行微调，在不改变原始架构的前提下提高模型性能。

ASAM – vivo公司推出的AI图像分割模型

ASAM的项目地址

GitHub仓库：https://github.com/luckybird1994/ASAM
Hugging Face模型库：https://huggingface.co/spaces/xhk/ASAM
arXiv技术论文：https://arxiv.org/pdf/2405.00256

ASAM的应用场景

医学图像分析：在医学领域，ASAM可以用于提高医学图像分割的准确性，辅助医生进行疾病诊断和治疗规划。
自动驾驶汽车：在自动驾驶技术中，ASAM可用于提高道路和物体的分割精度，增强车辆对周围环境的理解能力。
机器人视觉：在机器人技术中，ASAM可以帮助机器人更好地理解其工作环境，进行精确的物体识别和操作。
增强现实（AR）：在AR应用中，ASAM可以提升虚拟对象与现实世界融合的自然度，提供更加沉浸式的体验。

# AI快讯 # 模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

PixVerse V2 – 爱诗科技最新发布的AI视频大模型

AI导航之家

61 0

山海大模型 – 云知声推出的多模态AI大模型

AI导航之家

21 0

GPT-4o mini – OpenAI 推出全新 AI 模型替代GPT-3.5

AI导航之家

74 0

CriticGPT – OpenAI推出的识别GPT输出代码错误的模型

AI导航之家

93 0

Stable Fast 3D – Stability AI推出的AI新模型，0.5秒将图片转为3D

AI导航之家

45 0

GPT-4o Long Output模型 – OpenAI最新推出的超长输出模型

AI导航之家

59 0

AI导航之家收集了AI文本生成、AI图像软件、AI聊天软件、AI翻译软件、AI音频软件、AI办公软件、AI行业软件等国内外优秀的AI软件工具，致力于为您提供最实用的AI工具。

免责声明广告合作关于我们

Copyright © 2024 AI导航之家闽ICP备14018711号-6