创科网旨在为读者提供个性化的阅读体验,使读者更易找到有用的优质文章。

当前位置:网站首页 > 电脑知识 > 正文

Apple发布Pico-Banana-400K数据集 助力文本引导图像编辑研究

游客 游客 . 发布于 2025-10-30 18:13:04 13 浏览

品玩10月29日讯,据9to5MAC 报道,Apple近日发布Pico-Banana-400K数据集,含40万张精选图像,该数据集依托Google Gemini-2.5系列模型构建,相关研究论文《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》同步公开。

数据集采用非商业研究许可,仅限学术与AI研究使用,不可商用。其构建以OpenImages的真实照片为基础,涵盖35种编辑类型(分8类),经Gemini-2.5-Flash-Image(Nano-Banana)生成编辑图像后,由Gemini-2.5-Pro审核指令合规性与视觉质量。数据集包含单轮编辑、多轮编辑序列及成败结果偏好对。

尽管Apple承认Nano-Banana存在技术局限,但期望该数据集为下一代编辑模型提供训练与基准测试基础。研究论文可在arXiv查阅,数据集于GitHub免费开放。

Apple发布Pico-Banana-400K数据集 助力文本引导图像编辑研究

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。

站长推荐
热门tag
电脑知识笔记本电脑电脑手机怎么办油烟机打印机网络科技使用方法投影仪冰箱方法热水器苹果手机洗衣机怎么显示器复印机什么充电器
标签列表
友情链接