文档/进阶

与 Nephele 对话

Nephele 的首页就是对话界面。和普通的聊天机器人不同,Nephele 不只是给你文字回复——它会真的去操作你的电脑:打开浏览器搜图、整理 Eagle 素材、批量打包作品、运行 Python 脚本处理文件。

这一页不讲原理,只讲你实际打开软件后能怎么用它。


界面操作

一个输入框,三层分流

你不需要在「模式」之间手动切换。直接在首页输入框里说你想做什么,Nephele 会自动分流:

  1. 规则引擎(本地·零延迟) — 「打开 Photoshop」「打开下载文件夹」这类明确命令直接执行,不走 AI、不联网、不消耗任何额度。
  2. 引导通道闸门(免费·轻量模型) — 你打字时,一个轻量模型先看一眼:软件用法、导航、一句话事实这类轻问题就地免费答掉,不消耗 stamina。设计上偏向放行,任何故障一律放行,绝不卡住你的输入。
  3. Cloud MAX(完整 Agent) — 真正要动手干活的请求进入完整 Agent,调用工具帮你完成任务,按云晶计费。

工具栏右上还有一个 「?」引导助手,随手就能问「这功能怎么用」——它由同一个轻量模型驱动,免费,答不上来或你想深入时会带着你的原话「升级」到 Cloud MAX。详见下文。

拖图片到输入框

直接把图片文件拖到输入框上,会显示一个 60×60 的缩略图。点右上角的 × 可以移除。支持 PNG、JPG、JPEG、WEBP、BMP、GIF。

拖入的图片会作为附件随你的文字一起发送给 Agent。比如拖一张图然后问"帮我写一段适合发 Pixiv 的文案",Nephele 会基于这张图片生成内容。

停止生成

如果 Nephele 正在输出内容,输入框右侧会出现一个停止按钮(方块图标)。点击后当前流会中断,显示"[已停止]"。


Skill 系统:Nephele 为什么能"听懂"你的意图

你可能注意到,同样的指令发给不同的 AI,结果天差地别。Nephele 的秘诀不是更聪明的模型,而是**Skill**。

什么是 Skill

Skill 是一个纯文本文件(SKILL.md),用自然语言描述"当用户说 X 时,你应该怎么做"。它不是插件、不需要安装、不写代码,本质上就是一份给 AI 的"工作手册"。

一个 Skill 长这样:

yaml
---
name: find-references
description: 找参考图
emoji: "🎨"
tools: [find_references, find_similar_by_image]
keywords: [参考图, 找图, 灵感, 搜图, 风格参考, Pixiv, 以图搜图]
---
 
## Decision tree
 
- 关键词 → 调用 find_references(Pixiv+Eagle 并行)
- 图片 → 调用 find_similar_by_image(Eagle 视觉相似度)
- Pixiv 标签必须用日文:初音未来 → "初音ミク",赛博朋克 → "サイバーパンク"

当你说"帮我找一些机甲参考"时,Nephele 会:

  1. 匹配 Skill:扫描所有 Skill 的 keywords,命中"参考""机甲"→ 加载 find-references
  2. 注入提示:把这个 Skill 的完整策略塞进 AI 的 system prompt
  3. 执行:AI 不仅知道要调用什么工具,还知道 Pixiv 标签要用日文、不要用中文搜图

内置 Skill

目前内置了四个 Skill

Skill场景核心策略
find-references找参考图关键词搜图按需并行多平台;以图搜图走本地视觉嵌入相似度;Pixiv 标签必须翻译成日文
trace-artwork-origin追查原作者/出处视觉优先:先让 AI 自己看图识别角色/画风/签名,只有当图里完全没特征时才花钱做反向搜图
eagle-organize整理 Eagle 素材库先搜后批量操作,按标签/扩展名筛选再加标签、移文件夹或清理
build-moodboard拼氛围板收图后做视觉层级布局 + 提取色卡,自动落到参考板并导出

trace-artwork-origin 有个很贴心的设计:如果你丢一张图问"这是谁画的",Nephele 会先看图——如果它认得出角色或画风,直接免费告诉你;只有实在认不出来、或者你要追具体 URL 时,才会调用收费的反向搜图引擎。不是为了省钱,是为了不花冤枉钱

Skill 从哪来

Nephele 加载 Skill 有三个来源,优先级从高到低:

  1. 云端推送(remote) — 通过远程配置下发,无需用户操作。同名会覆盖下面两层。适合紧急修复策略或推送新能力。
  2. 用户自定义C:\Users\<用户名>\.nephele_workshop\skills\(或对应平台的用户目录)。同名会覆盖内置的。
  3. 内置 — 软件自带的 skills/ 文件夹。

如果你在第 2 层的目录下新建一个文件夹,里面放一份 SKILL.md,Nephele 下次启动就会自动加载。

注意

每条对话最多加载 2 个 最相关的 Skill,单个 Skill 正文上限 7000 字符。这是为了保护上下文窗口——技能手册太长,反而会挤占对话记忆的空间。

未来:UGC Skill 市场

我们正在计划一个 Skill 市场。你可以把自己写的 SKILL.md 分享给其他画师,也可以下载别人写的——比如"Pixiv 运营策略""Comiket 参展 checklist""特定画风分析指南"。

Skill 的妙处在于它不依赖代码能力。你不会编程?没关系,只要你会描述自己的工作流程,就能写出一个有用的 Skill。


云端模式(Cloud MAX):实际能做什么

这是 Nephele 的完整形态,下面列的是代码里已经实现、可以实际调用的场景。

搜参考图

你可以直接说:

  • "去 Pixiv 搜一些赛博朋克插画"
  • "去 Pinterest 找日系角色设计参考"
  • "在 Eagle 里搜标签带'机甲'的图"

Nephele 会打开内置浏览器,搜索并把结果以图片卡片的形式返回在对话里。你可以直接勾选想要的图,一键保存到本地或 Eagle。如果结果不满意,可以接着说"再换一批"或"我只要竖构图的"。

边界:Pixiv 搜索走云端节点;Pinterest、ArtStation、花瓣(Huaban)通过 Nephele Wisp 浏览器扩展走你自己的 Edge 浏览器(需要扩展在线,没有 Playwright 兜底);Konachan、Eagle、Wikimedia Commons 也是可用源。默认只搜本地 Eagle 库,网络源需要你明确指定。如果目标网站不可达或弹出 CAPTCHA,可能会失败。

以图搜图(本地 Eagle

上传一张图,说"在 Eagle 里找和这张图相似的",Nephele 会调用打标时顺带产出的视觉嵌入做余弦相似度,叠加标签重叠度排序,返回 Eagle 里最相似的素材。

前提

  1. 这些图必须先经过资源库索引(打标时一并写入视觉嵌入),首次索引需要几分钟
  2. 只有已索引过的图才能被以图搜图命中

Eagle 素材管理

  • "把下载文件夹里所有插画类的图导入 Eagle"
  • "帮我把'参考'文件夹里带'机械'标签的图移到'机甲参考'文件夹"
  • "给这批图批量加上'待评估'标签"
  • "删除 Eagle 里重复的图片"

边界:导入时会自动用本地标注模型打标(如果模型已加载)。批量操作如果涉及大量文件,可能需要一些时间,Nephele 会显示进度。

作品处理

  • "复盘一下这张图" — 调用创作复盘,按作品类型给出字母评级(S 到 E)+ 三段叙事反馈(你做到的 / 可探索的 / 下一张可以试)
  • "检测一下这张图是不是 AI 生成的" — 调用 AI 凭据检测,扫描 EXIF/IPTC/生成参数指纹
  • "帮我写一段适合发 Pixiv 的文案" — 调用聚合上传的多平台文案生成
  • "给这张图加个水印再打包" — 调用发布打包,输出一张处理后的图
  • "给这张图签发数字存证" — 调用数字存证

边界:这些工具需要你上传图片或指定文件路径。存证需要联网(时间戳服务器)。打包会输出文件到指定目录。

运行 Python 脚本

  • "写一个脚本,把当前文件夹里所有 PNG 按日期重命名"
  • "统计一下这个文件夹里有多少张图"

Nephele 会生成代码并展示在一个深色代码卡片里。你必须点确认才会执行。执行前你可以修改代码。这是安全设计——Nephele 不会在你不知情的情况下运行任何代码。

边界:脚本由独立的 Python 解释器以隔离模式(-I,忽略环境变量和用户 site-packages)在子进程中执行,可以访问文件系统和软件自带的 Python 库(PIL、numpy、onnxruntime 等)。涉及删除等不可逆操作时,Nephele 会先列清单要你二次确认才执行。

系统快捷操作

  • "打开 Photoshop"
  • "打开 C:\Users\Artist\Downloads"
  • "今天天气怎么样"

这类简单命令不走 AI,直接通过规则引擎执行,几乎是零延迟。

边界:打开应用依赖系统路径解析,如果软件安装位置非常规,可能找不到。天气查询会打开浏览器访问 Bing 搜索。

不能做什么(云端也不行)

  • 不能直接上传作品到平台 — Publisher 只生成文案和标签,不实际上传
  • 不能修改你的画作 — Nephele 不提供绘画功能,不会碰你的 PSD/CLIP 文件内容
  • 不能绕过网站登录 — 如果 Pinterest 等网站要求登录,Nephele 无法自动处理
  • 不能保证 100% 准确的 AI 检测 — AI 凭据检测依赖元数据,可以被篡改

引导通道:免费问「怎么用」

不是每个问题都值得动用完整 Agent。引导通道由一个轻量模型(Axioma Zephyr)驱动,专门免费消化「软件怎么用」这类轻问题,不消耗 stamina(有每日上限)。它有两个出现的地方:

工具栏「?」助手

点工具栏右上的「?」,弹出一个引导层。它有两种用法:

  • 选项卡片流(chips) — 一组预设的引导卡片,纯本地、不调用 AI,点哪张走哪条路。适合「我想做 X,第一步点哪」这种确定性引导。
  • 自由输入 — 直接打字提问,流式回答。它知道你当前在哪个界面,所以答案是「就地」的。答不上来、或你说「展开讲讲 / 帮我做」时,它会带着你的原话升级到 Cloud MAX(升级前会让你确认)。

主输入框前的闸门

你在首页输入框打字时,引导通道还会作为一道「闸」先看一眼。软件用法、导航、一句话事实、需要你澄清一轮的问题,它就地免费答掉;其余的放行给 Cloud MAX。

提示

引导通道只回结构化的白名单动作(比如「帮你跳到某个界面」「播放一段演示」),不会生成任意的界面操作序列。它的设计原则是偏向放行 + 故障一律放行——宁可多放一个问题给 Cloud MAX,也绝不卡住你的输入。


消耗与限制

Stamina(疲劳值)与 Nepheline(云晶)

Nephele 有两个独立的资源池,不要搞混:

Stamina(疲劳值)

  • 测试期的每日免费额度,每天自动刷新
  • 用来体验云端功能,不需要付费
  • 当日用完就停,第二天恢复

Nepheline(云晶)

  • 付费资源池,年度订阅附带 + 可充值
  • 充值购买Nepheline 永久有效;年度赠送的在订阅期内有效,到期冻结、续费恢复
  • 测试期(含当前 Beta)保留每日免费额度;正式版后免费政策会调整,以届时公告为准

什么会消耗、什么不会

  • 规则引擎处理的快捷命令:零消耗
  • 引导通道就地答掉的轻问题:免费,不扣 stamina(有每日上限)
  • 进入 Cloud MAX 的请求:按云晶计费,多轮工具任务消耗较高

工具调用上限

Cloud MAX 每条消息最多执行 20 次工具调用。超过会自动收尾。这是硬性限制,防止意外消耗和无限循环。

上下文窗口

Cloud MAX 由 Axioma Breeze 驱动,1M tokens 上下文,通常不会溢出。单次输出上限 8192 tokens,是防止失控消耗的护栏,不是模型能力上限。

大结果压缩

如果工具返回了很大的原始结果(比如一次反搜或一批参考图),服务端会先用轻量模型把它压缩成主模型决策需要的事实摘要,再喂给 Cloud MAX。压缩只保留关键信息(失败原因、来源可信度、下一步阻塞点等),防止长文本把上下文窗口撑爆。压缩失败时会保留原始结果,对话不会中断。


常见问题

Q: 为什么 Nephele 有时候会重复执行同一个工具?

如果工具返回了错误,Nephele 会尝试修正并重新执行。但如果连续两次执行完全相同的工具调用,循环会自动终止,防止卡死。

Q: 简单问题也会扣我的额度吗?

不会。明确的快捷命令走本地规则引擎,零消耗;「这功能怎么用」这类轻问题由引导通道免费答掉,不扣 stamina。只有真正要 Agent 动手干活的请求才进入 Cloud MAX 计费。

Q: 不用云端 AI 能做多少事?

绝大多数事。Nephele 内嵌了多个本地 AI 模型(自动打标、以图搜图、跨语言语义搜索),打标、索引、搜图、语义检索、水印、存证、维权、文件处理全在你电脑上跑、断网照用。AI 凭据检测靠的是本地解析图片元数据/凭据(不是云端推理),同样断网可用。需要联网的主要是和 Nephele 自然语言对话这类 Agent 能力(让它规划任务、调用工具、联网搜索)。

Q: 我可以同时开多个对话吗?

可以。左侧滑出的会话历史面板里,点"新建会话"就能开新对话。不同会话之间历史不共享。

Q: Nephele 会保存我的聊天记录吗?

对话历史保存在本地数据库里,不会上传到服务器。但云端模式的 AI 推理过程会经过 Axioma 服务器,这是使用云端功能的必要条件。


最后更新 2026年6月21日·对应版本 v0.5.2-beta