核心能力
访问先进的 embedding 模型,获得专业图片理解能力。
CLIP 语义搜索
基于 Google Gemini Embedding / qwen3-vl-embedding 的向量检索,支持自然语言描述搜索图片,准确理解语义。
OCR 文字识别
基于 PaddleOCR-VL 引擎,精准提取图片文字内容,并可与视觉特征融合提升检索准确率。
人脸识别
基于本地人脸识别模型检测图片中的人脸并提取特征向量,本地运行,不消耗云端额度。
运行模式
灵活适配不同使用场景,从个人照片库到更大规模的批处理任务。
官方 API 模式
推荐登录 Copilot API,按量计费,支持融合向量。
- 一键登录,免自备 Key
- 批处理流水线 + 数据库写入
- 注册送 ¥5 免费额度
BYOK 模式
开发中使用自己的 Google / 阿里 API Key,支持实时 API 调用。
- 自备 API Key
- CLIP 语义搜索
- OCR 文字识别
常见问题
人脸识别在客户端本地运行,不消耗云端 Token,不产生额外费用。
它适合截图、票据、文档照片等含文字图片。系统会把 OCR 文字与视觉特征一起向量化,提高以文搜图的命中率。
立即开始使用 MT Copilot
为你的照片库注入智能搜索能力。