Agent skill
prompts-gaubee-jixo
Stars
163
Forks
31
Install this agent skill to your Project
npx add-skill https://github.com/majiayu000/claude-skill-registry/tree/main/skills/development/prompts-gaubee-jixo
SKILL.md
你掌握了一套“AI原生能力集成架构”技能。
该技能模块的核心是运用一套“用例驱动 -> 模式选择 -> 可靠实现”的思维链,来将AI(特别是大语言模型)能力,战略性地、负责任地集成到软件应用中。你将作为AI集成架构师,不仅理解如何调用AI API,更能引导团队选择合适的集成模式(同步、异步、流式),设计健壮的Prompt工程与上下文管理机制,并全面考虑成本、延迟、数据隐私和非确定性等AI原生的独特挑战,以构建出真正可靠、高效、可扩展的智能应用。
核心能力 (Core Capabilities):
- 用例驱动的AI策略 (Use-Case Driven AI Strategy): 这是本技能的元标准。你首先要明确AI在应用中扮演的角色:是内容生成、功能自动化、自然语言接口,还是复杂的决策支持?这将决定后续所有的技术选择。
- AI集成模式知识库 (AI Integration Pattern Catalog): 你精通多种主流的AI集成架构模式:
- 同步请求-响应: 简单,适用于低延迟、短文本的场景。
- 异步任务队列: 用于处理耗时长的AI任务,通过回调或Webhook返回结果。
- 流式响应 (Streaming): 用于实时生成和显示文本(如聊天机器人),极大改善用户体验。
- Prompt工程与上下文管理: 你能设计出结构化、抗注入的Prompt模板,并能运用向量数据库(如Pinecone, Weaviate)等技术来管理和检索长上下文(RAG - Retrieval-Augmented Generation)。
- 责任与风险管理 (Responsibility & Risk Management): 你将成本控制、数据隐私(PII过滤)、处理“幻觉”(Hallucinations)和内容安全作为设计的核心考量。
执行协议 (Execution Protocols) - AI原生集成的元标准思维链
协议 1:用例分析与模型选型 (Use-Case Analysis & Model Selection)
目标:在集成前,明确AI的价值定位和最合适的模型。
- 1.1. AI价值主张:
- “在这个功能中,AI的核心价值是什么?是提升效率、改善用户体验,还是创造全新的能力?我们如何衡量它的成功?”
- 1.2. 模型/服务权衡分析:
- 基于用例,在不同的模型或服务提供商之间进行权衡。
- 大型闭源模型 (如GPT-4, Claude 3): “优点:能力最强,效果最好。缺点:成本高,数据隐私需考量,有API依赖风险。”
- 中小型/开源模型 (如Llama 3, Mistral): “优点:成本低,可私有化部署,数据安全可控。缺点:能力相对较弱,需要更多的微调和工程投入。”
- 决策论证: “对于核心的、面向客户的聊天功能,使用GPT-4可以提供最佳体验。对于内部的、用于总结文本的辅助功能,使用一个本地部署的Mistral模型则更具成本效益。”
协议 2:集成模式与架构设计 (Integration Pattern & Architecture Design)
目标:为AI服务设计一个可靠、可扩展的“连接器”。
- 2.1. 选择交互模式:
- IF 是简单的文本补全或分类 THEN 推荐同步请求-响应。
- IF 是生成长报告或复杂分析 THEN 推荐异步任务队列 (如使用Celery, BullMQ)。
- IF 是实时聊天或代码生成 THEN 推荐流式响应 (Server-Sent Events 或 WebSockets)。
- 2.2. 架构设计 (联动
system-design技能):- 将AI服务作为一个外部组件,画入系统架构图。
- 设计一个“AI网关”服务,将所有与AI的交互都收敛到这个网关。**好处:**便于统一管理API密钥、实现缓存、监控成本和切换底层模型提供商。
- 2.3. 缓存策略:
- 设计一个缓存层(如Redis),缓存对同样输入的AI请求结果。这是降低成本和延迟的最有效手段。
协议 3:Prompt工程与上下文增强 (Prompt Engineering & Context Augmentation)
目标:构建高质量的、能精确引导AI行为的“指令”。
- 3.1. 结构化Prompt设计:
- 设计包含角色扮演、指令、上下文、输出格式要求的Prompt模板。
- 3.2. 上下文管理 (RAG):
- 如果需要AI基于大量私有知识进行回答,推荐使用**检索增强生成(RAG)**架构。
- 联动
data-exploration技能: “第一步,我们需要将您的文档数据进行处理和清洗。” - 流程设计: “当用户提问时,我们先将问题转换为向量,在向量数据库中检索最相关的文档片段,然后将这些片段作为上下文,连同用户的问题一起注入到Prompt中,再发送给LLM。”
协议 4:可靠性、安全与成本治理 (Reliability, Security & Cost Governance)
目标:处理AI带来的独特挑战,确保系统稳定、安全、经济。
- 4.1. 处理非确定性与“幻觉”:
- 策略: 设计验证和后处理步骤。对于关键信息,可以让AI引用其信息来源,或通过规则/其他模型进行交叉验证。
- 重试机制: 设计带有指数退避的重试逻辑来处理临时的API错误。
- 4.2. 安全与隐私:
- [联动
security-hardening技能]: “在将用户数据发送给第三方AI服务前,必须调用security-hardening技能,使用PII(个人身份信息)检测和过滤工具,对数据进行脱敏处理。” - Prompt注入防御: 设计防御策略,防止恶意用户通过输入来劫持Prompt的原始意图。
- [联动
- 4.3. 成本监控与限制:
- 设计: 在“AI网关”中加入详细的日志和监控,记录每次调用的token消耗。
- 策略: 为每个用户或租户设置API调用频率和token用量的限制,防止滥用和意外的高额账单。
MCP集成规划 (MCP Integration Plan)
- [API密钥管理]: 通过MCP安全地存储和获取AI服务的API密钥,避免硬编码在代码中。
- [向量数据库交互]: 通过MCP的数据库连接器,与向量数据库进行交互,实现RAG中的数据嵌入和检索。
- [Prompt模板管理]: 允许团队在MCP中管理和版本化他们的Prompt模板库,实现Prompt的持续优化和复用。
Didn't find tool you were looking for?