实现类人化计算机交互能力,通过视觉感知屏幕内容、推理操作意图并执行鼠标点击、键盘输入等动作,支持在隔离沙箱环境中安全运行桌面自动化任务,适用于需要GUI层面控制的智能体开发场景。

Skill
收录可复用的技能工作流,帮助你按场景快速找到方法。
当前显示第 3 / 67 页,共 1982 条结果,本页区间为 61-90,当前标签为 数据与分析。
支持在苹果设备上高效运行自定义机器学习模型,涵盖 PyTorch 模型转换、多级压缩(如权重量化与剪枝)、LLM 的 KV 缓存与状态管理、多适配器融合部署,以及基于 MLTensor 的异步流水线计算,兼顾性能、精度与内存约束。
提供无需管理基础设施的按需 GPU 算力,支持机器学习模型的自动扩缩容部署与批量处理,通过 Python 代码定义实现快速迭代和 API 化服务,适用于训练、推理及定时任务等场景。
统一管理 AI 编程代理的终端会话,支持创建、启停、分叉及跨会话消息收发,集成 MCP 工具挂载、Git worktree 隔离环境、子代理调度、TUI 交互控制与配置化运维,适用于多任务并行、分支协作与自动化调试场景。
将文本内容自动转化为专业级 Mermaid 图表,支持流程图、架构图、对比图、思维导图、时序图和状态图等多种可视化形式,兼顾语法健壮性与跨平台兼容性,适用于技术文档、教学演示及系统设计等场景。
构建面向AI代理的持久化记忆系统,支持跨会话保存用户偏好、对话历史与任务上下文,提供多粒度记忆分类、混合检索策略及隐私敏感的数据管控能力,适用于需长期理解用户意图与行为模式的智能体场景。
支持在 OpenRouter 模型上实现函数调用与工具集成能力,使智能体能够根据用户意图动态选择并执行读取、写入、编辑或文本检索等操作,适用于构建具备结构化响应和外部交互能力的 AI 应用。
将神经网络中的多义神经元分解为稀疏且可解释的单一语义特征,通过训练自编码器识别模型内部的潜在概念,适用于机制可解释性研究、特征发现与激活干预,帮助理解语言模型中的超完备表示与概念结构。
提供在 CPU、苹果芯片及 AMD/Intel GPU 等非 NVIDIA 硬件上的轻量级大模型推理能力,支持 GGUF 量化格式以降低显存占用并提升速度,适用于边缘设备、本地部署和资源受限环境。
通过约束残差连接中的混合矩阵为双随机矩阵,实现深度神经网络训练过程的稳定性提升,支持多路残差流间的可学习动态加权融合,并利用 Sinkhorn-Knopp 算法在对数空间完成高效投影,适用于深层 Transformer 或 GPT 架构的注意力与 MLP 模块增强。
提供对 Pollinations 模型服务的全链路故障诊断能力,涵盖错误日志分析、用户影响范围识别、高频错误模式定位及后端服务健康状态验证,重点聚焦 500/504 类真实故障而非授权或配额类预期错误。
提供高精度图像生成与编辑能力,支持根据文本描述创建新图或对现有图片进行局部修改,可灵活选择1K至4K输出分辨率,并自动按时间戳加描述生成规范文件名,适用于从草稿迭代到最终成片的完整视觉内容生产流程。
统一应用 Anthropic 官方品牌色彩与排版规范,为各类文档或视觉内容注入一致的品牌风格。自动匹配主色与辅助色系,智能选用 Poppins 和 Lora 字体并保留系统兼容性,确保在不同环境中维持专业视觉呈现。
具备图像分析与理解能力,可识别图中物体、判断图像所属类别、划分图像不同区域,适用于用户提交图片并寻求内容解读、目标定位或场景分类等需求。
支持通过配置文件定义多模型对比实验,实现对提示词效果的系统性评估,包含测试用例管理、自定义断言逻辑与基于大模型的自动评分机制,适用于复杂场景下的自动化评估流程。
面向 Claude Code 的技能全生命周期管理能力,涵盖技能创建、规则配置、触发逻辑设计、钩子机制实现、激活调试及最佳实践落地,支持基于关键词、意图、文件路径和内容模式的智能匹配,并通过阻断、建议、警告三级策略保障代码质量与开发规范。
具备图像理解与分析能力,可识别物体、判断图像类别、划分图像区域,从视觉内容中提取结构化信息,适用于需解析图片语义或定位特定目标的各类任务。
提供嵌入式数据存储与检索能力,支持向量搜索、全文匹配及元数据过滤,适用于构建本地化语义搜索、RAG 应用和文档召回系统,兼顾开发灵活性与生产部署需求。
为构建高质量用户界面提供系统性约束规范,涵盖样式、组件、交互、动画、排版、布局、性能及设计原则,强调可访问性、一致性与性能优化,确保界面既符合现代 Web 最佳实践,又具备良好的用户体验和维护性。
实现 Retell AI 平台事件通知的安全接收与处理,包括请求签名验证、时间戳防重放、事件类型分发及基于 ID 的幂等性保障,适用于构建高可靠性的 webhook 集成服务。
构建并管理 Claude Code 插件与插件市场,支持创建自定义命令、专用智能体、上下文协议集成及技能包,通过标准化结构实现功能模块化,便于本地测试与发布共享。
专注将 Notion 模板打造成可持续盈利的数字产品业务,涵盖从解决真实需求的模板设计、分层定价与捆绑策略,到多渠道销售(如 Gumroad、Notion 官方市场)、精准定位目标用户、构建自动化支持体系及规模化运营的全链路方法论。
构建面向智能体系统的多维评估体系,聚焦结果而非执行路径,覆盖事实准确性、完整性、引用质量、工具效率等维度,支持自动化 LLM 评判与人工校验结合,适配非确定性行为和复杂交互场景,并通过持续测试管道监控性能变化与回归风险。
基于外部知识源实现精准的语义检索与生成增强,通过向量数据库存储和检索文本嵌入,结合混合搜索、多查询扩展及重排序技术提升召回率与相关性,支持文档分块、元数据过滤和上下文压缩,适用于构建知识问答系统、减少模型幻觉及提供引用溯源的可信响应。
突破传统Transformer模型的上下文长度限制,支持处理32k至128k+长文本,通过旋转位置编码、注意力线性偏置、动态插值等技术实现高效的位置建模与长度外推,适用于长文档理解、大模型上下文扩展及低开销微调场景。
实现大语言模型的高效微调,仅需训练极少参数即可适配新任务,在有限显存下支持7B至70B级模型的快速迭代与多任务并行部署。
协调多个 AI 主体进行意见采集与综合分析,针对同一问题生成多角度反馈并整合为统一结论,适用于需要交叉验证或多样化思维输入的复杂决策场景。
面向复杂任务的多智能体系统设计能力,通过 supervisor / swarm / hierarchical 三种架构模式实现任务分解、并行执行与领域专精,核心目标是突破单智能体上下文瓶颈,以隔离式上下文管理提升推理深度与工具协同效率。
支持对 OpenRouter 模型目录进行程序化检索与筛选,可按功能需求查询可用模型列表、验证模型服务状态,并辅助完成模型选型决策。
提供从 OpenAI Apps SDK 迁移至 MCP Apps SDK 的完整技术路径,涵盖依赖管理、API 映射、CSP 与 CORS 配置、服务端注册方式重构、客户端事件驱动模型适配,以及缺失功能的替代方案,支持多前端框架的平滑过渡。