提供基于命令行和终端界面的 GIF 检索与处理能力,支持对接多个 GIF 平台进行关键词搜索、结果预览、批量下载,并可从动图中精准提取指定时间点的静态帧或生成多帧网格图,便于快速审查与分享。

Skill
收录可复用的技能工作流,帮助你按场景快速找到方法。
当前显示第 2 / 14 页,共 417 条结果,本页区间为 31-60,当前标签为 内容与媒体。
支持创建面向演示场景的学术海报,通过HTML/CSS实现响应式排版与视觉元素灵活集成,可导出为PDF或转换为PowerPoint格式,适用于需在PPT中进一步编辑、强调AI生成图表且对LaTeX无依赖的快速海报制作需求。
实现PDF文档的端到端翻译流程,包括从文件中提取原始文本、按需转换为目标语言、保留原有段落与标题结构,并输出为格式规范的Markdown文件,适用于跨语言技术文档阅读与本地化需求。
提供面向 iOS26+ 的端侧语音转文字能力,支持音频文件离线转录与麦克风实时流式识别,兼顾长时会议、远场录音等复杂场景,自动管理语音模型下载与释放,并输出带时间戳的富文本结果,适配 Notes、语音备忘录等系统级应用体验。
检测并利用网页中用户输入未过滤导致的HTML注入漏洞,实现页面内容篡改、构造钓鱼表单或网站挂马等攻击效果,验证应用在输入处理上的安全缺陷,并提供修复建议。
根据用户提供的功能描述生成结构化产品需求文档,通过多轮交互式提问明确问题目标、核心功能、技术栈、界面路由、数据模型、业务规则及质量验收标准,最终输出符合 Ralph 执行规范的完整 JSON 格式 PRD 文件。
将 Markdown 文章自动发布至 X 平台的 Articles 编辑器,精准转换标题、图文内容并保留富文本格式,通过预处理与浏览器自动化协同实现高效排版,最终生成可手动发布的草稿。
通过自然语言指令对 PDF 文档的指定页面执行精准编辑,支持修改标题、修正文字错误等文本内容调整操作,适用于快速迭代演示文稿或报告类文档的场景。
实现 LaTeX 模板与 Word 官方模板的像素级样式对齐,包括标题文字、编号格式、字体、字号、颜色、行距、页边距及换行位置等全要素自动比对与优化,生成 HTML 可视化报告并提供可直接应用的修复建议。
将静态图片转换为动态视频,支持运动控制与风格保留,适用于图像动画化及视觉内容创作,可生成多种格式的高质量视频输出。
从 YouTube 视频中提取字幕或自动生成的转录文本,支持通过命令行工具快速下载多语言字幕,或在命令行不可用时调用浏览器自动化操作展开并抓取页面中的完整时间轴字幕内容,最终保存为本地文本文件。
从图像中精准提取可读文本,支持多种格式图片及多语言识别,能自动评估识别置信度、检测文本区域与结构特征,并返回标准化 JSON 结果,适用于文档数字化、截图转文字、表单与票据信息提取等场景。
自动执行视频口误与冗余静音段的精准裁剪,基于时间戳驱动的删除任务生成优化后的视频流,并通过循环转录审查确保零口误,最终输出带同步字幕的成品视频文件。
支持专业级 Word 文档的全生命周期处理,包括从零生成结构化文档、精准编辑内容与格式、按规范实施修订追踪和批注、提取纯文本或原始 XML 数据,以及将文档转换为 PDF 或高质量图片用于可视化分析。
提供跨平台音视频处理能力,支持格式转换、编解码、流媒体推拉、滤镜应用、音画分离与合成、质量优化及批量自动化操作,覆盖从本地文件处理到实时直播的全场景多媒体工作流。
分析并优化网站的页面结构与元数据,改善标题、描述、头部标签及图像替代文本,添加结构化数据标记与社交媒体分享标签,生成站点地图和robots.txt文件,提升搜索引擎可见性与内容可访问性。
生成符合学术规范的科研海报,支持多种 LaTeX 排版引擎,实现对标题、图文布局、配色方案及字体层级的精细化控制,集成高分辨率图表与可访问性设计,适用于会议展示与科学传播场景。
支持演示文稿的全流程处理,包括从零创建符合主题与品牌调性的幻灯片、基于模板精准复用设计元素、编辑现有文件中的文字内容与演讲者备注,以及提取文本、分析排版结构和生成可视化缩略图,确保专业级视觉呈现与内容准确性。
为产品界面、文档和系统消息生成清晰简洁的用户文案,覆盖按钮标签、错误提示、工具提示、引导流程、空状态、确认对话框等场景,兼顾可访问性与不同角色(如开发者或终端用户)的语言习惯和实际需求。
将经典写作原则应用于所有面向人类的文本创作,包括文档、提交信息、错误提示、界面文案及技术说明等,通过精简冗余、强化主动语态、使用具体词汇和优化句式结构,显著提升表达的清晰度、力度与专业性。
提供 Final Cut Pro 项目结构的标准化 XML 描述能力,支持按指定分辨率、帧率定义时间线格式,精准控制媒体片段的时序排列、层叠关系、转场效果、字幕标题及标记点,确保生成的 FCPXML 文件可被 Final Cut Pro 10.4+ 正确解析与导入。
通过自然语言指令控制 Chrome 浏览器,实现网页导航、页面交互、结构化数据提取、元素识别及截图保存,支持会话保持与状态复用,适用于自动化浏览、表单操作、内容抓取和可视化验证等场景。
处理音频内容并生成自然语音,支持长时音频的转录、摘要与多语言分析,可识别说话人及非语音声音,适用于会议、播客等场景的内容提取与语音合成。
将产品需求文档从 Markdown 格式结构化转换为可执行的 JSON 任务清单,提取端到端功能目标、分项验证步骤、上下文线索与范围边界,生成标准化 prd.json 文件并配套状态目录与进度跟踪机制,支撑自动化任务分解与闭环验证。
将各类原始素材(网页、文本、图片)转化为符合微信公众号传播规律的专业文案,通过智能检索补充权威信息、多维度优化标题与结构、精准适配目标受众语气,并提供排版建议与发布策略,支撑企业级品牌宣传与资讯内容的高效生产。
根据广告需求自动生成或转换创意内容,支持多格式预览与规格查询,实现从文案到视觉的全流程制作,适用于跨媒介广告素材的快速生产与适配。
自动处理视频内容,通过语音转文字生成带时间戳的字幕,利用AI识别并剔除填充词、停顿、口误等冗余片段,再精准剪辑重组视频,同时为最终成片生成匹配的字幕文件。
批量调用 OpenAI 图像生成服务,支持多种模型与参数组合,自动生成结构化随机提示并渲染为高清图像,同时自动构建包含缩略图和元数据的本地 HTML 画廊。
从 YouTube 视频链接提取文字内容,优先获取人工编辑的字幕,其次回退到自动生成字幕,当两者均不可用时,在用户确认后下载音频并使用 Whisper 模型转录,最终输出去重后的纯文本或带时间轴的 VTT 文件。
为等距视角城市游戏批量生成标准化视觉资源图集,统一采用红底、六行五列网格布局,每行呈现同一类资产的五种等距视角变体,确保所有图像超写实且无阴影,适配游戏引擎的自动切片与渲染流程。