Skip to content

AI动手实践:高效提问策略&视觉化输出指南

Updated: at 07:13

一、通过AI去学习

以前的教育,就像建造一座地基很稳的房屋,而现在呢,教育更应该像是搭建一个帐篷,你可以把它折叠起来,非常容易和迅速地移动到另一个地方。
— 《人类简史》作者尤瓦尔.赫拉利,谈未来 20 年的重要技能

从 ChatGPT 到 DeepSeek R1,AI 的进化实在太快了,快得有点跟不上了,碎片化的AI信息铺天盖地,若没点“心理素质”,迎面而来的绝不是机会,而是焦虑。

回想起 2023 年,在一场关于 AI 与教育的分享中有提到过一个自己总结的 AI 时代的能力模型,而我们要做的就是围绕这个能力模型去建一套高适应性、高敏捷度的框架

在这个快速变化的过程中,如何去建立这样一套框架,最终还是会落在学习能力上,所以一直很想多聊点学习相关的事。

刚好,前几天给一些老师做了两场分享,就是教如何写好提示词,如何用好各种工具实实在在帮到日常工作,正好梳理一下,把自己对这些内容的思考分享出来。

文章内会谈到一些工具、方法和技巧,当然可以直接用,但更希望的是大家能看到背后的思考和学习方法,授人以渔,这才是目的。

学AI,更是通过AI去学习。

1. 使用 AI 的隐形门槛

使用 AI 的门槛看起来很低,比微信使用还简单,你只要能和别人通过说话交流,就能与 AI 交流。

实际用起来,门槛却不低,也和与人沟通一样,有多少人能拍着胸脯说,自己与人的沟通能力很强呢?

除此之外,太多的时髦新词、技术用语,各种工具、技巧一大堆,碎片化提示词更是满天飞,看都看不过来,更别说使用了。

从这一点来说,要用好 AI 还挺难的。

注:为了描述方便,本文里所说的 AI 主要是指像 DeepSeek / Kimi / ChatGPT 这样的 AI 对话工具。

2. AI 的上限与下限

在聊如何用好 AI 前,首先要认识到的是,决定 AI 输出质量的好坏,主要有下面两个因素:

这两个因素都很重要,对于大模型,稍微做点调研,多试用一下,应该就可以有一个基本判断,下面几个是我自己使用过后的感受,各有特色。

大模型的话题不是我们讨论的重点,但它是先决条件,如果使用的大模型本身质量不行,再好的方法对结果的质量提升也有限。

除了大模型,剩下的就是靠自己通过学习,去了解工具、掌握方法与技巧,把下限提高就好了。

本文的目的是后者,通过两部分的内容帮大家提高一点下限:

  1. 第一部分是向AI提问的策略与技巧
  2. 第二部分是利用AI去实现视觉化呈现(PPT/思维导图/流程图等)的方法和策略

!!! 友情提醒:这次的内容又是文长、图多,多点耐心,一定要去动手实践!

二、向AI提问的策略与技巧

在用 AI 的过程中,经常听朋友说到下面两个问题:

  1. AI 的回答没大问题,但细看又平平无奇,并不是我想要的
  2. AI 还是会犯错,一本正经的胡说八道这个毛病一直改不掉,不敢用

我通常开玩笑的说,和 AI 会话,先摆正一个态度:“把它当人看”

  1. 你和人沟通,是不是需要掌握一些沟通技巧,寻求别人帮助,你也得把事情说清楚,讲明白
  2. 是人就会犯错,专家也会犯错误,所以 AI 犯错也正常

事实上,AI 的回答质量上比大部分人能做到的都好,它基本上不会答非所问,它的“思考逻辑”也非常清楚,关键是态度还很好,如果是它错了,你告诉它,它也很愿意改。

摆正态度后,再掌握一些策略和技巧,质量就有保证了。下面分享四条使用AI的基本原则。

  1. 掌握对话策略,而不是碎片化的提示词
  2. 借助多元思维模型,打造自己的系统化思维工具箱
  3. 善用元问题技巧,关于问题的问题,不知道如何问,问什么,找 AI
  4. 提问是一个迭代的过程,查看AI思考过程,利用检查清单,持续去改进提问质量

1. 掌握对话策略

网络上,各种提示词框架很多,实际上大同小异,我自己总结了一个 CTO 策略,足够简单,一定记得住!

Context(背景信息):背景信息是用户与 AI 沟通的“起跑线”,决定了 AI 对问题的理解深度和准确性。背景信息越详细,AI 越能“对齐”用户的需求,避免误解。

Task(任务目标):任务目标是用户希望 AI 完成的具体工作,直接影响 AI 的行动方向。清晰的任务目标能帮助 AI 聚焦,避免无关或冗余的输出。对于复杂任务,拆解为小步骤是关键。

Output(输出要求):输出要求定义了 AI 返回结果的形式、风格和限制,是确保结果符合预期的关键。结构化的输出比零散罗列更易读、更实用。

提示词示例

举个例子,你和朋友准备去成都玩,想让AI帮推荐几家在市区比较有特色的本地中餐馆。

下面是一个比较直接、简单的提示词:

大家可以试试输出结果,如果对结果不满意,我们可以结合CTO策略改进一下,先问问自己:

改进后的提示词如下:

CTO 是一个基本的提问策略,每提一个问,首先从这三个角度去想一想,养成一个习惯,自然而然提问质量就会高了。

2. 借助多元思维模型

上面的 CTO提问策略是一个基本的框架,核心在于清晰沟通,通过结构化的方式让 AI 更高效地理解和执行任务。

不过要得到高质量、甚至超预期的输出,光靠这个框架还不够,有时候还需要借鉴一些“套路”,通常是那些有经验的用户或专家经验积累下来的最佳实践或策略,用这些套路作为 CTO 提问策略的补充,进一步优化输出质量。

要知道一个事实,你想解决的问题,99% 的可能别人都遇到过,而且解决过,为什么不借用那些别人积累下的经验(思考模型)呢。

就像查理.芒格说的,对手里拿着铁锤的人来说,所有的问题都像钉子,这也是为什么我们需要从多元思维模型的角度来分析和思考如何解决不同场景的问题。

多元思维模型这个概念源于查理.芒格的《穷查理宝典》,芒格所说的多元思维模型指的是那些分布在各学科领域最基本的思维模型,了解和运用这些模型,可以帮助我们在面临不同问题时去做出更合理的决策和判断。

我们这里所说的思考模型更宽泛一些,就是那些源于不同行业,积累下来的有价值的经验模型。

在以前,我们要了解这些不同业务场景下的经验模型,途径较少,要么看书,要么去寻求有丰富经验的从业者,而有了 AI,这一切简单了很多,AI 本身就是一个经验丰富的“全才”,我们完全可以通过 AI 去找到这些经验模型,再借助这些经验模型去帮助我们去分析或得到相应的解决方案

下图中是一些常见的思考模型,只列了很小一部分,每种模型都有其适用的场景。

模型提示示例

很多人知道金字塔模型,我们就以它为例,结合前面的CTO策略,对一本书进行总结。

金字塔模型是一种层次分明、结构化的思考和沟通工具,由麦肯锡公司顾问芭芭拉·明托在1973年提出。它通过将信息组织成金字塔形状,帮助人们更清晰、更有逻辑地表达和传递信息。经常用于写作、汇报及沟通中。

下面是用 CTO 策略,结合金字塔模型来写的提示词,用于对一本书的主要内容进行总结输出。

大家猜一猜,这份提示词我是怎么得到的呢?

大家可以试试去总结一本书,看看效果怎么样,当然,你完全可以结合自己的理解去修改和完善。

下面的截图是用上面的提示词,使用 Deepseek R1(未联网搜索)来输出的结果,只截了其中的一部分内容。

大家可以试试,如果只是简单的写一句:请帮我总结一下《认知天性》这本书的主要内容,看看结果会有什么不同呢。

可能大家会说,我就完全不知道有什么经验模型,那怎么办?没关系,下面的元问题技巧就是为了用来解决这个问题。

3. 善用元问题技巧

元问题,就是关于问题的问题

有些时候,我们确实不知道如何去问,也不知道有哪些经验模型可以借用,尤其是在面对那些我们本身就不太熟悉的领域或问题时。

可以使用元问题技巧,让 AI 告诉你该问什么问题,如何去问,甚至如何给提示词。

元问题示例1

如果你想深入了解某一主题内容,但不知道应该问什么样的问题,可以让 AI 给你一些样例。

例如,对于主题”如何写作”,用上面的元问题提问,下面是 AI 给出的回答,是不是挺好的?至少我看之后,对于 “如何写作” 这个主题可能会涉及哪些问题,有一些底了。

元问题示例2

对于一个不熟悉的领域,想知道有哪些思考模型/经验模型可以用,可以像下面这样直接让 AI 告诉你。

下面是 AI 的回复,截取了一部分。

我觉得 PREP 模型就不错,接下来,你就可以运用 CTO 提问策略,再结合 PREP 模型帮我们给出一份不错的演讲稿了。

3. 提问是一个迭代的过程

检查清单

与 AI 会话是一个持续迭代的过程,认识到这一点非常重要。遇到输出结果与自己所期待的不一样,我会用类似下面这样的检查清单来帮助我去迭代和改进。

对于进阶用户,联网搜索,搜索的来源也很重要,搜索中文资料和英文资料也会对结果质量产生比较大的影响,这一点需要注意,尽量选用那些可以自己去配置联网搜索来源的工具和服务。

观察AI的思考过程

刚开始使用 Deepseek R1 时,带来的最大震撼是,它把 AI 的思考过程也展示出来了,观察这个思考过程,经常会带来一些意想不到的启发,对如何更好的提问,甚至更好的思考也有很大的帮助

上图是我在 Grok 中问了一个简单的问题 “如何写好提示词”,Grok 的思考过程一部分截图。

目前支持推理模型,并将思考过程也呈现出来的有下面三个模型,大家都可以去多试试。

三、用AI生成视觉化呈现

自从 AI 开始流行起来,身边的朋友问的最多的也这一块:

实话实说,自己这方面的需求并不多,但问到的朋友越来越多,于是做了几次相关的分享,大家都觉得还不错,感觉是帮到了大家,所以接下来聊聊这一块。

和提问的思路是一样的,我们希望找到一些更通用的策略,而不是零散的去学各种工具和技巧

关于如何文成图,文生视频,是另外一个大的话题,不在本文讨论范围里,有机会再聊这一块。

中间层转换策略

我们前面提到的都是文本生成模型,简单来说就是最终的输出都是文本,还有一类是多模态生成模型,用于生成图片和视频的一些模型,国外的有 Midjourney,Dall-E 3,国内的有字节的即梦,快手的可灵。

而我们这里讨论的是如何从文本生成到不同的图示生成,主要是利用中间格式转换去生成PPT / 思维导图 / 流程图等,中间格式都纯文本格式,由 AI 生成,每种格式有不同的作用。

网上也有不少一键生成XXX的应用,但总的来说并不是一种通用的做法,我们讨论的方法会更加灵活一些。另外,随着大模型和工具越来越成熟,以后一定会出现效果很好的一键生成XXX的应用。

快速介绍一下这几种格式。

Markdown

Markdown 就是一种文档写作的纯文本格式,在文本中多了一些特殊标记,用于最终的排版样式显示,它让我们更多关注在内容本身的写作上,而不在排版这类形式上

Markdown 可以说是当前所有 AI 对话支持的第一语言,所有的文本生成模型都是以 Markdown 为载体,最终带格式渲染出来的。

Markdown 语法很简单,基本上花半个小时就可以掌握,支持 Markdown 的编辑工具也非常多,大家搜索一下,找个自己喜欢的即可。我自己大部分时候用的是Obsidian ,需要独立输出时会用到 Typora

借助 Markdown,转换到思维导图,甚至PPT,都很方便。

Markdown → 思维导图

只要是能直接将 Markdown 转换为思维导图的工具就可以,下面两个工具大家可以试试。

下面是一个简单的例子,我们用 AI 根据一段文字内容生成思维导图大纲,以 Markdown 格式输出。

将生成的 Markdown 源文件复制粘贴到上面两个工具其中的一个,直接就可以得到下面这样的思维导图,还挺漂亮的。

Markdown → PPT

支持从 Markdown 转 PPT 的工具也有不少,试用了一下下,目前推荐的是 讯飞智文mindshow,两者都支持生成前的大纲修改和生成后的PPT再调整。

尽管这两个工具也都支持直接 AI 生成 PPT,还是推荐先使用类似像 DeepSeek R1 或 Kimi 1.5 长思考这样的推理模型来生成内容(方便多轮调整保证输出质量),再复制粘贴过去生成 PPT,毕竟内容的质量还是排在第一位的。

比如用下面的提示词将一本书内容总结成 PPT 大纲,以 Markdown 格式输出。

将输出结果复制粘贴到讯飞智文里(通过文本创建)去生成 PPT。

在生成图文PPT前,你还可以继续调整大纲内容,最终PPT生成出来后,还可以继续在线编辑内容。下面是生成的封面图,细节就不展示了,大家用一下就知道了。

Mermaid

Mermaid 也是一种纯文本格式,主要用于生成各种图表,我们常见的一些流程图、思维导图、时序图、甘特图都支持。

使用的流程也是:通过 DeepSeek R1 或 Kimi 1.5 长思考按主题要求生成 mermaid 格式的内容,再复制粘贴到下面几个工具中去生成最终的图形。

我自己经常在描述一段逻辑时会用到流程图,下面是一个简单的例子。

提示词如下:

下面是由 AI 输出的 mermaid 代码。

flowchart TD
    Start[开始] --> Input[输入正整数]
    Input --> Condition{该数是否为偶数?}
    Condition -- 是 --> OutputY[输出 'Y']
    Condition -- 否 --> OutputN[输出 'N']
    OutputY --> End[结束]
    OutputN --> End

最后在 mermardchart 中输出的流程图效果。

又比如,我们现在有一个为期 6 个月的软件开发项目,希望按照敏捷开发的流程排一个交付的时间线图表出来。

借助 DeepSeek R1 来生成,提示词如下:

输出略。将生成的 mermaid 文件复制粘贴到 mermaidchart 中去,生成的时间线图如下(只截取了一部分),效果也很不错。

需要注意的是:有的同学在生成一些特殊模板的内容时,渲染时会遇到格式错误的问题,建议在生成的时候,可以将该格式的样例附一个在提示词下面,这样生成出来的结果通常就不会出错了。

下面的提示词,帮助幼儿园老师生成一份关于儿童要培养哪些能力的思维导图内容,并以 mermaid mindmap 格式输出。

输出略。

将生成的 mermaid 源文件复制粘贴到 mermaidchartexcalidraw 里,下面是最终思维导图呈现的效果。

SVG

SVG格式文件是可缩放矢量图形文件的缩写,是一种标准的图形文件类型,本质上也是用纯文本来描述的,既然是纯文本,我们也可以利用 AI 来直接生成 SVG,再用特定的 SVG 工具来浏览最终的结果。

举一个例子,很多人都知道四象限时间管理法,我们可以基于它的定义来生成一幅四象限图,提示词如下:

将生成的 SVG 代码复制粘贴到支持 SVG 预览的工具里,我自己使用是在线工具 svgviewer:

渲染出来的结果如下图所示,已经非常不错了。

提示:根据描述来生成 SVG 图,目前效果最好的还是 Claude sonnet 3.5 或 3.7。上图就是通过 Claude sonnet 3.7 一次生成的,完全没修改。

Code

程序代码本质上也是一种纯文本,因此我们也可以使用 AI 来直接生成代码,而且现在生成代码的大模型也越来越厉害了。

有了代码,能干的事情就多了,可以通过代码生成设计图、生成动画演示视频,甚至可以直接生成应用程序。

下面这个词云图就是用 AI 真正生成的,而且还有交互效果。有一次我在准备分享内容时,希望有一张 AI 能干什么的词云图,当时在网上找了一些可以生成词云的应用,都不是特别好用,就用 AI 做了这么一个小网页应用。无论是内容还是最终的程序,全是用 AI 来生成的,为了达到满意的效果,中间调整了几次,整个过程花了大概 20 分钟,这在 AI 出来之前是无法想像的。

具体如何从 AI 到代码,已超出本文讨论的范围,大家感兴趣的话给我留言,我再来分享这方面的内容。

附:Napkin 生成文字配图

地址:Napkin

这个工具比较特别,直接在应用内根据文字内容生成配图,配图有多种形式可选择,还挺不错的,不归于上面的类型,因此单独举例介绍一下。

前面在讲解思考模型时,搜索到一个用于沟通的 SCQA 模型,把 AI 生成的一段关于 SCQA 模型的介绍文字复制粘贴到 Napkin 里去,选中你要生成配图的文字,点击文字右侧的闪电图标,稍等一会就会在文字下方自动生成内容相关的配图。

生成配图时,可以在左侧选择不同的图示模板,模板还是比较丰富的,下面是我根据这段文字生成的一幅配图,配图也支持下载到本地。

四、总结

未来已来,尚待分布均衡。
— 美国作家 William Gibson

当面对 AI 的时候,各种新术语,新工具特别多,而且随时都在变化,可能我这篇文章出来的时候,又有一些更好用的大模型,更好用的工具出来了,但相信背后的一些思考和解决问题的策略就那么一些,并不会有多大变化,希望大家在学习过程中多思考,从这些不变的入手,还是在文章开头那句话,学 AI,更是通过 AI 去学习


关于AI的应用与实践,如果你想要交流或分享,欢迎加我,期待更多有趣、深入的讨论!


Previous Post
对长期主义的一点思考
Next Post
Deepseek满血版+联网搜索,目前最推荐的使用方式