Tag: 生产力

Dkphhh Created@

夜深了,我们聊聊iPad OS和「生产力」的未来

苹果这届WWDC最重磅的产品当属两个,一个是 Mac Pro,还有一个就是独立出来的「iPadOS」,关于这个独立出来的新系统究竟长什么样,你可以看 👉这篇文章

要是 2 年前,我看到一个独立的 iPadOS 肯定能兴奋地睡不着,不过现在看到 iPadOS,我内心毫无波动甚至想笑。苹果在软件生态方面的号召力无人能出其右,结果 iPad 上能用的专业软件也就那么几个,大部分功能和 PC/Mac 上的「完整版」比还有欠缺,对「生产方式」对颠覆也仅限于极有限的几个行业。

如果你是设计师,现在支持无线连接 Mac 的它能替代数位板,独立使用时 iPad 也是一台不错的移动绘图工具。如果你和我一样是文字工作者,iPad 码字也不错,当然这是在不考虑键盘盖手感和那局促的屏幕大小的前提下。在教育领域,iPad 的表现也有目共睹。但是在工业领域、在企业办公领域,iPad 依然无法撼动 x86 的统治。

我倒不是对 iPad 失望了,只是它改造「生产方式」的速度远远没有 iPhone 改变人类「生活方式」的速度快,所以哪怕苹果动静再大,要具备真正的可用性和广泛的适用范围还得等好久。尤其是中国这个「先进生产方式」分配极度不均匀的国家,哪怕有更先进的工具,你给一群不会用的人他们也会觉得这玩意儿用的不顺手。

这是用户习惯的问题。那些说 iPad 效率没有 PC/Mac 效率高的人大部分都已经有五年以上 PC/Mac 使用经验,已经形成了使用习惯和一套稳定的工作流,这个时候再迁移到其他平台肯定会出现巨大的不适应。

你能让国企/事业单位里 50+的叔叔阿姨对着一台平板工作吗?大部分人会觉得屏幕太小,外接屏幕他们又不知道转接头怎么插。会计会觉得在 iPad 的 Excel 里输入公式不方便,iPad 的沙盒机制对于习惯了 PC 逻辑的普通文员更是摸不着头脑,他们更习惯在桌面新建文件—编写文档—Ctrl+s 保存的工作路径——哪怕这种工作流十分反直觉。

所以「iPad 是给小孩用的」是非常准确的说法,这不是因为 iPad 没有生产力,是因为小孩对「生产力」这个概念没有偏见。

科幻作家,《银河系漫游指南》的作者 Douglas Adams 提出一个(认知层面的)科技三定律:

任何在我出生时已经有的科技都是稀松平常的世界本来秩序的一部分;

任何在我 15-35 岁之间诞生的科技都是将会改变世界的革命性产物;

任何在我 35 岁之后诞生的科技都是违反自然规律要遭天谴的。

希望 35 岁以后,已经习惯庸常生活的我们,还能够接受下一代改变「生产方式」的工具,哪怕它最初看起来像一个给孩子的玩具。

***

📚 延伸阅读:

iPad 生产力指南

最棒的十个 iPad 应用有哪些?

🌆 题图:

iPhoneHacks

阅读关于 夜深了,我们聊聊iPad OS和「生产力」的未来 的文章
Dkphhh Created@

Windows软件推荐

本文是一个Windows软件推荐清单。鉴于 Windows 庞大的用户基数——尤其是小白用户的数量,我想将我目前在使用的、好用的工具推荐给更多人。

我一贯的观点是:

Windows 不缺软件,是缺好软件。Windows 缺好软件,但不代表它没有好软件。下面就是我自用的几款优秀的 Windows 软件,这些软件足以证明,使用 Windows 绝非”不幸”。

PS:下面提到的这些软件不一定是我在用的,但肯定都是我用过并认为好用的,如果我找到了更好的替代品,我会用删除线划掉。

💅 桌面美化

  1. TranslucentTB 开源的任务栏透明工具,少数派推荐过。不过它有一点小缺陷:如果你的背景是白色的,并将 TranslucentTB 设置成模糊(Blur)模式,任务栏上的白色图标(包括开始菜单、Cortana、电量、WiFi 等)都会难以辨认。
  2. Simple Desktops 扁平化几何风格壁纸,我个人觉得这种壁纸比较耐看。

🔧 系统工具

  1. Wox 快捷启动工具,支持各种奇形怪状的插件,不过我一般只把他当文件查找使用。少数派有推荐过。
  2. Everything 配合 Wox 使用可以快捷搜索本地文件。
  3. QuickLook 空格键快捷预览文件,有 Microsoft Store 版。但如果你遇到了本地无法解码的文件,QuickLook 是无法预览的——例如你本地没有下载 PS 或各种看图工具,你就无法预览.PSD 格式的文件。我个人建议搭配看图工具FastStone使用,免费无广告,缺点是长得丑。
  4. Bandizip 文件压缩/解压工具,免费没广告,支持图片预览,支持 .zip/.rar/.7z 等主流压缩格式。
  5. 7zip 开源压缩软件,也没有广告,和上面那位比起来优势是体积小巧,界面简单。

🚲 效率与文本工具

  1. Typora Markdonw 可能是 Windows 平台最好的 markdown 写作工具,主打所见即所得。对于不懂 markdown 的新手也很友好,选中一段文字后可以在菜单栏对文字进行加粗、斜体、引用、插入链接,等基本操作。配合 pandoc 可以导出成各种主流格式。但是软件本身不支持云同步,所以更像一个文本编辑工具,而非一个笔记软件,不过你也可以配合下文的坚果云实现同步。我一将它用作 Markdown 排版。
  2. ~~OneNote Windows 上最好用的笔记软件,唯一的缺陷是:在没有 VPN 的情况下同步速度和蜗牛一样慢。微软没有把 OneNote 放进 Office365 订阅是在行善。~~已经决定弃用,原因是软件体积太大,不够轻便,对移动端优化不够
  3. Simplenote Markdown 笔记工具,支持云同步,支持链接分享笔记和协作,支持 Android、iOS 、MacOS 和 Linux,真正的全平台制霸。有 Microsoft Store 版。
  4. Microsoft To-Do 微软自家的提醒+清单工具,全平台支持,没有特别需求基本可以当主力提醒工具使用了,有 Microsoft Store 版。
  5. iCloud 因为手机换成了 iPhone,手机上我一般用IA Writer 记笔记,可以用 iCloud 可以两边同步,这样的话连云笔记 App 也省了。
  6. Notapads UWP 风格的记事本 App,也支持 markdown。

📰 浏览器及其插件

  1. Chrome 虽然 Chrome 耗电、吃内存、还隐隐有成为当年 IE 的趋势,但它就是好用 🙉。
  2. Bitwarden 开源的密码管理软件,少数派推荐过,全平台支持,虽然知名度不高但是我觉得够用。
  3. 沙拉查词 词典插件,内置剑桥、韦氏、朗文等专业词典,支持 Chrome 和 Firefox。对于英语学习者和有浏览外网需求的人来说很实用,动画效果也很可爱。这是一款让我感动的词典插件。
  4. hypothes 网页批注工具。

🌍 互联网服务

  1. Pocket 稍后阅读软件。说实话,read-it-later 类的软件我现在用得不多,但拿来做文章收藏夹还是很不错的。毕竟,在中国(大陆),你永远也不知道一篇文章会存在多长时间。
  2. Rss Rss 不算特定的工具而是一种信息传输的标准。如果你拿它来订阅新闻网站,inoreader 或许是一个很不错的 RSS 阅读器,但在大陆访问速度缓慢。如果你只想那他做简单的消息提醒,用RssHub搭配IFTTT你可以联通任何工具,我个人习惯用邮箱或Telegram里的 Rss 机器人接收各种短消息提醒。详细玩法可参见:《通过 RSSHub 订阅不支持 RSS 的网站》

🎈 其他

  1. MDict 能够导入 mdx 词典的电子词典,可塑性极高,不管你学什么语言,只要能找到 .mdx 格式的词典,它全部能导入,语言学习者必备。欧陆词典深蓝词典也支持 .mdx 词典导入,也是不错的选择。
  2. 泼辣修图 照片编辑工具,支持批量修改,不管是简单的加滤镜,还是对照片魔改,它都能胜任,真正做到了既简单又专业。支持 Windows、MacOS、Android、iOS、Linux 和网页端,又一个真·全平台制霸的软件。之前很幸运在 Microsoft Store 低价购入专业版,现在软件改订阅制,15 元一个月。
  3. PotPlayer 功能性和可定制性都十分强大的播放器,能满足你对播放器的所有幻想。
  4. FDM 下载工具。支持下载种子和磁力链接,迅雷最好的替代品。
  5. FastStone 看图工具,支持各种格式。
  6. Geek 一个卸载小工具,可以帮助你完全卸载 PC 上的软件,包括清理残留文件和注册列表。
  7. PicGO 图床工具,支持各种主流图床,我主要用它上传图片到我的 GitHub 图床。

关于我目前使用的 💻 硬件,可以查看这篇文章 👉[2019-6-29-2-16|用了两个月,来说说我的 LG gram 体验如何]

***
**以上软件没有特别说明,均可免费使用。**

#更新于 2020.11.30

题图:Vidar Nordli-Mathisen

阅读关于 Windows软件推荐 的文章
Dkphhh Created@

描绘一个自动化的未来

从历史的角度看,所谓的生产力发展,就是一个人类逐渐退出生产环节的过程。

人类的交通工具就是一个很好的例子,最早的交通工具就是人的两条腿;然后是马车,但马需要人类驯养;然后是自行车和汽车;发展到现在,人类已经发明出了自动驾驶的电动车。交通发展的历史就是人类逐渐减少劳动,逐渐依赖机器自动的过程。

农业也一样。最早的农业,种地需要人刀耕火种,从刨土到播种到收获再到最后的加工,每一个环节都需要人的参与,犁地机的到来解放了刨土环节的人,播种机取代了播种环节的人,收割机取代了收获环节的人,脱粒机取代了加工环节的人。发展到现在,依靠各种传感器实时监控农业大棚内的环境数据,自动排水、加湿、施肥,农业自动化的水平离无人化可能只有一步之遥。

从前我们讲自动化,可能最早映入脑海的是工厂里整齐划一的机械臂,他们最符合我们关于自动的定义,但从计算机诞生的那一刻,自动化的时代就已经来了,计算机最早实现的是信息自动化。一台联网的计算机本质上就是一个信息处理工具——它能生产、发布、检索任何信息,就像乔布斯在 1980 年代接受采访时所言:计算机是「人脑的自行车」

计算机带来的信息自动化发生在方方面面。过去人类要在一本书里找到某个词,只能把这本书从头到尾都看一遍,但在计算机里,要在一份文档里找到某个词,你只需要用鼠标点「查找/替换」这个按钮。

但计算机带来的自动化远远不止这么简单。如今的计算机已经从「自行车」发展到了「汽车」,或许在不远的将来,它也能「自动驾驶」电动车。

其实人工智能就是自动化。现在的互联网和技术圈子里,讨论计算机的自动化时,他们不太愿意用简单的「自动化」来概括这项技术,他们更喜欢「AI」或者「人工智能」这样更具有未来感的词汇。但其实,我们现阶段的人工智能技术真的只是信息处理的自动化而以。至于为什么很多人喜欢用「人工智能」来包装,可能他们只是出于营销和融资的考虑。

为什么人工智能是新的自动化?我们回来看看前面举的两个例子——交通工具和农机具,技术的发展让类逐渐退出了生产环节。而人工智能,本质上是在信息处理这个生产部门,取代人类的位置。

如今的人工智能技术,通俗来讲,就是通过大量的数据训练习得某项能力,然后在需要这个能力的生产环节里做到取代人类,这就是所谓的机器学习。举个例子,目前医生诊断肺癌时需要借助 X 光片。我们可以也可以根据肺癌患者的 X 光片影像特征设计出一种算法,来识别 X 光片,并判断患者是否患有肺癌,但这个算法需要不断修正,以提高准确性,这个时候就可以通过大数据(医院里大量肺癌患者的 X 光片),对算法进行训练,但这个识别算法的准确率达到一定水平以后,AI 就可以上岗了。目前,上海已有医院引入 AI 辅助筛查工具进行肺癌的诊断。

图像识别就是一种信息处理。人类医生在岗位上的大量诊断经验其实是人类版的「机器学习」(或者说「机器学习」实际上是让机器模仿人类的学习过程),只不过一个医学生需要长达数十年的临床训练才能成为一个经验丰富,看一眼 X 关片就能下诊断的医生,而专用的算法可能只需要两个月,毕竟机器不需要休息,只要不停电,它可以一直学习数据库里的资料。而且,AI 相较人,还有稳定性更强的优势,AI 不会因为身体或精神等原因判断力下降。

现在的 AI 不仅能做简单的判断,还能根据同类样本的特征进行生成。

在色情网站上流传的 deepfake 「换脸」AI 其实也只是根据人脸的肌肉运动特征,将一个人的脸「移植」给视频里的另一个人。如果让人类通过后期处理的方式将一个人的脸「移植」给视频中的另一个人,并且保证在脸部表情运动中不漏馅儿,是很难的,而且工程量极其浩大,但依靠专用的算法就省时省力。

this waifu doesnot exist 是一个生产动漫女性人物头像的 AI,它也是通过机器学习的方式,输入大量的女性动漫人物头像,学习动漫人物的图像特征,然后输出随机生产的人物头像。这个 AI 相较于上面说的诊断肺癌 AI,实际价值不大。但这只是一个开端,既然 AI 能够生成头像,有朝一日他也能生成完整的人物插画,甚至更进一步,生成有剧情的漫画。毕竟,AI 的学习都是基于特征,漫画的剧情其实也有一定的套路和特征,只要同类样本够多,AI 没有理由学不会。

当然,这就牵扯到了一个严肃的问题:如果 AI 能够画漫画、写小说、甚至于写诗、那么 AI 到底有创作能力吗?

当然没有,从现在的机器学习原理看,AI 并不是正在的「创作」,而是根据特征模仿,即便是写作,也是根据它习得的「套路」写,有点类似于学生在写作文时「套模板」。

AI 带来的自动化,可以将人类从信息处理方面的重复劳动中解放出来。例如你是一个设计师,每到双十一,618 这样的电商狂欢日,上司就要你设计一堆商品宣传页,沾满商城的 banner 位和轮播图。设计师接到这种「毫无技术含量」的工作以后基本上都会上各种「X 图网」下载一堆模板,然后把产品图和价格改一改就交了。如果有一个「促销图生成 AI」,已经学习了百万种模板,设计师只需要把产品图和文案输入进去,AI 就能自动生成宣传图。这就是 AI 带来的生产力解放。

那么人类的工作会被 AI 取代吗?从前面对 AI 这种自动化的定义来看,他只能适应模式化的工作。也就是说,如果你的工作是大量的重复劳动,或是有规律可循的工作。我们很难确定那种具体的岗位会被取代,但是如果你的工作内容创造性不强,是很有可能被取代的

其实我更愿意已一个乐观的态度看到 AI。作为工具的 AI 不可能取代人的地位,只会占领把人当工具用的岗位,例如翻译。对于社会而言,这种技术的普及会让生产力呈指数级上升。对于人来说,他们也能脱离原来枯燥乏味的工作,去更有创造性的岗位。

但是,每一次技术革命带来的生产力进步似乎都会带来动荡。

工业革命带来了机器生产,也带来了卢德运动。机器带来的生产力提高让工人阶级成为牺牲品,失业工人发起了捣毁机器的卢德运动。这场 19 世纪初爆发于英国的运动就像是随后席卷欧洲的共产主义运动的预演。

200 年前的这场共产主义革命没有带来真正的共产主义,如果 200 年后再爆发一次革命,结果就犹未可知了。


题图来源于网络

阅读关于 描绘一个自动化的未来 的文章
不合时宜TheWeirdo Saved@

AI狂飙的时代,人还有价值吗?

图片

最近两个月,受到香港中文大学卓越传媒人驻校计划的邀请,我在香港进行了为期八周的访学,并为新闻学院的学生们开设了一个工作坊,主题是关于“如何提问”。就在我们上课的几周时间里,ChatGPT 以迅雷不及掩耳的速度进入了大众的视野。我在课上与同学们进行了讨论。有人说,在 GPT 的时代,会提问可能比会回答更加重要。有人欣喜,认为 GPT 将大大提高人类工作效率,减少无意义的重复劳动;也有人担忧,认为 GPT 可能会带来大规模失业,甚至动摇社会的基本结构。

王磬: 今天录制之前,我也在微信上刷了一刷。我看到昨天被分享了很多的一篇文章。这个标题我给你念一下,感受一下焦虑的程度。叫“微软深夜放炸弹、GPT4office 全家桶发布,10 亿打工人被革命”。这类型的标题在过去这段时间里面已经可以说是屡见不鲜。一方面,媒体在写作的时候会希望通过这样的一些标题去吸引更多的流量。但另一个方面,我也在读木遥老师的微博时感受到:现在如果仍然评价 ChatGPT,取得的这些进展“什么都不是”,其实也是很有误会的一种解读。我这学期正好在香港中文大学新闻学院做访学,在给这边的学生在开一门课程,也是在我们上课的过程当中,GPT 火了起来。在我们新闻业,大家就会担心。码字这件事儿以前可能还算是一个智力活儿,但是现在 ChatGPT 出现了之后就不一定了。我觉得但凡亲自玩过的人都会惊讶于是它遣词造句的成熟的程度,虽然它仍然有一些问题。我觉得当它以这种一个高度智能化、高度拟人化的形态出现在大众面前的时候,是会让人产生一些焦虑。我是文科生,不懂技术,会提出一些比较基本的问题,希望能够回应到普通大众对于这个议题的一些疑惑。我知道你这几年其实一直都有在关注 AI 的发展,也在社交媒体上有做一些分享。你要不要先分享一下,你最开始接触到 ChatGPT 大概是在什么时候?

木遥: 我可以简单梳理一下 GPT 的发展,我不想把它变成一个像科普一样的严肃讨论,但是我觉得理清一些时间线可能会对大家了解这个事情有帮助。顺便说一下,你刚才描述的那种心理,就是一部分人非常焦虑,另外一部分人可能会有一点不屑一顾,甚至怀疑这个媒体是不是过度炒作了,包括那些震惊式的自媒体是不是在故弄玄虚。我觉得这都是非常真实的反应,我们待会也可以展开讲讲我觉得遗憾的、大家可能视角不够完善的部分在哪里。但是我现在回答你的问题就是时间线的问题。ChatGPT 不是第一代 GPT,很多人可能知道它背后的技术叫做 GPT3.5。GPT 大语言模型本身进入研究者的视线是两三年前,但是第一次比较成熟应该是 GPT3,但是 3 的时候还是更多停留在业内,跟一般的大众没有什么关系。ChatGPT 作为 3.5 的一个推向大众的 demo 版本,一下子引起了普通人的关注。这是在去年年底的时候。我在去年年底的时候发过一条微博,我说我觉得以后历史书上会记载 2022 年最重要的历史事件是 ChatGPT 的发布,而不是俄乌战争。当时很多评价是觉得完全莫名其妙,怎么可能。但我觉得今天可能同意这个说法的人会多一点。前两天大家也知道 OpenAI 推出了 GPT4。这个版本号听起来有点琐碎,有点像我们说 iPhone13、14、15 一样。但其实不是,因为碰巧是在 GPT3 和 3.5 之间,它的能力发生了一个飞跃。这个飞跃使得 GPT3.5 一下子冲破了我们之前认为大语言模型不太可能冲破的一些限制,使得它到达了一个新的高度。但也正是因为突破本身非常新,它发生在过去的一两年内,它没有进入大众视野。大众也不太了解这个飞跃的实质和它的影响。所以很多人可能还在用一种比较过时的眼光来看大语言模型,所以对它会有误解。这些人不光是一般的老百姓,包括一些非常知名的人士。我相信磬肯定知道两周前乔姆斯基在纽约时报上发表了一篇文章,主题就是这个东西没有什么大不了的。但这篇文章发表出来之后,基本上被业内人群嘲,大家觉得真的是廉颇老矣。原因不在于乔姆斯基本人的语言学观念是不是正确,原因在于他对这个新技术明显停留在一个过时的认知上。他中间举了一个例子说,你看 GPT 是不可能回答什么什么什么样问题的,但是事实上你只要打开 GPT 试一下就知道其实是可以的。所以我觉得要理解 ChatGPT 这个事情,需要了解过去时间线,特别是我刚说的飞跃是什么。简单的介绍一下这个事情,为什么大家过去觉得这个事情是有限制的,而今天又发现它的限制被突破了。大语言模型,传统上被认为是一个统计模型。什么是统计模型?很多人可能听过这样的描述,它的工作机理是你给它一些你说过的词,它根据在语料中学到的统计相关性来预测下一个词是什么。机制听起来过于的简单粗暴和无聊,以至于很多人觉得这怎么可能描绘人的大脑的工作方式,我们大脑又不是这么简单的机理——你看了 100 万个文本,你记住哪些词后面有可能跟哪些词。这不是我们思考的方式对不对?也正是因为如此,很多人对这一类统计模型的能力的上限,事实上一直以来是低估的,直到 3.0 为止,它确实表现的就像是一个统计模型,它能够说出一些比较像是人说的话,但是你说它有意识,好像还不至于。从 3.0 到 3.5 之间发生了什么?发生了一个新的飞跃,这个飞跃是因果链条能力的建立。我以前在微博上写过这个事情。什么是因果链条?就是它可以做一些推断性的事了。它不只是我通过前一段词来推断下一个词是什么,而是我能进行一些类似于逻辑上的思考。比方你给他说我把一个香蕉放进一个纸袋子里面,但我又从纸袋里面取出一个苹果,就说明什么事情。如果你只是从字眼上的概率,你是很难想象这段话的下一个字眼最大概率是什么的。但是我们有逻辑,我们可以想说,这是因为纸袋里面本来就得有一个苹果,对不对?这个事情是逻辑上的想法,它不是单纯字词上的相关性导致。它需要你对这个纸袋子是什么东西,为什么香蕉进去,苹果出来有一点特殊性。它反映了什么问题?你需要有一个世界知识在后面。这个东西传统上是大家认为在语言模型的限制之外。但是从 3.5 开始,大语言模型可以回答这类问题了,可以建立这样的因果链条了。这个飞跃很大程度上是出乎人们意料的。事实上,它为什么能够做到,在今天仍然是研究领域的一个热门话题。即使 AI 的研究者也不是百分之百的理解它为什么能够做到了。但是越来越多的实验表明,它真的可以做到。关于这个领域的论文,如果有感兴趣的专业读者可以去搜所谓的思维链条的领域,它是过去两年的一个非常非常热门的领域。因为这个领域的出现,使得从 3.5 开始,语言模型一下子变得成熟起来了。不管它怎么做到的,至少它有了一个好像是世界图景在它脑海之中的时候,它跟你聊天的就会显得非常非常的真实,就不像是只是话赶话在说一些似是而非的东西。正是因为这个飞跃,使得 3.5 一下子变得可以面向大众了。所以从去年底开始,OpenAI 推出一个 demo 推到大家面前,引爆了整个媒体和一般老百姓的视野。之后,今年 3 月份顺势推出了比较成熟的 GPT4。GPT4 具体会引爆什么样的?接下来的连锁反应我们还要再看。但是这是正在发生的故事。

王磬: 你刚刚提到的真正具有突破性进展的是关于因果链条的建立。为什么建立因果链条那么重要?之前技术上不能够达到的难点主要是什么?

木遥: 这有点技术性,但是我可以试着回答一下这个问题。如果我的回答有点过于枯燥,你可以随时打断。有一本很著名的书,叫做《思考快与慢》,它讲的是人的思考的两种模式,一种模式叫做快模式。什么是快模式?就是你看到一个东西,你本能地做出反应,这个本能是来自于人的动物性,所以这部分是人和动物共有的。你在眼前闪现过一个红色,你马上感知到危险。这个东西是不经过思考的。就是千百年来的生物本能,让你感觉到危险。你看到一个好看的异性或者同性,whatever,你会觉得 ta 对我有吸引力。这个也是,它不经过思考,它直接就触发你的荷尔蒙。这东西叫快思考。慢思考是你必须要一步一步想问题。就像我们做高考题一样,你不可能看到题目马上脑海中就闪现出答案来,除非那个题你见过。你必须要一步步想题面题干内容说明了什么,它又说明什么,所以推出答案应该选 A。这个过程是快不了的,它必须有一大堆中间步骤。这个东西叫慢思考。慢思考一般认为是人类有的,动物是没有的,或者至少极少数的高等动物,海豚这样的可能会有,但大部分动物是没有的。传统意义上的神经网络模仿的是人的快思考,哪怕像 AlphaGO 这样会下棋的非常聪明的神经网络,它也是快思考。为什么?它就是一个单纯的网络。一头有输入,一头有输出。我们通过训练使得它知道什么样的输入,应该有什么样的输出。把它放在现实生活中,给它一个输入,它给你一个输出,在这个过程中是没有步骤的。这也是为什么神经网络长期被人诟病,说它是一个黑盒子,因为它没有任何中间的过程,就是一头输入,一头输出。神经网络可能非常深,它中间的模仿函数的网络的结构可能是好多步,但是只是它思考的函数非常复杂,但它仍然没有步骤。它只是一个非常非常复杂的函数,仍然一步到位的从输入到算出来。而思维链条(COT)是完全不同的方式。**它不是从输入一步到输出,它在模仿人类思考的东西。我给它一个输入,它先想第一步中间过程,用第一步中间过程想一个第二步中间过程,第二步让过程想第三步中间过程,推出一个结果。一旦你能够建立起这种结构来,你就能够做到快思考不能够做到的事情。**因为我们很多人类的思考过程是这样的,你要把一堆信息综合在一起,推出一堆中间结果,最终得到一个我们要的结论。这个东西不要说低等动物,就是比较高级的,哪怕像猫和狗这样的动物,它其实都未必能做到,对吧?猫能够做到一步步想问题,其实有点悬,对吧?但是今天的 AI,至少 2021 年以后的 AI 开始逐渐能够做到这一点了。这就是我刚才为什么我说它是一个非常本质的飞跃。

王磬: 我觉得刚才你那个例子还是很有帮助的。我只能说我现在比刚才 5 分钟之前稍微了解的更多了一点。但是我仍然感觉到有很多疑惑的地方,比如像 AI 有多聪明这个事,其实也是过去这几年或者十几年大家一直在聊的一个事,包括像去年也比较火的那种 AI 绘画,你输一堆东西,AI 它能给你画出那么漂亮,甚至是独一无二的一些作品。所以我觉得是不是对业界人士来说,ChatGPT 它实现的飞跃其实是一个一系列的技术进步中的一环,但是到了社交媒体上之后,因为大家可能之前没有一直在关注,才会有一个印象,觉得这是一个技术性上的前所未有的提升,以至于导致了某种程度的恐慌。在你看来,技术飞跃的实现是一个怎样的过程?

木遥: 我觉得是个很好的问题,飞跃怎么样放到一个更大的坐标系里面来观察。事实上,这个问题的业内人士本身在社交媒体上也有触及过。很多人发现了一个现象,好像业内的兴奋更大,业外一部分人觉得焦虑,而另外一部分人觉得这跟我有什么关系?或者是不是又是狼来了,又是炒作。而更重要的是,就是如你所说的,因为我们都知道,今天大家已经被社交媒体训练的已经皮了,对吧?不管多大的事,都是震惊,其结果就是你分不出这个震惊的数量级,到底是 10 倍的震惊还是 1 万倍的震惊。反正它的标题都是震惊、叹号。所以你有必要把它放在一个真实的坐标系里,来考虑这个东西到底是多大的一个事儿。它和别的事,比方和 Alphago 这样的事儿,或者和画图这样的事儿相比,是怎么样的?这里面经常有一个概念叫做 AGI,就是通用人工智能。通用人工智能一般被认为是人工智能领域的圣杯。什么意思?通用人工智能是一切问题的母问题。你要让 AI 或者让机器来做一个特定的任务,这件事情断断续续是一直都有进展的。AI 进展会下棋了,AI 可能也会作曲了,AI 也会画画等等。但什么叫通用人工智能?**同一个模型能够同时做很多事,这件事情是困难的。因为同一个模型能够同时做很多事,意味着它不只是被某一个特定的任务所训练成了一个熟手,不管怎么训练出来的,而是它真正好像人一样,了解了关于世界的某些更本质的运作机理。**你可以想象,你训练宠物狗帮你叼拖鞋。有一天,它非常非常熟练,可以认出你喜欢穿什么鞋,知道你每天回来最喜欢穿什么样的拖鞋,知道你哪天回来心情不好,不用给你拿拖鞋,这都是有可能的。这说明这个狗真的很聪明。但是如果有一天这个狗开始说我不只是帮你拿拖鞋了,同时我还帮你做饭,你就会觉得这里面一定有某些不寻常的事情了。因为你再怎么训练教拖鞋,这个能力不可能转化到做饭上。而通用人工智能的意思就是我能够训练出一个模型,既能够拿拖鞋,又能够做饭,这说明什么?这说明它不只是单纯被你训练成一个熟练工,它一定了解了某些关于世界运作的方式——鞋是什么,饭是什么,以及我该怎么做这些东西。这个认知就要到一个非常非常底层的层面了。这就是为什么 ChatGPT 它本身引起的震动比之前那些震动都大。因为 ChatGPT 可以说是人类看到 AGI 通过人工智能的第一线曙光,它终于有点通用的意思了。你今天也试用过,你也知道,你问它的问题并不需要局限于任何一个特定的话题方向,对不对?你问它什么都可以让他写诗。你让他模仿胡锡进写一个微博,或者你问它一个技术问题,让它写一个代码都可以,这就有点通用的意思了。特别是你可以很容易想象,既然它可以说话,它就可以通过这些话再去指导别的行为,对不对?今天也有很多这样的工具,让 GPT 去控制一个 agent,就是一个代理让它来进一步控制电器,进一步控制跟物理世界发生关联的、操纵的东西。就理论上来完全可以通过语言来真正做一些事儿,而它的语言本身又不限于话题,他就好像真的可以做很多我们生活中可以做到的事情。我不知道你有没有看上周四所发布的微软发布的新的 office。这个东西对人的冲击是很大的,因为大家都用 office,如果 AI 只是能够用来跟你聊天,还只是一个聊天机器人。**如果 AI 可以帮你写文档,可以帮你写 PPT,可以帮你写邮件,可以帮你做会议总结,它就几乎可以做 95%白领的日常工作了,对吧?通用性是飞跃在业界引起最大震动的部分。**所以如果我们用震惊体来描述这次的震惊,是真的比较震惊,比之前的那些震惊要高至少一个数量级。

王磬: 如果从你刚才说的意思来看,它之所以能够高这一个数量级的一个很重要的原因是在于它好像让语言具有了一个直接去行动的能力。这部分能力可能以前的时候大家还会觉得未来的方向可能会是 AI 结合,人仍然还是占据一个非常重要的角色,但只不过你用了 AI,这样可以让你工作中更有效率。但是一旦 AI 具有了直接的行动能力,它其实是完全可以某种程度上取代掉人的。可以这么理解吗?

木遥: 我觉得取代不是一个好的词儿,因为取代是一个非常容易反驳的词儿。我可以说我仍然会干什么什么,AI 干不了,所以它取代不了我。但正是这种字面上的抬杠,使得问题的本质被掩盖了,因为 AI 在人的生活中的渗透是一个逐渐的过程。百分之百地取代你可能仍然不会发生,可是它也不需要百分之百的取代掉你,只要 50%的取代掉你的某些工作职能,AI 就会对就业市场形成非常大的冲击。我有一个纽约的律师朋友,他是很早就开始用这个东西。他本身不是一个技术人员,他是一个标准的文科生,平常用一个新软件都要紧张半天的那种人。但是他开始用这个之后,因为律师的工作很大程度上是依赖于文本的,而文本是 GPT 的长项,所以他就开始用。之后,我就问他说,所以你真的开始辞退你的员工了吗?因为他自己是一个律所合伙人。**他说我还没有真正开始辞退任何人,但是我确实打算今年暑假不用再招实习生了,因为给我省下的活完全可以让我腾出手来做一些事,以至于我可以省下招一个实习生的 AD account。**这就是一个真实的影响对不对?它没有真正取代什么东西,但是它仍然冲击了一个真实的就业市场上的职位。我觉得 AI 对我们社会的影响会以这种方式出现,它不会马上一下子让你这个人变得没有意义,但是它可以让三个人的活,两个人现在能干完,多出来那个人就没有存在的必要了,所以老板就可以把他开掉。**它并不是百分之百取代人的方式来逐渐进行的,而且这个事情是非常真实的。这也是为什么我觉得很多人对冲击仍然没有做好心理上和事实上的准备。其实有点令人忧虑的原因就是,如果你今天还用一种,这东西都是媒体的炒作的态度来对待这个问题,你就很可能会在真正的影响你切身生活的冲击到来之前,没有做好对自己来说比较有用的帮助。

王磬: 我觉得我们可以顺着这里聊一下,聊一些可能更具体的使用的场景和可能会影响的群体。在你看来它的技术进展可能影响哪一些人群,哪一些工种?或者哪一类生活方式是最容易受到它的影响的?在我们目前已知的这种技术条件下,不用考虑它未来几年这种发展。

木遥: 我来简单解释一下为什么它能够帮到你的工作。我今天在网上看到一个笑话,说 GPT 这个词儿在法语中会非常好笑。我自己法语很烂,我不知道为什么。如果在传统时代,我要么去问一个懂法语的人,我要么去搜,但是这个就很难搜,因为除非有人在网上贴过这个笑话,否则你也搜不出什么东西来。但现在有 GPT,我就打开 GPT 搜为什么。**GPT 这个词在法语中非常好笑,让它非常快地告诉我答案。因为 GPT 在法语中的念法是“我在放屁”的意思。**我不是说笑话很好笑,我的意思是过程反映了为什么它会有用,因为我们在生活中大量的事物本来是以这种形式在人和人之间发生的。你有一个琐碎的事儿,这个事情你需要别人帮你来做,或者你需要一个秘书,或者你需要什么,但是在没有机器的时代,我们只能使唤一个人,或者我们自己花时间来做。但是有这个东西,它就可以帮你做,而且你去问它没有任何心理压力,你不需要付出心理成本。你不需要想说我要请教一个人,或者我要占他的时间,不需要的。用这种模式来考虑这个问题,你就会发现,其实我们生活中工作中的很大比例都是这样的,事情琐碎、小,但又花时间。基本上我们所说的一个白领的工作,我不能给一个精确的数字,但是我可以有把握可能 50%以上都是这种事情。你帮人写一个东西,或者你帮人回答一个日常生活中的问题,或者工作上的问题,或者回答一个知识性的问题,或者把一个什么材料总结一下。大部分人,我们今天所谓坐办公室的工作,都是这样的工作。极少数的工作是有创造性的、有原创性的。老板可能需要决策,大部分员工也没什么需要决策的。老板说小张你帮我把什么事搞一下?小张其实完全可以被 GPT 所取代。所以如果你问我哪一种职业最受冲击,我只能说任何需要在写字楼里面有一个小张跑来跑去的工作,都会被它所影响。因为小张所做的事情其实就是这类事情。我曾经写过一篇微博,GPT 的本质不是一个对话集群,GPT 的本质是一种以对话为界面的服务。什么叫以对话为界面的服务?当你是一个老板,或者你是一个所谓的 professional,你日常生活中在不断调用这样的服务。你有一个法律问题,你需要有一个人来给你回答法律困惑。你有一个编程时候的问题,你需要请教一个人。诶,为什么这里有一个 bug,或者我听你的,你让我安装了,但是现在界面上弹出一个错误,我不认识这个错误,我该怎么办?这样的问题是我们工作中需要遇到的。在没有 GPT 的时代,我们需要有一个人,或者需要一个能够至少说话的东西来帮助我们来往下走。而 GPT 提供的就是这样一种服务。它以对话为界面,帮助我们获得我们所需要的信息,而这种服务在之前是不存在的。之前当然也有一些类似于智能音箱之类的东西是假的,它只能回答特定的有限的问题。**但今天的 GPT 是通用的,它可以回答我任何问题。所以一切以对话为服务形式的工作都会被改变。而对话基本上是我们日常的白领工作的核心。不管是书面对话还是口头对话。**你今天在香港,放眼望去那些凌厉的写字楼里面的工作,你想象他每天在干什么,想象一下为什么他们的工作不能够被 GPT 所取代。其实你能找到的理由是非常少的,因为他们大部分所做的事情,不外乎就是把从 a 那里遇到的问题,自己消化一下,再问 b,然后从 b 那里得到的回答再消化,也再传递一个 a。而这个事情,GPT 是完全可以做到的。

王磬: 我觉得在这里有几个点,一个是你刚刚说到消化以及转述的过程,就让我想起,其实在我职业早期,我曾经有段时间是在各机构里面给他们每天写 news brief,其实就是我把头一天这个地方所有的重要的媒体关于某一个行业的报道找出来,进行消化和转述,去 highlight 出一些比较重要的信息,这大概是我十几年前刚开始进入职场的时候做过的其中的一份工作。如果放在今天的语境下来讲,这个是一份非常完美的肯定可以被 ChatGPT 去取代的一份工作。因为今天 ChatGPT 已经可以不光是帮我们去搜索新闻,也可以帮我们搜索可能更复杂的学术型的文献。但是另一个方面,我自己也会感到,当我们去说到消化和转述这个事儿的时候,这中间也存在一个质量的问题。比如当时我的老板,他有时候会跟我抱怨之前的助理,他经常会觉得他提供的 news brief 质量上可能达不到一个 brief 的要求,因为不够 brief,或者有时候 highlight 的点不够 to the point。我觉得这也回到刚才我们提到的另一个点,也是我自己觉得很想去深入了解的一个问题,就是 ChatGPT 从能做这个事儿,到能够以一个符合这个人完整的要求去做这个事儿,中间是不是其实还是有一定的差距,包括刚才你提到的,比如大家有时候抱怨 ChatGPT,它很擅长一本正经的胡说八道,它有时候会给你提供一个字面或者这种形式上看起来非常正确的文本,但事实上它的文本不太能够经得起考验。所以你会怎么样看待这个过程中可能出现的质量上的一个问题,以及你觉得质量的问题它多大程度上可以解决?是什么时间框架内可以解决的问题?

木遥: 这个问题是 ChatGPT 刚出来这的时候,很多人抱怨的核心,也是很多人觉得这可能不过又是一场炒作的根本原因,就是他可能用了两下,发现这不就是说车轱辘话嘛,而且好像也没有很深刻,而且很多时候还在胡扯。但是这里面有两个认知上的分歧需要被摘出来讨论。一个是 ChatGPT 其实不是一个产品,它是一个 demo。所以当你用消费者评估一个产品的视角评价它的时候,评价可能是不公平的。消费者评估一个产品,你可能会说我想要一个帮我扫地的机器人,这个机器人把地扫得不干净。这就是一个很糟糕的机器人,为什么要为它而激动?但是这种视角,只当你讨论的是一个渐变式的新产品才有意义。当我们讨论一个突变式的新产品的时候,你这种评价很可能就会因小失大。我举个例子,在马车的时代,有了第一辆汽车,在各种性能上都碾压马车了吗?其实是不可能的,因为马车被优化了几千年。而第一辆汽车,它一定是非常粗糙的,对不对?马车可能很舒服,抗震性能非常的好,它已经能想到的部分都尽善尽美了。而汽车,它可能会掉链子,它要加油,它可能滴里呱啦的,没什么防震,它一开始是有很大缺陷的。所以,如果你直接比较舒适程度,可能汽车未必比得上马车。至少第一辆汽车是这样。但是它仍然是碾压性的优势。为什么?因为它是一个断层式的革新。所以当你评价 GPT 的时候,你必须分清楚哪些是我刚刚说的这种,它只是因为一个新的东西没有来得及做得好,哪些是它就不可能做得好。但这牵扯到第二个问题,还是那句话,我们大众其实过去已经被这种新技术的轰炸式的新闻弄得神经疲惫了,每个东西都告诉我能够改变世界。3D 打印改变世界,5G 改变世界,比特币改变世界,对吧?每一个东西它都会告诉你改变世界。关于元宇宙的新闻言犹在耳,今天已经没有人提了。你当时也说它改变世界,哪改变了,对吧?所以这种狼来了的心态是非常真实的。我们今天凭什么说 GPT 是不是又改变世界,还只是我们这帮人在认知上……我得承认,你不可能百分之百的准确。你有的时候弄错了,你有的时候以为它改变世界,其实什么事也没发生。这种错误的概率是存在的。但是我仍然个人觉得 GPT 可能比刚才说的那些东西都更有可能是真的。我不能说百分之百,但更有可能是真的。它的缺陷包括两个层面的缺陷。一个层面是它的表达是不是,用你的话说,to the point,或者是不是足够精准,这个东西是很容易通过模型不断地训练改进的。另外一个缺陷,它是不是胡扯,在学术上被称作 fact grounding。它的表述是不是基于真实的事实?这其实是一个非常有趣的技术问题,因为我们今天知道 GPT 也好,GPT4 也好,它都是一个封闭模型。什么是封闭模型?它运行的时候并不实时查阅任何背后的数据库,它只是在复述在训练的时候记住的东西。如果在训练的时候这个事情还没有存在,它就永远都不可能知道。但这不是本质缺陷,这只是碰巧,因为从 OpenAI 公司的角度来说,它总得推出一个什么东西,而这个东西,你要让它查阅现实的数据库,你需要跟很多领域去谈,对吧?你要让它查阅法律数据库,你总需要去跟一个法律数据库的供应商去谈一个什么 deal 出来。或者你要让它实时检索网络,你总得让它真正部署到一个可以实时检索网络的服务器的层面,服务器本身要处理大量的跟现实网络的交互,这不是很容易的事情。Bing 是一个很好的尝试,Bing 把 GPT 置入到搜索引擎之中,但是又同时能够实时检索网络。但是你可能更需要更专业的,比方你需要他能够回答医学问题的时候,不是靠你的记忆来回答,而是你真正去查一个真实存在的医疗文献出来。这是我们作为消费者一个很自然的需求。而这个东西实现起来是需要时间的,因为它牵扯到跟现实的已经存在的知识信息、网络上存在的资源有一个沟通的过程,这个事情不会一夜之间发生,但是它也没什么技术上本质的障碍存在。所以我几乎可以肯定在未来一两年内,你会看到越来越多的基于真实数据的、做好 fact grounding 的 GPT,那个时候 GPT 就不只是靠它训练时候记住的东西来回答你了,它就变成一个中间的 layer,它负责理解你的问题,输出一个答案。但是它背后的事实来自于一个更真实的,比方说法律文书的数据库,或者一个医疗资源的数据库或者等等。那个时候它胡扯的几率就会大大降低。这件事情并没有很困难,我相信会很快发生。

王磬:而且其实你说让我想到它跟人脑的结构也是有点类似的。**比如我在跟你进行对话的时候,如果我不是同时在用互联网,我在跟你进行对话的时候,我所告诉你的所有的东西,其实我在这个点之前,我已经接受到那些东西,我不可能在跟你对话的时候实时去查询。**比如今天天气怎么样,香港的人口是多少,我没有办法实时去查询这样的东西。如果我现在跟你讲了这个东西,只是因为我之前就已经知道了,所以从那个程度上来说,ChatGPT 如果真的如你所说,它能够在接下来一两年内,不光实现理解、回答你的问题,这样一个需要一定的逻辑能力,需要一定的这种交互能力去完成的动作,它同时还可以在交互的同时进行一个无限的连通,相当于让你在跟他对话的时候,你可能获得的信息比你跟一个这方面的专家获得的信息更及时、更准确。如果真的是这样的一个情况,你会觉得这其实是会让人感觉有一点焦虑的时刻吗?

木遥: 首先,这不如果,这是必然,因为这个事情已经发生了。今天的 Bing 就是微软新的搜索引擎,我们一般叫 new Bing,但是读起来有点怪。它就是这样一个东西。它是实时教育,只不过它因为服务上的限制,它没有办法查阅的非常多,因为对服务器压力很大。它也在不断优化这件事情。特别是如果你用中文,用 new Bing 效果并不是特别好,因为由于各种法律上的众所周知的原因,它中文所能搜索到的东西是非常局限的,可能局限于百度知道这样的来源。而这些来源本身的质量你我都知道是有问题的。但是如果你用英文的 new bing,今天事实上是已经在回答你的问题的时候实时调用互联网了,已经不是在靠它的记忆在回答了。但这只是一个通用的搜索引擎,以后会有越来越多专用搜索引擎出现。我跟它聊的时候,它去实时调用一个真实的专业数据库。而这件事情在技术上没有任何难点,它唯一的困难是你得真的去做这件事。得有一堆工程师负责把这些该连的接口连起来,这是需要花时间的,而且需要对方答应给你提供数据的提供商得愿意让你去访问。但这些问题都是可解决,它没有技术上的本质障碍。所以归根结底,GPT 它就是一个中间的过渡层,它背后是真实的、大量的、无限的网络知识。它前面面对的是我们这样的人,它起到的是我一开始一个作为对话的服务。它负责把结构化的知识翻译成我们人类可以接受的自然语言,又把我们人类的自然语言问的问题,翻译成从结构化的知识中提取信息的这么一个 action。这件事情会不会让你焦虑?我打一开始就说了,**它当然应当让你觉得,咱们不说焦虑,至少让你觉得做好准备,否则你就会在真正的变革发生的时候措手不及,因为这件事情不是万一会发生怎么办的问题。它是正在发生,并且很快就会。因为这个东西它带来的效率提升是碾压式的,所以它速度会非常快,就像是当年汽车取代马车一样。它毕竟是一个代际之间的差距,有点像我们中国人刚刚接触到洋枪洋炮的时候,差距是你还是红缨枪,对面已经是火枪火炮了。**那个差距是你没有办法抵抗的,一触即溃的。所以这个过程本身会非常快。而且你必须做好准备,不能还在想说这只是未来,它万一可能会发生,它不是万一,它一定会发生。

王磬: 我就把这个问题再推得更极端一点,因为我觉得在科技发展期,其实大家一直以来也都会聊到科技奇点的问题这个概念。当然你可以给出个更好的解释。我非常肤浅的解释是,根据科技发展史,有一类观点认为,在某一个点,人类可能会接近一个使得现有的文明完全被科技发展所颠覆的这样的一个事件点。这个事件点某种程度上它具有一定的科幻的色彩,可能在一些这种科幻电影中也曾经不断的被描述。但是在现实生活中,到目前为止,它仍然是作为一种假想而存在。在你看来,你觉得这会不会是一个人类发展史上的一个奇点时刻?

木遥: 首先,如您所说,奇点的东西不是一个有共同接受定义的东西,所以你很难精确地说什么今天早上,我们醒来,发现世界怎么样了。这是一个文学性的比喻。你并不会真的找到那么一天或者一个时刻。但是你要说这次的,咱们不说它是不是工业革命,它至少是一个不管什么意义上的革命。它有没有特殊性?有的。我们人类在过往的工业革命史上对机器有一个非常本质的优势。我们虽然在体能上远远输给了机器,但我们的脑力从来没有输给过机器。而我们一般认为人类的能力不外乎就是体力加脑力,或者我们的肉体加上我们的灵魂。如果你在脑力上也被,至少在很大一部分层面上被机器取代了,这就不只是你被机器取代了一部分的问题,是你必须要严肃地问一问自己,我还剩下什么是机器做不到的?这不是一个很容易的问题。我们必须理解,过去两三百年的现代社会,是被这样一种基本认知所塑造的。人类的价值体现在他的脑力上的价值。一个小孩身体非常好,但是脑子很笨。另外一个小孩身体素质一般,但脑子很好。我们一般认为后者更有出息,但这个认为是哪来的?这并不是自古以来就有,这就是工业革命的产物。工业革命让我们觉得脑力比体力在社会价值的鄙视链上更高,而它更高的唯一原因是它是我们人类的优势的体现。我们再把话题再推得极端一点,我们想想,有三个小孩,一个小孩身体倍儿棒。一个小孩脑袋非常好,会做奥数题。一个小孩长得非常好看,他身体也未必有多么大的体力优势,但是他就是长得非常好看。我们今天的家长会觉得哪个小孩最有出息?我们会认为脑子好的小孩最有出息,对不对?学好数理化,走遍天下都不怕。第一个小孩是最没出息的,他只能去送外卖。第三个小孩他可能也能挣很多钱,他长得很好看,但是我们今天的价值体系认为你靠脸吃饭,不是说不可以,但他好像有点不是正道,或者不是我们家长会希望小孩子走的道路,对不对?你今天问一个家长,希望小孩他是做工程师还是去当网红?他可能会觉得网红也挣很多钱,但是他仍然希望,如果你能做工程师,还是做工程师好。但这个价值排序,它不是天上掉下来的,它也不是自古以来就有的,它是工业革命的产物。工业革命让我们觉得脑力是最高级的。脸也挺重要的。你要只有肌肉,那就好像等而下之。但假如你的脑力也被机器碾压了,这个价值体系还能不能维持?显然就不能了。你没有任何理由认为聪明是一种优势。因为你反正也不如 AI 聪明。当然,今天还不是这样。**今天我们仍然比 AI 聪明,但如果 AI 进一步变得更强大的话,你就没有 AI 聪明了。那时候,我们人类的价值体现在哪里?**如果你还是长得很好看,你是当网红,如果你长得不好看的,你存在的意义是什么?这是一个非常本质的存在主义的问题。而这个问题我没有好的答案。因为我们人类没有经历过这种时刻,我们人类没有经历过在方方面面所有的维度上都比不过机器的时刻。所以把它叫不叫奇点,我不知道,但它确实是一个崭新的、没有存在过的一个状况。

王磬: 另一个问题也是刚才你提到历史上的这种情况。所以,如果比如要帮助我们理解今天的情况到底有多特殊,你会觉得在人类历史上曾经也是出现过的、这些对世界格局,对人类的发展进程产生了深远影响的技术革命,你会觉得有哪一次可能会是跟这一次可以相提并论的吗?

木遥: 这两天会在网上看到很多比喻。很多人说周四的微软发布会是微软的 iPhone 时刻,相当于苹果在 2007 年推出第一代 iPhone。也有人认为这次的革命的幅度会超过智能手机的革命。我们这代人其实最近的两个革命,一个是互联网革命,大概诞生在我们这代人刚出生的时候。一次是智能互联网或者是移动互联网,一般被认为就是乔布斯那次著名的发布会,2007 年的时候。这是我们能够拿来做参照系的东西。当然我刚刚说了,这两个做参照系都不是特别合适。首先,我个人觉得这次人工智能革命的激烈程度会至少大于移动互联网,是不是大于互联网本身还不好说,我们还要再看。但是另外一方面,我刚说了,这两次革命再怎么说,已经发生这两次互联网加上智能手机,都没有触及到我们人的存在意义的问题,对不对?你并不会觉得有了互联网,你人就没有存在的意义了。但是当这世界上大部分人,他会问自己,我在这个世界上能够干什么?如果这个问题没有答案,就算我们社会结构因此适应了我们,给那些找不到工作的人发一个今天在西方讨论很多的 UBI,就是基本生活补助,或者给你一个基本的钱,让你不至于死掉。即使这样,这是不是解决了问题?其实没有,因为我们人毕竟不是只能靠混吃等死就能过一辈子的生物,我们需要有一个存在感,我们需要有一个存在意义的自我追问。哪怕是可能不知识分子的人,哪怕是一个普通的日常的老百姓,他也需要有某种意义感。我们都听过那样的故事,就是一个人退休之后,或者一个妈妈发现她的儿女长大成人,不再需要她的建议之后的那种失落感。为什么你会觉得失落?因为你觉得我希望成为一个有用的人,对不对?有用并不一定体现在我挣工资,但我希望别人认可我的存在,我希望我以某种方式在跟别人交互的时候发挥出某种价值。**但如果我不但身体的能力比不过机器,连作为一个可以对话的人所能提供的价值都比不过机器的时候,它对人类的心理上的冲击是无可比拟的。**你很难跟互联网或者跟汽车或者跟飞机的比较来做衡量,因为那些东西并不触及这个层面,而这次是真正触及了这个层面。你作为一个普通人,你既不特别漂亮,又不特别聪明,你不能够成为那些去开发 AI 的工程师,你只能用它。你工作的意义是?你生活的意义是什么?这是一个真实存在的问题,我没有答案,但是它确实是我们人类第一次碰触到这样的问题。

王磬: 我想反向来问一个问题,我们刚才其实谈了很多 GPT 可能带来的技术变革,它能做什么,现在能做什么,未来可能能做的更多。从你的角度来看,你觉得如果我们要去定义 ChatGPT,它不能做什么,你会怎么定义?

木遥: 我们都知道,在过去的二三十年里面,我们社会的家庭观念,或者我们社会的关于家庭劳动的价值发生了一个很大的转变。在上一辈人的观念中,比方假定你是个家庭妇女,你的工作是不被认可的,对不对?老公出去挣钱,他觉得他在挣钱养家。老婆在家里工作了一整天,甚至不是一周工作 5 天,是工作了 7 天,但她在家里面收拾东西,洗碗做饭,照顾好小孩。这个工作不被认为是挣钱,不被认为是平等的劳动。所以老公可以回来往床上一躺。我在外面挣钱挣了一整天,好累,你给我干什么干什么。过去 20 年,由于女性主义思潮的兴起,由于社会更全面地进入现代化,我们开始意识到,这个观点发生变化了,我们开始意识到家庭劳动也是平等的劳动,这部分劳动很大程度上是不可取代的。但它再怎么说平等,它也只是我们把本来不被承认的劳动价值提到了一定层面上。AI 的出现会让变化更剧烈的,我甚至都不能说推动,而是把它会打乱。为什么?因为你会发现,它会把这两件事情的重要性调过一个个来。AI 仍然不能帮助你洗碗,它仍然不能帮你照顾小孩,伺候老人、收拾家。某些部分可以,比方扫地机器人可以帮你扫地,但是很多事情今天仍然大家做不了。最简单的,你想把衣服都叠起来,这个事情你雇一个机器人来干,仍然不是马上就会发生的事情。传统上认为是成功人士的,每天出入于写字楼的西装革履的老工作,干的事情反而会变得毫无意义。他的工作既挣不来钱,也挣不来意义感,因为他做的事情,AI 都能做了。我们的不管是家庭观念也好,劳动价值也好,会发生什么样的变化,我自己不知道,但是它是一定会发生的。因为你刚问我什么样的工作仍然不能够被取代。这些东西仍然不能被取代的。那些照顾人的部分,那些在情绪上,在肉体上,在一切人和人交流的意义上所付出的劳动,都仍然是不能被取代的。当然,今天 ChatGPT 已经可以跟你聊天了,所以你可以跟它倾诉,甚至可以跟它谈恋爱,在某种意义上来说,但是它仍然不能取代你真实人和人之间的 care 对不对?但它可以取代你在白天上班的时候看起来光鲜的白领。所以,**它会非常非常深刻的影响我们整个社会的对价值的排序。我们本来被看作比较低级的所谓的家庭劳动,或者是那些不挣钱的劳动,会变成人类真正的安身立命的东西。**而那些传统的被认为是高级的 professional 的挣钱养家的劳动,我也不知道像什么一样,但是它会逐渐消散掉。

王磬: 你提到这个,我觉得挺有意思的,比如像照护或者情绪价值。我记得前段好像是 ChatGPT 刚出来那阵子,当时有一个主流媒体的记者去跟 ChatGPT 进行了一场聊天,他后来把整个的转写发在了网站上,他说他聊完了之后,其实当时有点恐惧,因为 ChatGPT 跟他聊到他的感情,并且劝他离开他的妻子。我不知道那个东西它在发出来的时候,以那样的一种 highlight 发出来,这背后有多大的一个真实性,或者是不是中间有一些过度阐释的部分。但我觉得它某种程度上其实是在于是 ChatGPT 它可能提供的想象确实我们之前从未想过的。我记得曾经有过一部电影,叫做 Her,讲的就是一个人跟人工智能在谈恋爱的故事。人工智能跟他交互的方式是以一个女性的声音,当然那个声音非常的好听,是斯佳丽约翰逊配音的。在故事当中,这个男主角确实是不可自拔地跟 AI 在进行一场恋爱。所以某种程度上,你要说他是可以部分的去取代对人的这种情感价值、陪伴价值,甚至可能有一天也能够实现照护的一些功能。如果按照刚才我们讲的逻辑,它现在既然已经能够比如从 ChatGPT,包括在 office 里面的这种应用,它是可以指导你去进行一些行动的。如果加上之后这种物联网的一些发展,像比如叠衣服,现在可能会是一个比较相对来说比较复杂的动作,但是听上去其实是一个相对来说技术上更容易解决的一个问题。你不需要把动作拆分成很多的步骤,但实现它可能也许只是一个时间的问题。比如再早一点,像洗碗机这么复杂的功能也得到了一个实现。所以我想讲的就是,听你聊完了这些之后,我自己现在对于 ChatGPT 的感受确实是还挺复杂的。一方面知道它会对你的这种工作、现在这种生存状况带来很大的影响,这种影响可能都不是一个未来,是他很有可能就已经是一个现在进行时。但另一个方面,它其实也把现在的结构当中,**可能很多重复的部分,或者很多不尽如人意的一些资源,让他进行一轮更好的整合,也许会在某些程度上把人类从大卫格雷博所说的那种 Bullshit Job 当中解放出来。**但是我想知道,从你自己的角度来看,如果去描述你在面对 ChatGPT 的这种巨大的技术进步,你的这种情绪上的回应,或者情绪上的一个波动,你会怎么样去描述它?

木遥: 先回答刚才纽约时报的问题,就是他跟 ChatGPT 聊了一晚上,谈了一个非常荒谬但好笑的恋爱。我们会不会有一天真的觉得 AI 可以跟我们谈恋爱了,或者满足我们的情绪价值需求了?我不知道,可能会,可能不会,可能我们这代人还不会,因为我们这代人的思维形式已经定型。但是今天才出生的小孩,他会不会?我一点概念都没有。**我有很多朋友告诉我说,他们家的小朋友其实在家里跟智能机器人聊天是非常常见的事情,我们很难想象,因为你觉得你在家里跟一个音箱聊天,是不是有点 creepy?但是如果你出生的时候家里就有一个智能音箱,他可能不觉得这任何特殊之处。你就聊了。

王磬: 我补充一个例子,我最近在学校里面教课,我的学生就有跟我说,他们的同龄人里面在跟 AI 谈恋爱已经不是一个非常少见的现象。

木遥: 所以我们会不会真的跟它谈恋爱,我不知道。如果一个宅男,他本来也没有什么真实跟人谈恋爱的能力,他确实觉得 AI 可能是一个更好的选择,这也是有可能的。它会不会能够帮我们叠衣服?你刚用了洗碗机的例子,其实洗碗不是一个好例子,因为洗碗那个东西是碗,碗大不了就打碎了,也就是个碗。我这么说好了,我举一个很简单的现实生活中的例子。你要给小孩换尿布,这个事情什么时候能够让机器来干?我认为不会很近,因为活生生的一个小孩对安全性的要求不是像洗碗机这样的。它虽然是个技术问题,但它不是一个马上就能解决的问题。我觉得它反而比很多我们认为本来遥遥无期的事情——比方说让 AI 写一个长篇小说——更难。当然,这是关于未来的判断,很难百分之百的确定。但是,归根结底的本质问题是,我们在情感上的需求是什么?我们这代人可能已经逐渐步入中年,我们可能思维模式已经定型了。下一代人是不是这么想我不知道。但是我们人的情感需求是不是只是有人陪你聊天就够了?还是你真的需要一个活生生的人?这个是一个哲学问题,我没有好答案。这应该是一个用你一开始的说法,这其实应该是一个文科生的问题,对不对?我觉得它是一个很重要的问题,但是我没有很好的答案。但我觉得有两件事情值得一提。一件事情是,AI 会在很大程度上会提升我们传统上认为女性更擅长的很多优势的重要性,因为那些东西相对而言不太容易被 AI 迅速取代。这句话当然很容易找到各种各样的漏洞,但是我来解释一下什么意思。我们传统上认为,我们今天的职场上,你说它是偏见也好,说它是刻板印象也好。但今天我们确实更普遍地把跟理工科的或者跟定量思维有关的任务派给男生,不管男生是不是实际上更好。你要问我,我并不认为男生更好,但是现实社会结构是这样的。我们认为男生来做这样的事情是让社会上更约定俗成的一种办法,而把那些跟沟通、跟协调有关的事情派给女生。我需要强调,不是这件事情有什么必然性,但今天的社会事实上是这么运作的。这两类工作,哪一类更容易被 AI 去代替?显然是前者。AI 今天会让你处理一个 Excel 报表的工作变得完全不重要,因为它做 Excel 比你做得好多了。但 AI 能不能更好地协调一个团队?未必。因为其他团队。我们仍然是人的生物。本能需要有某种人和人之间的 bond,人和人之间的非常微妙,非常难以言表、但真实的 human interaction 所带来的 chemistry。这种能力,AI 暂时是做不到的,或者我们想不到它用什么形式做到。我们人类可以服膺一个真实的人的协调,但是我们人类会愿意服膺一个 AI 的协调,或者它的领导和指示吗?这其实我不太确定下一代人会不会,他们可能会觉得更自然,但是我不知道,只是我们这代人,可能需要一点心理上的转变。所以在这个意义上来说,这是我刚回答你的问题的第一个层面。我们人类仍然是有一些工作暂时不会被马上取代的,这种牵扯到人和人交流的。

王磬: 我想问你,从你个人来说,你觉得你会跟 AI 谈恋爱吗?

木遥: 我不会,但是我已经是成年人了,我的思维方式已经定型了。下一代人会不会我不知道。

王磬: 你不会跟 AI 谈恋爱的这个点,你觉得 AI 它不能够给你提供的是什么?

木遥: 不能给我提供的是一个我在活人那里获得的认可。这里面牵扯到一个本质问题,就是为什么活人的认可那么重要?我不知道,但是我小时候是这么被培养长大的。人总有他的时代局限性。我和你是一代人,我们这代人就是这么觉得的,觉得活人的认可比一个算法的认可重要。但是我们小时候也没有什么算法的认可这回事,对吧?所以你打一开始你追逐的就是活人的认可。如果小时候就告诉我算法的认可也挺重要的。那我今天是不是另外一种想法我不知道,但我们毕竟已经长大了。第二点是我们所描述的是一个动态的过程,所以它并不会让你在一夜之间看到,它必须跟我们别的社会议程一道发生作用。我仍然想说的就是,我们刚才说的很多社会结构的变化,其实在没有 AI 时候也在发生。我们今天的领导层上越来越多见到女性,我们强调 diversity 等等。这些东西长期以来只是被认为一个纯粹社会议题好听点叫社会进步,说难听点叫白左的 agenda。但不管怎么说,它是真实在发生的东西,但 AI 的介入会跟它同步发生,使得这个过程变得更加有趣,也难以预料。因为有很多我们传统上被认为重要的特质会变得不再重要,所以整个权力结构会因为 AI 的参与进来而发生重要的调整。而这部分我是很难用一个简单的非黑即白的方式来把它总结出来的。我是在回答你一开始的问题。我们认为哪些事情能够不被取代?我不知道。因为新的权力结构中可能有一些新的角色出现,而这些角色在旧的世界里根本就不存在,所以我根本无法预料到。比方有些新的决策。也许 AI 沟通师或者什么之类的,根本以前不存在的角色,而这些角色可能会变成某些人的专长,我不知道。这是我要想说的第二点。

王磬: 刚才说到我们从小怎么样被教育的问题。确实,作为人来说,你是有成长期的,你过了成长期之后,其实你的这种价值观、世界观,你怎么样去认识你周围的世界,这一套结构已经被建立起来的时候,其实我们就已经变成了一个所谓的成熟的人,一个成年人。但是我不知道对于 AI 来说会不会其实会更是一个线性的过程,是一个扁平的过程。没有所谓的比如青春期,也没有人生,不会存在不同的阶段,他可能也不会死亡。

木遥: 它没有人生,但它会有换代。我们人在整体上来说,虽然我们每个人有人生一说,但我们的人性在整体上来说,上下限是比较固定的。而 AI 的特点是它每一代跟前一代都不一样。所以你不是面对一个 AI,你是面对好几种不同的 AI,每两三年就会面对一个全新的 AI,而那个 AI 又要让重新适应一遍,对吧?所以其实 AI 是一个更大的集合。AI 的 diversity 其实比我们人的 diversity 要更大,只不过我们今天只有一个 player,就是 ChatGPT。但很容易想象,10 年后、20 年后,这个世界上是有很多种完全不同的 AI 同时存在的,所以它每一个个体是固定的,但它们之间内部的方差会远远大于我们人类之间的方差。你刚刚说人类的适应性的问题,我想一个很有意思的问题。我相信很多人也很关注的问题就是未来的教育哪些东西还重要,哪些东西变得不重要了。我们这代人的教育重要不重要,是我刚刚所说的那种我们现有的社会结构决定的。我们认为数理化最重要,其次是文科。我们虽然政治不正确,但是我们都心知肚明。在我们念书的时候,理科是比文科被大家认为是更好的专业。我知道今天网络上会对这种问题有很敏感的反应,但是我们不是说这件事情应该如此。但是,我想说的是,我刚说的是工业革命的语序。工业革命让我们觉得文史哲相对没有数理化那么重要,或者是跟现实生活直接发生联系,或者有 impact。但是在 AI 介入之后,这个结构会被打破。所以会不会走到下一代人,他们就会觉得“学好数理化,走遍天下都不怕”这句话没有任何道理?我们今天是很难想象的,但是下一代人可能会觉得当然应当如此。你学好数理化干什么呢?而且这种变化也不是没有发生过。你想象一下清朝末年的最后一批翰林,他们面对的是同样的情况,他们读了一辈子四书五经,靠着这个安身立命,靠着这个当上大官,靠着这个变成国家领导者。但他们下一代是完全不学这个了。我小的时候曾经有一个困惑,就是**1840 年英国人打过来了,那个时候难道你就没有意识到四书五经已经没法面对这个现实世界了吗?为什么中国人要到 60 年后才取消科举?**你难道要花 60 年才能意识到科举已经完全没有实际意义了吗?后来我长大了,我就意识到这件事情的必然性了。为什么要 60 年?因为 60 年差不多就是两代人。一个小孩是没有权利去取消科举制度的,只有那些已经功成名就、位高权重的大人们才有权利取消,而他们自己是科举上来的。你让 1840 年的那些宰相翰林大学士们取消科举是不可能的,因为他们自己一辈子只经历过科举制度,他们的儿子那一辈 30 年后也不会取消科举,因为他们虽然在 1840 年的时候还不是掌权的人,但是也已经 30 岁了,世界观也已经定型了。因为他们的孙子辈,1840 年刚刚出生的人走上权力中枢之后,那要到 60 年后才取消,科学的真正的动力才会大于阻力。物理学家普朗克说过一句很有名的话,“物理学的每一步前进,都是由伟大的物理学家的葬礼构成的”。他的意思是说,只有老一辈人死掉了,那个旧的观念才会真正消失,新的观点才会出来。你说当时英国人打过来的那个冲击够剧烈了,冲击再怎么剧烈,还是要两代人才能完成观念上的转变。**今天很可能你仍然会发现,人的固有的惯性、生物上的惯性仍然会起作用,我们仍然会试图捍卫我们这代人或者我们下一代人的世界观,直到我们都死掉了,我们下一代人也垂垂老矣,再下一代人才会彻底迎接 AI 的新的时代。**到那个时候,他们才会真正觉得,为什么人要花那么多时间去学习所谓的理工科知识,这些知识难道不应该让 AI 来做吗?那一天的教育是什么样子,我不知道。今天还有很多人会说,你应该去学习理工科的,甚至还有很多人让你去学编程。我那天看到一个非常好玩的新闻,有一个非常著名的在线教育机构,叫做 Khan Academy,可汗学院,是一个非常著名的做在线教育的机构。他们很快地跟 GPT 接触,用 GPT 来改善他们的教育。一方面你会觉得不错,动作好快。另外一面,你又会纳闷说我到底为什么还要再学你这些课程?这个感觉就好像是你一个马车夫,明明都看到汽车发明了,他兴高采烈地去学开车。但你问他学开车干什么,是为了去更好地喂他自己的马。你会有一种时空错置的感觉,他那些课程本身到底还有什么用?虽然我可以通过 GPT 作为助手学得更快,但是我为什么还要学这个东西?包括今天很多人还说人工智能是 Python 写的,所以我要现在学 Python。问题在于,人工智能固然是 Python 写的,可是人工智能自己也会写 Python。所以你在一个已经有了人工智能的时代,你为什么要去学 Python?这些问题是真实存在的。但是人会有固有的惯性,我们不能够一夜之间就调整到新时代。我们需要花很多时间,很可能要消耗到一两代人的时间,才能够真正跳转过来。中间这个过程可能是非常混乱的,可能是非常无序的,甚至可能是波浪型的,我不知道。

王磬:你这里就讲到一个我觉得挺有趣的逻辑上的矛盾,就是人工智能仍然是由这些人工智能的软件工程师书写的。可以这么说,如果从现在开始,新的这一代,他们就已经觉得学习编程是一个不需要再去学的事儿。他们可能永远都不会达到可以去编写人工智能的水平。因为你要写,你肯定还是需要一系列的技术才能到达那个水平。如果是这样子,未来的人工智能,它的更新换代将会是一种什么样的情况?自己给自己更新吗?还是说会怎么样?你为什么笑?这个问题很蠢是吗?

木遥: 不蠢,这个问题是非常好的问题,但是它过于科幻,以至于我很难忍住笑。我觉得长远来看,人工智能自己更新自己是一定会发生的。但是重点不在于长远,因为那天到来的时候我们都死了,重点在于我们怎么过渡到那一天,中间是什么样一个状况。简单的说,我不知道,因为你问的问题其实是一个不光是在编程领域,在各个领域都存在的问题,人工智能首先淘汰的是任何一个技能上的平庸劳动者。这很容易理解,对吧?因为如果你是真的一个极其出色的人,你仍然是有一技之长可以做得比较好的。但如果你只是平庸,只是 average 水平,人工智能就很容易把你去掉。但你马上就会问,你把平庸的人都淘汰掉了,那些少数的人,他们从哪里成长起来,对吧?我就像我们刚才说了一个公司里面那些小张小王都被淘汰掉了,老板不会被淘汰,可是老板也不是天上掉下来的,他也得从小张小王那个地方干起来。用中国人的话说,“宰相必起于州部”,他必须从一个小官干起,一步步干到宰相。如果你把第一层的平庸的东西都干掉了,社会职业路径是怎么样的?我们没有经历过这种情况,所以我不知道未来的社会到底怎么样。如你所说,大家都不学 Python,到底一个人怎么变成写 Python、写人工智能的工程师?虽然那可能是个很小的群体,全世界只需要 1000 个人就够了。但他的职业路径是怎么样的,我不知道,但我说我比较有把握的是这样一种现象会一定会发生。人工智能的出现,会极大地放大人和人之间技能差异所带来的资源差异。这个过程不是新的。人类历史就是这样一个过程。在农耕时代,一个好的农民和一个坏的农民的年的收成的差异,不会有特别大的差异,差出一倍撑死了。到工业革命时代,一个好的工程师或者一个好的技工,他所能创造的价值就已经比一个平庸的人、平庸的技工创造价值要高很多了。因为机器可以放大差距的能力。到了编程时代,过去 20 年,你已经会发现一个好的软件工程师,他所能的创造的价值,他所能够造成的社会影响,会远远高于一个平庸的、学了两天 Javascript 就跑到社会上找工作的一个普通的码农,差距会非常非常的大。我曾经跟磬有一次私下聊天聊过这个问题,Google 有一个非常著名的工程师叫 Jeff Dean。当然了,很多人说他已经不是工程师,应该叫领导。但是他自己确实写程序上来的,他今天也仍然在写代码,技术上来说,他也是一个码农。他和一个一般码农所能创造的价值的差别可能是成千上万倍的。当然,他拿的工资也确实是成千上万倍。而 AI 会把这个曲线再进一步推得更陡峭。AI 会让极少数控制 AI、掌握 AI 的人,他们所作为资源的网络的枢纽节点,他们所创造价值的能力和调动资源的能力会远远超于普通的一半人。这是我们今天社会面对的真实问题。我们本来已经面对很大的社会不平等了,但 AI 会把这个东西更进一步地放大。这个现象很多人今天已经发现了。今天如果你去推特上看业内人士对 AI 的辅助编程这件事情的讨论,大家都发现了一个现象,AI 会成百上千倍的提高一个好的工程师的工作效率。只要你能够很快掌握跟它共同工作的节奏和模式,它会让强者更强的马太效应极其显著。所以在那种情况下就会发现,一般的社会职业也好,或者少数的我们小时候特定的编程这样的工作也好,大量的工作是由极少数人承担的,而那极少数人因为有了 AI 的帮助,他会非常容易地调动各种各样的资源,而大量的人会完全无法跟上。这种社会结构显然是有它的问题的。社会不平等大家都知道是非常深刻的问题,但是它跟我刚刚说的大部分人会失去存在意义,或者会面对一个存在主义危机结合在一起,它会以什么样的形式延续,它会不会导致整个社会的不稳定?我不知道,因为了我们没有碰到过这样的情况,但是至少目前来看,趋势确实是这样的。

王磬: 我觉得我们可以顺着这里聊一下 AI,或者我们先聊 ChatGPT 可能会面临的伦理的问题,以及监管的问题。我也在港中大课上跟我的学生简单交流了一下,我就问他们,你对于 ChatGPT 可能最想了解的是什么?其实很有意思的是,不少同学都提到希望了解 ChatGPT 应该可以怎么样去更好的监管。我觉得这其实可能一方面是因为课上的大多数朋友还是文科生,所以我们思考问题的角度更是从一个社会治理的角度去思考。但另一方面,我觉得其实也能够体现出某种程度的焦虑。在焦虑的情况下,可能是有一部分人会希望 AI 发展的更慢一点,给不受监管\不受控制的这种野蛮生长去提供一定的阻力,或者提供一定的规范框架。所以我也想了解你是怎么样看待这个事儿的。科技监管这个事儿我觉得也是一个老生常谈。我们知道在美国、在中国、在欧洲,其实不同的制度下对科技监管是有不同的态度。像我比较熟悉的欧洲,其实对于这些年来比较主流、比较迅猛的一些科技发展,一些科技公司的壮大,都是采取了一种相对来说监管为主的这样一种思路。但在美国和在中国,一方面由于这种科学巨头的存在,另一方面我觉得也跟本地的社会还有企业文化有关系,对监管会呈现出一种可能相对来说更开放的态度。我不知道在你看来,你觉得对 ChatGPT 来说,我们现在去聊监管是不是为时尚早,还是我们现在去聊它已经有点晚了。

木遥: 首先,我百分之百的同意 AI 必须以合适的方式监管。但监管本身是一个含义模糊的词,根本不让 AI 发展也是一种监管。但很显然,这未必是你想要的监管。你刚说到中国、美国、欧洲的差别,我相信你自己在欧洲,你一定对这个情况非常熟悉。欧洲一方面确实它监管更严厉,但另外一方面,它也因此在过去 20 年的科技浪潮中明显落后于中国。所以它固然避免了很多问题,但其结果就是今天的互联网巨头可能一半在中国,一半在美国。在欧洲的几乎没有,不是完全没有,但是明显落后了,跟欧洲应当在科学技术浪潮中的应有的地位完全不相称。

王磬: 而且某种程度上我了解到的正好是因为它没有这种科技巨头,所以它在通过一些监管法案的时候,它面临的游说的阻力更小。所以它是有点相辅相成的过程。

木遥: 对,它就变成一个恶性循环了。因为政客并不需要顾忌巨头的压力,所以政客就可以通过各种各样的立法,通过立法之后,他又未必真的懂这一行。其实我是立法可能扼杀了创新,或者至少阻碍了创新,更加难于生长出新的巨头出来。但总而言之,我不知道欧洲的政界怎么看待这个问题,但是至少你从一个旁观的角度来看,它确实落后了,对吧?可能在监管上没有落后,但是在经济上、在技术上都落后,这种落后长远来看是福是祸,很难讲。特别是欧洲人,你也知道,他本来可能觉得我生活也就挺好了,我干嘛要中国人那样卷对吧?每年夏天我去海边度假就好了,我并不需要科技巨头,这当然也是一种生活哲学。但是当这种差别更大的时候,我不知道欧洲人能不能还那么心平气和。如果他发现 AI 真的是新的工业革命,而他被工业革命放弃了。就像早年的工业革命诞生于英国,从欧洲扩散到整个全球。如果今天反过来,欧洲变成了工业革命的洼地,我不知道欧洲人会怎么来理解这个事情。但是到监管的时候,你必须要考虑的一个问题是,你不能做膝跳反射式的监管。什么叫膝跳反射式的监管?你在还没有了解这个事情的本质之前,就凭着恐慌或者凭着焦虑来做很容易被时代抛弃的决定,你的决定很可能不是基于完备的事实做的,也不是基于对长远的深刻洞察做的,而是基于你在那一刻的本能反应做的。这种监管很容易变得毫无意义,要么过度严厉,要么被现实抛在后面。在这点上,我其实……下面这句话很可能又会引起很多争议,但是我是对所谓的文科舆论界也罢,知识界也罢,对这件事情的反应,让我是觉得有点失望的。因为我觉得大部分我看到的反应、大部分我看到的批评。都不在点上的批评就不是真正的批评,也不能构成有效的监管,这很容易理解,对吧?我刚才已经举了一个例子,就乔姆斯基那里。但他毕竟 90 多岁,大家知道他老了。但另外一个很好的例子就是前一阵子非常流行的那篇文章,姜峯楠那篇写在纽约客上的文章。他的那篇文章是发在 1 月份,他自己是科幻作家,大家认为科幻作家应当是比较有前瞻性的,但是他那篇文章就非常落后于现实发展。他写得非常好,那篇文章本身写的就文章而言是很好的,唯一的问题就是它落后于现实。它文章的结语是,ChatGPT 不过是关于现实互联网的一个拙劣的、模糊的复印机,你有真实的世界在那里,你要复印机干什么?这个结论是,说白一点,错的。ChatGPT 并不是现实世界的复印机。我相信他如果哪怕推迟两个月写文章,他都不会把文章写成那样,因为今天的现实已经非常明确地揭示这一点。这文章写得很早,所以他做出了一个在我看来膝跳反射式的反应。如果你基于这样的反应来做监管,当然不会形成任何有意义的监管。这反映一个现实问题就是,我们不说文科生或者怎么样,但是确实大部分人,如果他不处在这个技术的核心地带,他确实容易因为技术上就不是很了解,所以会有各种各样不正确的反应。如果你是个老百姓,当然无所谓,但如果你是知识界的重要领袖,或者你是政客,你是能够真正参与监管过程的人,你在你不了解的时候就做出反应,就会导致这样的误区。但是了解又非常困难,因为一个人可能没有这样的知识储备,对不对?我相信像神经网络这样的词,你今天也耳熟能详了。但是大部分如果不是做这一行的人其实对神经网络只有一个非常抽象的、模糊的概念。了解到底什么叫一个神经网络,一个神经网络有多大,怎么运行,是没有一个上手的概念的。在这种情况下,你到底怎么监管?你是不是要等到他已经全世界开花结果了再去监管?那个时候确实太晚了。但你早期监管的时候,你怎么介入?所以我觉得比较重要的办法就是多进行像我们今天这样的讨论,尽早了把不熟悉技术背景,但又在舆论场上,或者在政治上,或者在知识上,重要的既是业外又能够影响社会的声音纳入进来。让大家怎么说?on the same page,至少在事实层面上弄清楚发生了什么,什么即将发生,它的能力的上限在哪里?哪些事情我们今天仍然不认为它能做到,哪些事情你们以为它其实不可能做到,但是它其实今天已经能做到了。把这些事情先弄清楚,再来谈我们该怎么监管的问题,对不对?有些问题可能是吸引眼球的,比方我们禁止它谈恋爱,或者禁止它给人看病。有些东西是更本质的,和我刚刚说的,如果它极大地冲击了我们今天社会上已经很加剧的不平等,怎么办?我们有没有社会上的好的机制去介入,去做一个补助,或者是一个对人的关怀。这些问题是更现实,说老实话,也更紧迫的。王磬:说到监管的问题,我觉得其实这几年不光是欧盟相对比较偏严格的立法的思路,还是在美国之前这些科技巨头去国会做听证的时候,你也能看出来。其实我觉得很多的议员对科技是非常缺乏了解的,如果你考虑到他们的年纪,也对这个情况并不意外,可能他们能够问出的一些问题是他们的助手给他们的,他们自己可能本身对这样的最新的技术进步并不感兴趣,但他们手中同时握有非常大的关于这个社会应该如何结构的权利。就是你刚刚提到的为什么要花 60 年才能够废除科制。所以我觉得这是一个可以是人类遗留的一个这种劣根性的问题。另一个问题,我觉得可能对于当下的人来说更迫切的一个问题,你刚才也提到的,我们需要让不管是哪个行业,哪个领域是文科生、理科生,是中国人、美国人、欧洲人,大家可能需要对一些即将改变我们生活的科技技术有一个相对来说在同一个水位上的认识。我觉得认识其实是很难达到的,某种程度上在集体层面上去提高这种观念的水位。比如到一个比较实际的问题,你今天提到了很多次,说我们应该为社会去做准备,因为它不是即将发生,它是已经在发生、正在发生。如果要你给出一些建议,你会给出怎样的建议?我们可以怎样去为社会做准备?

木遥: 这是个很好的问题。我先给你讲一个我自己的体验。我自己在网上经常会聊这个事情,我发现当我长篇大论的讲我觉得技术大概怎么回事的时候,当然反应也很好。但是反应最好的永远是,我贴出一个视频说你看现在也可以干这个了。这种事情当然让你觉得有点好笑,因为你付出的劳动反而后者是最轻的,你就贴一个视频就可以了。但是我们社会就是这么运作,对不对?大家你看一个长文,想象它给你带来的影响总是不直观的。而直观就是,哇,AI 可以干这个了,一个短视频,越短越好,1 分钟以内,你放到抖音上,马上一夜之间,所有人都看到。大家说怎么办,失业了。这种冲击是最强烈的。这当然是一个非常尴尬,也不是一个很理想的状况。但是这是一个真实的状况。你刚刚说的关键的水位很难持平。如果是 1840 年那个时候,你让大家都接受科举制,已经过时了,很困难。今天的好处,也不能叫好处。今天现实是,你不用真的等那么久,因为大家很快就会见到真实的东西了。1840 年那个时候,毕竟你让中国一个内陆县城感受到洋人的冲击,没有那么剧烈,对不对?顶多能见到一个火柴,但是他们可能见不到。铁路修建需要时间。但是今天你再怎么对技术怀疑的人,其实也你也不需要跟他争论,因为几天之后,他就会在现实面前败下阵来,对吧?他周围人都开始在 office 用的时候,不再打一整行字了,他就直接在旁边问我现在想写这么个东西,帮我列一个稿子来,它就列出来了。你再怎么怀疑技术的人,他也很快就会用上这个东西。这是一个事实层面的征服它的过程。所以关键首位反而是比较容易持平的。因为大家会眼见为实。你让大家想象一个未来是比较吃力,但是你让他看到大家比较认可,你让他用到,他就更加哑口无言了。我刚才说我律师朋友,他自己其实是非常非常不喜欢探索新技术的人。你说服他用一个新的 APP 是非常困难的。他真的一用,他发现这东西真的管用,他很快就会被说服。但是被说服这东西有意义、这东西有影响是一回事,做好准备是另外一回事。**因为很多人我刚才说了,他不是资源的占有者,他很可能是在浪潮中间被摆布的、被淘汰的,或者至少是被冲击的对象。他可以说好的,我现在知道了,我观念跟上了,我知道 office 可以干这个了,我本来花上 1 小时才能做到幻灯片,他 2 秒钟就给我干好了,但这只能说明我老板不需要我了,我该怎么办?**首先,我最大的回答,当然是最简单的回答就是我不知道,因为我确实不知道。但是如果你今天是一个仍然在职业生涯初期的人,我觉得有一个可能是老生常谈,但也确实真实有效的回答是这样的。你必须意识到,当大潮袭来的时候,你最大的资产,一是你的安全保障。安全保障当然体现在各种方面,而且这东西很大程度上也不是你自己能够想有就有的,也取决于你的家境或者怎么样。但是安全保障是第一位。

王磬: 富二代水位会高一点是吗?富二代就在泰坦尼克的……开玩笑,你说。

木遥: 不是开玩笑,这是真实的。但是第二个问题就是你保持自己的灵活性。灵活性体现在,不管发生了什么样的未来,你都有以某种方式可能是比较你不好想象的方式,包括很多人开玩笑,好的,我也会去给人送外卖,或者好的,我也会去当厨子,有开玩笑的成分。**但是无论如何,你越有选择,或者你越能够保持自己的选项的 flexibility,你就越能够迎接变化。**你越早把自己锁死在一个道路上,你就越不容易迎接变化。今天很多在互联网上的关于 AI 讨论,下面最常见的评论是什么?说,好的,我明天就去考公。因为你知道,对中国人来说,宇宙的终点是体制,考公永远显得像是最后的救生衣。但考公就是一个非常典型的把自己的所有路径都锁死的一个东西。我不是说大家不能考公,我只单纯说这是限缩了自己的 option。当你限缩了自己的 option 之后,当大潮袭来的时候,你的灵活性就会降低,你的安全感就会降低,你就会更加深刻的陷入焦虑。所以我知道这话听起来非常的虚,而且这也不是什么有 action item 的建议。但是保持自己的 flexibility 可能是面对大潮的时候,能为自己做的最好的事情。

王磬: 我分享几个最近也是在网上看到的和身边接触到的关于 ChatGpt 的段子。就一个是 ChatGpt 接下来就会把我们的智力情感的功能部分取代,甚至是全部的取代。我们还剩什么?还剩一副皮囊,不如从今天开始就每天去健身房,起码是 ChatGPT 不能够取代的一副美丽的皮囊。第二个也是我在课上也跟我的一个学生交流,我就说其实像他们现在都还在念本科生、研究生。就像你刚刚提到的这种职场初期,可能还没有进入即将步入职场的这么一群人。其中一个女孩,她之前是特别喜欢写作,我就问她,你现在知道 ChatGPT,它可能会在未来有这样的一些影响,你会怎么样去调整自己现在的时间分配?他现在可能就会希望能把更少的时间放在写作上,因为他发现 ChatGPT 已经可以写出非常漂亮的、非常精准的句子。所以更多的时间放在写作上,会让她觉得浪费时间,浪费精力,不能够对未来去做出一个更好的准备。这些时间要放在哪?她的回答是,她希望能够放在更有创造力的工作上,能去做一些更有创意性的事儿。我觉得这里就陷入一个其实有点吊诡的状态。首先,**在过去,在我们看来,写作本身就是一个具有创造性的事儿。其次,如果写作都不算是一个具有创造性的事儿了,什么样的事儿算?在 ChatGPT 的时代,它仍然是具有创造性的,它仍然是足够创新,足够创意,以至于它不可能会被 ChatGPT 取代的,因为这种创意性的工作不会被人工智能取代。**我觉得这也是一个科技界的这种老生常谈,我不知道是不是就讲出来安慰文科生的。但是我这几天在比如网上刷一些评论的时候,也看到 ChatGPT,它其实现在也可以部分地去进行创造了。我也想把这个问题丢给你。你觉得这种我们可以把人的精力、智慧更多投入在创造性的工作,而不是重复性的工作上。这个说法在 ChatGPT 时代是站得住脚的吗?是可以让我们免受冲击或者减少我们所受的冲击的一个行动吗?

木遥: 你刚刚讲了两个事情,我觉得都挺值得回应的。我现在先回答第二个问题。

木遥: 我先回答第二个问题,然后回头来讨论皮囊的问题。第二个问题是创意的问题。我的简单的回答是可能不是那么简单。今年 2 月份有一个论文是讨论怎么用 GPT 帮助科研工作者做 research,他就找了一个领域,让 GPT 来完成四个任务。一个任务是产生新的 idea,一个任务是综述已经有的工作,一个任务是准备数据,一个任务是实现和测试。你听起来这 4 个任务,第一个任务就是你刚刚说的更接近于人所说的创造情况,对不对?产生新的 idea。后面那些听起来好像更琐碎一点,更技术性一点。他把这四个任务都交给 GPT 来做,把 GPT 的工作交给专家来打分。最后发现什么?发现 GPT 得分最高的是第一项,不是 2、3、4。为什么?因为产生新想法这个事情反而落到了 GPT 的强项,它从已有的各种各样的知识的海洋中,我们不管这个比喻什么意思,或者一堆语词的海洋之中找到可能可以连接,但人们还没有想出连接的东西出来,把它作为一个新的 idea,propose 出来,这个东西反而让它来做更有效。真正的你让他老老实实去准备数据测试,可能反而……至少今天的 AI 水平就那么回事。这个故事告诉我们两件事情。第一就是**所谓的创造性活动,其实没有那么不容易被 AI 所攻克,AI 是可以做这种事情的。**第二,存不存在 AI 暂时也做不到的?真正的创意一定存在。我们能找到某些极端的例子,在艺术上,在科学上,在文化观点上,完全原创性的,它不存在在既有的世界上的东西完全从无到有的创新出来。我举个很简单的例子,假如今天没有比特币,ChatGPT 能不能设想出比特币这样的东西?我其实有点怀疑,因为它缺少一种完全新的想法。这东西不是从既有想法中间联系出来的,它是一个新的东西。当然你也可以。它其实是把某一个 idea 跟某一个 idea 放在一起,它总不可能真的从天上掉下来。但是它不能够从现有的所谓的知识元素的海洋之中挖掘出来。这样的例子是有的,但是这样的例子本来对普通人来说也没什么实际用处,你一个普通人有多大的几率在一生中发明一个像比特币这样的东西,不太可能,对不对,所以它作为一种安慰是没有什么意义的。你必须要真正非常非常原创才够用。那 1000 万个人中只有一个人,这对大部分来说不构成任何实际的操作性。这是我对你第二个问题的回应。这是一个不太振奋人心的回应,但是结论就是原创性这个东西,至少平庸的原创性或者日常普通的老百姓可以达到的。原创性其实没有那么神秘,AI 是可以达到的。第一个关于皮囊那个问题,我觉得它不是一个段子,它是一个真实的问题,就是皮囊听起来有点过于物质化,对吧?你就可以靠整容来获得一个好的皮囊。但是我刚才说了,在未来的职场上,**或者是未来社会结构上,AI 可能最无法取代人类的,是关于人的 interaction 的部分。你怎么样说服一个人,你怎么样领导一个人,你怎么样团结一帮人,你怎么样去塑造共识,怎么样去弥合分歧。**而这些东西确确实实在很大程度上是依赖于我们人作为生物上的人的一些特性的。如果你在过去的时代,你说职场上长得好看的人会被优先提拔,虽然大家知道这可能是真的,但是大家认为他至少不应当如此。你应当提拔的是谁?应当提拔能干的,聪明的,而不是长得好看的。但是如果你的能干和聪明被 AI 取代了,你剩下的可能也确实就是好看了。

木遥: 但是我这里来把他说的政治正确一点。我们这里说的好看,不是弄一张网红脸那种好看,而是更抽象的 leadership,或者是影响人的能力。

木遥: 对,克里斯玛,这个词比较政治正确一点。不是单纯搞一个韩式半永久就可以搞定的,它需要一些更抽象的东西。但确实这个东西对 AI 来说是最困难的。因为说老实话,当你说我们应该提拔最聪明的,其实难道聪明不是也是一种类型上的生殖彩票吗?为什么?聪明作为天生的天赋作为评价人的标准就好像很合理,而皮囊也是一个 DNA 矩阵,就不合理?你仔细想想看,这件事其实也没什么必然性,它也是一个工业革命建构出来的观念。所以这个观念既然可以被建构出来,它也是可以被打破的。你没有理由认为 100 年后的人们仍然把聪明排在皮囊之前,因为它其实也没有什么特别本质的原因。所以,克里斯玛这个词会好一点,这个东西可能是如果你今天想自我改造,从自己身上做起,可能着手都比较有效的途径。锻炼自己的影响力,锻炼自己的沟通能力,锻炼自己 build 一个 team 的能力,锻炼自己,用美国人喜欢说的那套 MBA 的词 make things happen 的能力。这个东西可能仍然是真实的。所以我觉得第一个反而不是一个段子,它是一个确实存在的问题。

王磬: 现在听完了今天这 2 个小时的科普也好,解释也好,就是自己觉得确实我自己会需要更多的消化一下。我觉得不光是它作为这种技术上的基本的结构,也包括它可能会带来的一些这种社会上的影响。如果往深一点去想,它真的是会重塑社会的方方面面。我平时很少讲这个话,因为我觉得这是一个非常空的话。哪件事说白了,任何一个小的这种进步,它都有可能达到这样的一个目标。但是我在今天听了这 2 个小时之后,我确实会有这样的一个感觉。如果我稍微往深去想,它确实是会重塑我们社会的方方面面,从我们的工作,从我们休闲的方式,我们跟人打交道的这种方式,我们的教育,我们对于社会中什么样的角色是更有优先级的或者更本质的。我们作为人之所以为人的这种更存在主义的一些思考,我觉得它确实是一个非常非常值得去实时的关注、保持更新的一件事儿。最后我想问一下木遥老师,你个人有在为这一场变革的到来做一些个人层面的准备吗?

木遥: 我觉得我能够做的最目前来看最重要的事情就是,我得理解它发生了什么事情。即使我自己程序员出身,所以理解起来可能比一般人容易一点,我也仍然觉得要跟上每天新的东西的冲击是一个很困难的事情。真的太快了。这周二 ChatGPT4 发布的那一天,推特上有个段子说 3 月 14 号那天刚好是 π day,所以 Google 和 OpenAI 都推了新的东西出来。网上有段子说,2023 年 3 月 14 号是人工智能发生史上重要的一年,它的意思是,那一天发生的事情就像平常一年发生的事情一样。你想跟上这个速度是很困难的事情。所以我觉得我努力跟上,努力了解它的潜力,努力了解有什么事情可以自己上手去做,这也很困难。我也周围有很多朋友在做类似的事情,我们每天会交流有什么新的工具出来,这些东西可以试着用一下。它的好处是你真的很容易上手。以前你要一个心动技术出来了,你要把手头既有的东西放下去学它是有点心理障碍的。这东西只要你有点技术上的积累,要上手没有很困难。你可能找一个周末,花上 4 个小时,就可以做出很多很多东西出来了。这也不是开玩笑,GPT4 发布的时候,他照了自己纸上的草稿,交给 GPT。几秒钟之后就生成了一个网站出来。大家说 OK,你既然说得这么厉害,我来试试看。然后一夜之间,真的是一夜之间。Twitter 上就出现了用 GPT4 来做一个小游戏,用 GPT4 来做一个 APP,用 GPT4 来做一个互动性的服务。都出来了。这种时候,一方面会让你觉得焦虑,大家动作好快,一方面也会让你觉得有信心,因为你觉得好像也没有很困难,这么多人几个小时都做出来,我应该也可以。所以上手是比较容易的事情。积极地投入进去可能是我今天能做的最容易的事情。当然,你可能会问,我不会写程序,我连上手都不会怎么办?我也不知道。这不是一个很容易回答的问题,但是对我来说,跟上技术浪潮本身既有挑战性,但同时还挺有乐趣的。

王磬: 我问一个也许普通人也能够有一定参与感的问题。比如,如果作为一个不是特别有技术背景的人,想比较快的、比较及时的去跟上现在的一些信息,你有什么推荐的工具或者信源吗?

木遥:最简单的办法就是了解这样一个总规则。第一,这也是老生常谈了,少看简中社交媒体。一方面它有一个现实的信息壁垒的问题,大家都知道的问题,我们就不展开了。第二,反正简中大多数是转述,你还不如直接去看源头,只要你有看英文的社交媒体的能力和技术手段,你就应该直接去看源头,会比较快。第三,多看一线的资浅的但是活跃的工作人员的讨论,少看 big names 的讨论。因为越是功成名就的人,不是说他们的观点一定是错的或者落伍的,但他们不是在一线工作的。所以他们第一还未必有那些名不见经传的一线工作人员的知识来得更新。第二,他们会很容易受到他们既有成见的影响。比方我们大家都知道一个非常著名的人工智能专家,图灵奖获得者 Yann LeCun(燕乐存),他是一个非常重要的专家。但是他在过去几个月里面一直在连篇累牍地写为什么这东西不重要,或者这东西方向是错的。这是不是意味着他已经彻底被时代抛弃了?那也不一定,但是他确实有他的成见在,他觉得这个方向价值不如大家想象那么大。但是他最近好像渐渐也开始承认这个比他想象的要更有价值了。而这种错误,一线的研究人员是不容易犯的,而一线人员很多人是非常活跃的用社交媒体的。所以最简单的办法就是你去推上关注那些今天正在 Berkeley,今天正在 MIT,或者今天正在 OpenAI,今天正在 deep mind 做这个东西的人。他们很多人是保持非常活跃的社交媒体的曝光的。去关注他们,去看他们的讨论是最容易跟上浪潮的方法,而且他们会彼此争吵。你通过他们之间的争论,就能够更容易获得很多 insight。我觉得其实我们都在面对一个非常大的未知,而这个未知很可能会超越我们之前的未知。我们之前的未知会带来一种想象,而这个未知会带来一种恐慌。我承认这一点,而且我也非常理解这一点。但是我自己从我自己的社交媒体上的活动所后面收到的反馈,最大的感受是很多人仍然在用一种看热闹的方式来理解这件事情。他们可能会借机抒发一些焦虑,甚至借机抒发一些不满。比方,很多人会借机讨论为什么我们中文的语料不如英文的语料好,因为 blah blah。这些当然都是非常真实的情绪,但是有的时候会让你觉得很多人是在用一种情绪化的方式在看待这件事情。我们当然都知道今天的互联网本来就是这样,每件事情都显得像是一个 drama 一样,大家会用一种看热闹的方式来理解我们周围生活中的每个变革。但这件事情,我觉得它比一般意义上的表面的 drama 要更深入一点。所以它值得你去抛弃成见与抛弃膝跳反射式的情绪化反应,而去更仔细地理解一些事情,包括理解一些平常可能不会问自己的问题,比方说什么对你的人生来说是最重要的。**如果今天你对人生的理解被证明是要被推翻了,或者至少是要被潮水冲破了,你将以什么样的方式来重塑你对人生的观念?**或者再问的极端一点,这种问题一般人不会每天问自己,如果你今天可以选择你人生的一个 purpose,这个 purpose 会是什么才最让你觉得,即使你的工作被 AI 取代了,它也仍然能让你觉得你在这世界上安身立命是有意义的。

阅读关于 AI狂飙的时代,人还有价值吗? 的文章
Mike Grindle Published@

My One Big Text File

I do all my writing in a text file. Not any text file or “text files.” I mean one single .txt file.

All my notes, blog posts, ideas, essays - anything not written in pen or pencil - live in or begin life in this document and its copies. Everything I post online is just a copy-paste.

Sounds chaotic, right? Maybe it is, a little. But not as much as you might think. Personally, I think it’s removed the distractions and fuss of previous workflows I’ve tried.

But to be clear, what I’m about to share is not some productivity hack. It won’t automate your workflow, “link your thinking,” or make writing easy. You could think of it as a lazy man’s PKM. Though it’s more for knowledge dumping than “knowledge management.”

For the record, I think the most “powerful” note-taking and writing system is the one that you find enjoyable to use, allows you to retrieve old ideas, and inspires you to write and think every day. Anything more is superfluous and might actually get in the way.

To this end, a notebook with an index (which I also use) is perfectly viable. As is a folder on your desktop or the note software on your phone.

And so is One Big Text File (OBTF).

What is OBTF?

Using OBTF is not a new idea. It was relatively popular among niche blogosphere circles in the mid-2000s. As far as I can tell from the surviving posts, the concept can be traced back to some observations by tech journalist Danny O’Brien regarding how technologists work.

In any case, the premise behind OBTF is simple. It is the idea of keeping everything - or nearly everything - in one .txt (or .md) file. You might use it to store to-do lists, URLs, meeting notes, a reading log, a calendar, blog entries, essays, or pretty much anything else. However, I wouldn’t suggest using it to store sensitive information like passwords, your darkest secrets or bank details.

Now, you might ask why anyone would remove all the categorization benefits of having separate files and folders. And wouldn’t the result be an unwieldy mess? Well, in my experience, finding things in OBTF is blazingly fast.

To be clear, I don’t scroll through my OBTF looking for things. That really would be hell. I don’t even touch a keypad or a mouse. Instead, I use tags and search. The latter of which can be done using hotkeys found on pretty much any modern text editor.

The base of my daily workflow is reading, thinking, and dumping thoughts that I think are worth remembering or writing (because a note is not always something you need to remember, but often something you need to write to think about) into my file. When there’s something I want to talk about more extensively, I look over my previous notes on the subject and start writing right there in said file.

Once I’ve written and am relatively happy with a long-form piece of writing, I’ll copy it over into a new .md file, run a few grammar-checking scripts (largely pinched from here), convert the .md file into an HTML file using a program called pandoc and upload it to my site (or copy-paste it to wherever I need).

The above may sound like a lot of work, but it mostly happens from my OS’s terminal with a handful of commands. I’m sure a similar workflow could be achieved just as easily using GUI tools.

Again, if the system sounds imperfect, that’s because it is. The appeal is not perfect “knowledge management.” It’s about removing any friction from my workflow.

OBTF lets me throw in knowledge, forget about it, and maybe retrieve it later. It’s kind of like a notebook in that sense. And as far as I’m aware, no one has yet proven there to be a better system than a notebook. So, why not replicate that?

Why would I do this?

What are the benefits of working like this? For me, a few points come to mind:

  • Zero distractions (no fiddling with formatting, fonts, plug-ins, or shiny new productivity tools - markdown formatting handles everything)
  • Miniscule storage and processing. Even a massive .txt file will run nicely on relatively ancient hardware and lightweight operating systems
  • Easy to sync data between computers
  • Can “dump” notes without worrying about where they “fit” in a system
  • Works with any text editor with search functionality (so, all of them), meaning there’s no fear of client lock-in, software enshittification, or losing access to your data. .txt will always be platform, system, and application-independent
  • Everything can be found in one place with relative ease. That means no logging into the cloud or switching between software to find stuff
  • Basically, zero task-switching
  • It works well with a mouse/keypad-free workflow
  • As the text file grows, you can look back at your progress (all those ticked to-do lists) and the progression of your thinking.

Of course, there are potential drawbacks to OBTF as well. If you don’t use tags, things will get lost (I’d argue some things are meant to be lost, but I digress). Also, if you’re not used to working with .txt files or text editors, the lack of inline formatting could be a little disorientating at first.

Nonetheless, I feel like OBTF manages to achieve a lot of the things PKM software promises with none of the fuss, set-up, or anxiety about using the “right” methodology (I probably couldn’t sell you a course on the “right way” to use a One Big Text File. Don’t worry, I don’t want to either). In any case, it works for me.

Final thoughts

I have an inkling that very few people who read this will attempt to implement their own OBTF. This is okay. Despite my personal love for the idea, I don’t want your big takeaway to be that using a big text file is the future. It isn’t.

What I will say is that whatever works, works. And it doesn’t need to be fancy.

Of course, you can keep your notes, ideas, and writing in a cutting-edge PKM program if that works for you. You can also use a notebook, index cards, a big f’n text file, a blog, or just keep a bunch of files in a folder. The truth is that the medium and the tools don’t matter. What matters is that you get that stuff in your head down. Tomorrow’s revelation might just be the fleeting thought you had today.

Further reading


阅读关于 My One Big Text File 的文章