All Bookmarks

三联生活周刊 Saved@

苹果的颜色_三联生活周刊

> > 正文

2011-04-20 10:46 作者:鲁伊来源:三联生活周刊 2011年第17期

我们为什么会对苹果的颜色产生兴趣?是什么成就了今日的苹果?库萨克给出的答案是两个英文单词:“Jobs”(乔布斯)和“Cool”(酷)。这个答案引向苹果的另一重颜色:白色。

苹果是什么颜色的?

这只苹果,当然不是被亚当夏娃偷吃了的那只伊甸园中的禁果,也不是砸在牛顿头上帮助他发现万有引力的莫须有之果。一个名词的所指常常被时代打上深刻的烙印,甚至改变它原有的内涵。在过去的10年之中,当我们提到苹果的时候,绝大多数时候指的是“那个苹果”——为史蒂夫·乔布斯所创造的苹果公司及其产品。

我们为什么会对苹果的颜色产生兴趣?

回答这个问题之前,不妨先来听一个“紫牛”的故事。这个故事的讲述者,是赛斯·高汀(SethGodin),一个硅谷的实业家和市场营销专家。

故事是这样的:几年前,高汀与家人驱车穿越法国。旅程开始之时,他们都陶醉于路边以前只有在童话书中才会看到的绵延数十公里的奶牛,但20分钟之后,车上的人就开始对这些动物熟视无睹了,甚至,更糟糕的,他们发现,那些曾经如此美丽的奶牛已经变得令人生厌了。

“它们也许是世界上最漂亮、最吸引人的奶牛,它们也许有着超越同类的温驯的性情,以及与众不同的美丽毛皮,在阳光下的牧场上,每一头牛看起来都是如此的美丽动人。但那又如何?所有的优点都无法改变它们的长相一成不变的无趣事实。”就在这时,塞斯想到——要是此时路边出现了一头紫色的奶牛,那会怎样?

这一刻的灵光一现,催生了21世纪头10年美国出版业最畅销的一本市场营销著作——《紫牛:从默默无闻到与众不同》(Purplecow:TransformYourBusinessbyBeingRemarkable)。在这本书中,高汀断言,我们已经进入了一个消费者几乎已经拥有了所必需的一切、很难有东西能激起其消费欲望的后消费时代,传统的面向大众的产品定位和老的营销法则即将衰亡,在这个需求饱和的时代,一种产品想要卖得出去——遑论获取成功——必须是值得注意的、例外的、全新的、有趣的,换言之,成为一群平庸无奇的黑白花奶牛中的那头出类拔萃的紫牛。

什么是黑白花奶牛式的产品?什么又是紫牛式的产品?高汀给出了一个简单的特征定义:大众化无特色VS独一无二;向所有人发动广告攻势VS集中在产品成长期发动广告攻势;害怕失败VS害怕平淡无奇;很长的生命周期VS很短的生命周期;很少发生变化VS剧烈的变化。他特地指出,从某种意义上讲,紫牛并不比其他的牛更好,它不会生产出更多的牛奶,也不会需要更少的饲料,也没有先进到拥有多种高科技功能。它的紫色不是创新,而是一个新事物,即便它的功能仍然同市场上所有的竞争对手一样,单凭紫色这一点,就足以令它超凡脱俗。

高汀的这本书出版于2003年,那时,距离苹果推出iPod只有不到3年时间,令iPod得以执数字音乐界牛耳的iTunesStore服务甚至并未问世,由iPod、iPhone和iPad所掀起的苹果热潮还远远未能像今天这般,横扫在最近几年中迅速变得格外扁平的世界。正因如此,在高汀的“紫牛”群中,苹果公司只占到不算大的一个位置。

然而,8年之后的3月2日,当前一天还在互联网上死讯纷传的史蒂夫·乔布斯出乎所有人的预料,“如一只螳螂般瘦削……也像一只螳螂般昂首阔步”地出现在旧金山芳草地艺术中心iPad2的发布会现场时,无需抛出那些惊人的数字——推出时间还不到一年的iBook网上书店,已经有超过1亿本书被下载;世界最大的图书出版商兰登书屋于此日正式宣布进驻,至此,全球六大图书出版商皆已成为苹果商店的合作伙伴;在全世界范围内,与信用卡绑定的苹果账户已经超过两亿个;通过在AppStore上销售自己开发的应用程序,全球的程序开发者们总计获得了20亿美元的收入;iPhone手机的销售量达到了1亿台;2010年,在推出后的9个月中,苹果卖出了1500万台iPad,销售额高达95亿美元,占有了90%以上的平板电脑市场——只要看一眼每个人越来越苹果化的生活,便已知道,从年轻时代起便以“现实扭曲力场”著称的乔布斯,已经成功地在短短10年间真的扭转了现实,将一家被华尔街诊断为“病入膏肓”、市场份额滑落到历史最低点的公司,变成这个时代最闪亮耀目的一头“紫牛”。

紫牛何来?

关于苹果的颜色,多年以前,乔布斯曾经给出过一个官方定义。1983年10月,麦金托什电脑揭晓软件供应商的发布会上,犹是一副年少轻狂模样的乔布斯说,“苹果是红色的,IBM是蓝色的”。将这一红色定义演绎得最为淋漓尽致的,是那个著名的麦金托什电脑广告——一如奥威尔在《一九八四》中所预言的那个阴沉、冷寂、单调划一的未来世界,身着白色上衣、红色运动短裤的女子像一团生命之火一样跑来,挥动大锤砸碎统治人们思想的铁幕。

如果说蓝色象征的是秩序和理性,红色则是叛逆的颜色。在成长过程中深受1968思潮影响的乔布斯,几乎从苹果公司创立之始,就把自己放在了以IBM为代表的现代社会的合理化的牢笼的对面。

那是上世纪70年代末的美国,一个职员的国度,来自四面八方的人们像潮水一样涌进大城市,涌进高楼大厦里笼子一般的办公间。不过几年时间,大多数的人就都买得起汽车、电话和电视,中产阶级的郊区住宅也不再遥不可及。失业成了不可能的事,每个人面前摆着一条通往更快更好更高的康庄大道,仿佛只要你按照理性的社会法则修理自己,便一定可以拥抱成功与幸福。

《法国1968:终结的开始》一书中的一段文字或许是对这种合理化生活的最佳写照:

“社会是一朵塑胶花。旧的模子,新的颜色。塑胶花永不凋谢,只是遇热融化。今儿个该发薪水了吧,我们每个月定期受贿。把我们的梦想欲望定型上模,所以呢,我,而且只是我,要往上爬。我牢牢地抓紧我的白领工作——深怕别人来抢,我默默地忍受我的蓝领劳动——毫无尊严可言。下班钟一敲,我就遁回我的蚕茧,我的欢快,我的家庭告诉我,我是对的。”

按照马克思·韦伯的观点,在这个合理化的社会中,一家企业若想获得成功,必须满足人们追逐合理化的需求,提供合理化的产品,诸如效率、可计算性、可预测性和可控制性。显然,这绝非乔布斯的苹果。

为了苛求细节上的完美而一再拖延发布时间,公司内部模糊的层级和人事关系,封闭的产品体系,嬉皮士式的企业文化……当我们回头细看苹果公司的编年史,苹果电脑时代的种种出格之处,几乎是一本MBA反面案例教材,而这些不按牌理出牌的叛逆属性,至今仍深烙在苹果产品的血液里。

然而,是它们令苹果成为紫牛吗?换言之,按照今天被许多苹果“粉丝”所津津乐道的这些苹果法则去打造一家新的公司,是否也能收获类似的辉煌?

事实上,在《苹果模式》(TheAppleWay)一书中,作者杰弗里·库萨克(JeffreyCruikshank)开宗明义便指出,苹果的商业模式是一种不可模仿的模式,刻意重走苹果之路的人,99%将遭到乔布斯在1985年所遭受的命运——被象征着商业理性原则的董事会驱逐出局,而能够像乔布斯那样东山再起的,几乎万中无一。看一眼高汀本人的经历,便是极好的例证。尽管他似乎深谙创造紫牛的种种秘笈,但迄今为止,他的最高成就,不过是于1998年将自己创建的互联网市场营销软件Yoyodyne以3000万美元的价格卖给了雅虎。

是什么成就了今日的苹果?库萨克给出的答案是两个英文单词:“Jobs”(乔布斯)和“Cool”(酷)。这个答案引向苹果的另一重颜色:白色。

几乎每一款苹果产品,都会在包装盒里附送两张白色的苹果贴纸。这白色的苹果,是苹果产品追求设计、追求唯美的象征符号,更是自青年时代便热衷于禅修的乔布斯“无或一切可能”东方哲学的具体体现。

从苹果二代开始,即或人们对苹果产品有着这样或那样的诟病,但它的轻灵、简约和优雅几乎是无可置疑的。从形而上的角度观察,这形成了与以黑铁为沉重主色调的庞然大物的现代机器的巨大反差。而它所张扬的享乐主义的小众趣味,亦是对贯穿20世纪高效率主题的一种反讽。

然而,尽管这一白色主题一直存在于苹果的基因之中,但却直到最近10年,它才得到大众市场的肯定,进而成为一种席卷全球的有别于可口可乐、麦当劳和IBM电脑的美国文化新符号。

一种解释,可以借用英国思想家汤姆·奈仁(TomNairn)的叙述:像乔布斯这样的“伟人”,他们支配现世的权力来自某种浓稠的文化想象,一种浪漫主义的残迹,一种夸大的非理性个人主义。在一个因为审美疲劳而渴求变革的年代,这样的另类反而要比新资本主义下处处可见的庸才俗货,站在一个更有力的杠杆位置,去操纵社会的喜好。

另一种解释,听上去没有那么曼妙,但也许更接近事实:苹果的非典型性成功,并不一定代表某种新的方向,它只是人们对20世纪效率与理性主题的厌倦在21世纪的一场爆发。同青年时代的乔布斯一样,我们每个人的心中都曾经藏着一个改变世界的理想,但在绝大多数情况下,因为这样或那样的原因,我们或迟或早地选择了妥协,接受了被世界改变的命运。我们按这个社会的理性法则修剪自己的枝丫,因为这样才能让成功——或者是不失败——的可能性最大化。但是,在我们的心里,依然藏着一个乔布斯式的自我,追求完美,不随波逐流,但却创造了潮流。

在这种意义上,乔布斯,这个符号式的人物,成为苹果特质的一个背书。不可否认的是,随着苹果变得越来越大,它的颜色也在慢慢地发生着微妙的变化——事实上,它越是成功,就离人们的想象越远。将流水线的高效率发挥到极致的组装工厂,保证了iPad令竞争对手无可企及的低成本。每个人都要玩《愤怒的小鸟》和《植物大战僵尸》,否则便似乎被时代的潮流所抛弃。它越来越多地散发着商业社会的金属光泽,变成一只银色的苹果。生活在消费社会中的我们以为可以凭借苹果式的产品摆脱从一个理性系统转向另一个理性系统的惯性路线,但真相是,在这个全球现代化的时代,王小波的预言从未像今天这般真实:“白银时代的人蒙神恩宠,终身不会衰老,也不会为生计所困。他们没有痛苦,没有忧虑,一直到死,相貌和心灵都像儿童。死掉以后,他们的幽灵还会在尘世上游荡。”

但是,只要乔布斯在那里,因为他的强大到无可比拟的“现实扭曲力场”,我们仿佛就可以说服自己,这只苹果,是与众不同的,热爱这只苹果的我们,是与众不同的。

关于乔布斯,最新的消息是,他终于要出自传了。

西蒙舒斯特出版公司上周宣布,由曾任CNN首席执行官和《时代》周刊执行主编的瓦尔特·伊萨克森(WalterIsaacson)执笔撰写的《iSteve:TheBookofJobs》,将于2012年初问世。在此之前,尽管市面上流传着十余本关于乔布斯的传记,但它们都未能得到乔布斯的正式授权。甚至于其中一本的出版商还为此在2005年遭到苹果在线商店的杯葛。

这一次的情形显然不同。据西蒙舒斯特的发言人称,从2009年开始,乔布斯本人和他的家人、朋友、同事就向伊萨克森一一敞开了大门。这让人无法不联想起乔布斯曾经多次说过的一句话:“现在还不到回忆的时候……一个人死之前不应出版自传,以免活着后悔。”

那么,现在,是时候了吗?■

版权声明:凡注明“三联生活周刊”、“爱乐”或“原创”来源之作品(文字、图片、音频、视频),未经三联生活周刊或爱乐杂志授权,任何媒体和个人不得转载 、链接、转贴或以其它方式使用;已经本刊、本网书面授权的,在使用时必须注明“来源:三联生活周刊”或“来源:爱乐”。违反上述声明的,本刊、本网将追究其相关法律责任。

阅读关于 苹果的颜色_三联生活周刊 的文章
Anna-Sofia Lesiv Saved@

How We Built the Internet

DALL-E/Every illustration.

_The internet is like water—we take its existence for granted, but its birth was by no means pre-ordained. A constellation of inventors, organizations, and efforts all contributed to its creation. In one of her signature deep dives, Contrary writer Anna-Sofia Lesiv excavates the history of digital communication infrastructure, from the invention of the telephone to the widespread installation of fiber-optic cable and big tech’s subsidization of undersea cables. Read this chronicle to understand how the internet’s decentralized origins led to its current state as fractured spaces governed by private entities—and its implications for its future accessibility. —__Kate Lee_


The internet is a universe of its own. For one, it codifies and processes the record of our society’s activities in a shared language, a language that can be transmitted across electric signals and electromagnetic waves at light speeds.

The infrastructure that makes this scale possible is similarly astounding—a massive, global web of physical hardware, consisting of more than 5 billion kilometers of fiber-optic cable, more than 574 active and planned submarine cables that span a over 1 million kilometers in length, and a constellation of more than 5,400 satellites offering connectivity from low earth orbit (LEO).

According to recent estimates, 328 million terabytes of data are created each day*. _There are billions of smartphone devices sold every year*, _and although it’s difficult to accurately count the total number of individually connected devices, some estimates put this number between 20 and 50 billion.

“The Internet is no longer tracking the population of humans and the level of human use. The growth of the Internet is no longer bounded by human population growth, nor the number of hours in the day when humans are awake,” writes Geoff Huston, chief scientist at the nonprofit Asia Pacific Network Information Center.

But without a designated steward, the internet faces challenges for its continued maintenance—and for the accessibility it provides. These are incredibly important questions. But in order to grasp them, it’s important to understand the internet in its entirety, from its development to where we are today.

Unlock the power of algorithmic trading with Composer. Our platform is designed for both novices and seasoned traders, offering tools to create automatic trading strategies without any coding knowledge.

With more than $1 billion in trading volume already, Composer is the platform of choice. Create your own trading strategies using AI or choose from over 1,000 community-shared strategies. Test their performance and invest with a single click.

The theory of information

In the analog era, every type of data had a designated medium. Text was transmitted via paper. Images were transmitted via canvas or photographs. Speech was communicated via sound waves.

A major breakthrough occurred when Alexander Graham Bell invented the telephone in 1876. Sound waves that were created on one end of the phone line were converted into electrical frequencies, which were then carried through a wire. At the other end, those same frequencies were reproduced as sound once again. Speech could now transcend physical proximity.

Unfortunately, while this system extended the range of conversations, it still suffered from the same drawbacks as conversations held in direct physical proximity. Just as background noise makes it harder to hear someone speak, electrical interference in the transfer line would introduce noise and scramble the message coming across the wire. Once noise was introduced, there was no real way to remove it and restore the original message. Even repeaters, which amplified signals, had the adverse effect of amplifying the noise from the interference. Over enough distance, the original message could become incomprehensible.

Still, the phone companies tried to make it work. The first transcontinental line was established in 1914, connecting customers between San Francisco and New York. It comprised 3,400 miles of wire hung from 130,000 poles.

In those days, the biggest telephone provider was the American Telephone and Telegraph Company (AT&T), which had absorbed the Bell Telephone Company in 1899. As long-distance communications exploded across the United States, Bell Labs, an internal research department of electrical engineers and mathematicians, started to think about expanding the network’s capacity. One of these engineers was Claude Shannon.

In 1941, Shannon arrived at Bell Labs from MIT, where the ideas behind the computer revolution were in their infancy. He studied under Norbert Wiener, the father of cybernetics, and worked on Vannevar Bush’s differential analyzer, a type of mechanical computer that could resolve differential equations by using arbitrarily designed circuits to produce specific calculations.

Source: __Computer History Museum_._

It was Shannon’s experience with the differential analyzer that inspired the idea for his master’s thesis. In 1937, he submitted “A Symbolic Analysis of Relay and Switching Circuits.” It was a breakthrough paper that pointed out that boolean algebra could be represented physically in electrical circuits. The beautiful thing about these boolean operators is that they require only two inputs—on and off.

It was an elegant way of standardizing the design of computer logic. And, if the computer’s operations could be standardized, perhaps the inputs the computer operated on could be standardized too.

When Shannon began working at Bell Labs during the Second World War, in part to study cryptographic communications as part of the American war effort, there was no clear definition of information. “Information” was a synonym for meaning or significance, its essence was largely ephemeral. As Shannon studied the structures of messages and language systems, he realized that there was a mathematical structure that underlied _information. _This meant that information could, in fact, be quantified. But to do so, information would need a unit of measurement.

Shannon coined the term “bit” to represent the smallest singular unit of information. This framework of quantification translated easily to the electronic signals in a digital computer, which could only be in one of two states—on or off. Shannon published these insights in his 1948 paper, “A Mathematical Theory of Communication,” just one year after the invention of the transistor by his colleagues at Bell Labs.

The paper didn’t simply discuss information encoding. It also created a mathematical framework to categorize the entire communication process in this way. For instance, Shannon noted that all information traveling from a sender to a recipient must pass through a channel, whether that channel be a wire or the atmosphere.

Shannon’s transformative insight was that every channel has a threshold—a maximum amount of information that can be delivered reliably to a sender. As long as the quantity of information carried through the channel fell below the threshold, it could be delivered to the sender intact, even if noise had scrambled some of the message during transmission. He used mathematics to prove that any message could be error-corrected into its original state if it traveled through a large-enough channel.

The enormity of this revolution is difficult to communicate today, mainly because we’re swimming in its consequences. Shannon’s theory implied that text, images, films, and even genetic material could be translated into his informational language of bits. It laid out the rules by which machines could talk to one another—about anything.

At the time that Shannon developed his theory, computers could not yet _communicate _with one another. If you wanted to transfer information from one computer to the other, you would have to physically walk over to the other computer and manually input the data yourself. However, talking machines were now an emerging possibility. And Shannon had just written the handbook for how to start building it.

Switching to packets

The telephone system was the only interconnected network by the mid-20th century. AT&T was the largest telephone network at the time. It had a monstrous continental web with hanging copper wires criss-crossing across the continent.

The telephone network worked primarily through circuit switching. Every pair of callers would get a dedicated “line” for the duration of their conversation. When it ended, an operator would reassign that line to connect other pairs of callers, and so on.

At the time, it was possible to get computers “on the network” by converting their digital signals into analog signals, and sending the analog signals through the telephone lines. But reserving an entire line for a single computer-to-computer interaction was seen as hugely wasteful.

Leonard Kleinrock, a student of Shannon’s at MIT, began to explore the design for a digital communications network—one that could transmit digital bits instead of analog sound waves.

His solution, which he wrote up as his graduate dissertation, was a packet-switching system that involved breaking up digital messages into a series of smaller pieces known as packets. Packet switching shared resources among connected computers. Rather than having a single computer’s long communiqué take up an entire line, that line could instead be shared among several users’ packets. This design allowed more messages to get to their destinations more efficiently.

For this scheme to work, there would need to be a network mechanism responsible for granting access to different packets very quickly. To prevent bottlenecks, this mechanism would need to know how to calculate the most efficient, opportunistic path to take a packet to its destination. And this mechanism couldn’t be a central point in the system that could get stuck with traffic—it would need to be a distributed mechanism that worked at each node in the network.

Kleinrock approached AT&T and asked if the company would be interested in implementing such a system. AT&T rejected his proposal—most demand was still in analog communications. Instead, they told him to use the regular phone lines to send his digital communications—but that made no economic sense.

“It takes you 35 seconds to dial up a call. You charge me for a minimum of three minutes, and I want to send a hundredth-of-a-second of data,” Kleinrock said.

It would take the U.S. government to resolve this impasse and command such a network into existence. In the late 1960s, shaken by the Soviet Union’s success in launching Sputnik into orbit, the U.S. Department of Defense began investing heavily in new research and development. It created ARPA, the Advanced Research Projects Agency, which funded various research labs across the country.

Robert Taylor, who was tasked with monitoring the programs’ progress from the Pentagon, had set up three separate Teletype terminals for each of the ARPA-funded programs. At a time when computers cost anywhere from $500,000 to several million dollars, three computers sitting side-by-side seemed like a tremendous waste of money.

“Once you saw that there were these three different terminals to these three distinct places the obvious question that would come to anyone’s mind [was]: why don’t we just have a network such that we have one terminal and we can go anywhere we want?” Taylor asked.

This was the perfect application for packet switching. Taylor, familiar with Kleinrock’s work, commissioned an electronics company to build the types of packet switchers Kleinrock had envisioned. These packet switchers were known as interface message processors (IMPs). The first two IMPs were connected to mainframes at UCLA and Stanford Research Institute (SRI), using the telephone service between them as the communications backbone. On October 29, 1969, the first message between UCLA and SRI was sent. ARPANET was born.

ARPANET grew rapidly. By 1973, there were 40 computers connected to IMPs across the country. As the network grew faster, it became clear that a more robust packet-switching protocol would need to be developed. ARPANET’s protocol had a few properties that prevented it from scaling easily. It struggled to deal with packets arriving out of order, didn’t have a great way to prioritize them, and lacked an optimized system to deal with computer addresses.

Source: __Computer History Museum_._

By 1974, researchers Vinton Cerf and Robert Khan came out with “A Protocol for Packet Network Intercommunication.” They outlined the ideas that would eventually become Transmission Control Protocol (TCP) and Internet Protocol (IP)—the two fundamental standards of the internet today. The core idea that enabled both was a “datagram,” which wrapped the packets in a little envelope. That envelope would act as a little header at the front of each packet that would include the address it was going to, along with other helpful bits of info.

In Cerf and Khan’s conception, the TCP would run on the end-nodes of the network—meaning that it wouldn’t run on the routers and obstruct traffic, but instead on users’ computers. The TCP would do everything from breaking messages into packets, placing the packets into datagrams, ordering the packets correctly at the receiver’s end, and performing error correction.

Packets would then be routed via IP through the network, which ran on all the packet-directing routers. IP only looked at the destination of the packet, while remaining entirely blind to the contents it was transmitting, enabling both speed and privacy.

These protocols were trialed on a number of nodes within the ARPANET, and the standards for TCP and IP were officially published in 1981. What was exceedingly clever about this suite of protocols was its generality. TCP and IP did not care which carrier technology transmitted its packets, whether it be copper wire, fiber-optic cable, or radio. And they imposed no constraints on what the bits could be formatted into—video text, simple messages, or even web pages formatted in a browser.

_Source: __David D. Clark,_ Designing an Internet.

This gave the system a lot of freedom and potential. Every use case could be built and distributed to any machine with an IP address in the network. Even then, it was difficult to foresee just how massive the internet would one day become.

David Clark, one of the architects of the original internet, wrote in 1978 that “we should … prepare for the day when there are more than 256 networks in the Internet.” He now looks upon that comment with some humor. Many assumptions about the nature of computer networking have changed since then, primarily the explosion in the number of personal computers. Today, billions of individual devices are connected across hundreds of thousands of smaller networks. Remarkably, they all still do so using IP.

Although ARPANET was decommissioned in 1986, the rest of the connected computers kept going. Residences with personal computers used dial-up to get email access. After 1989, a new virtual knowledge base was invented with the World Wide Web.

With the advent of the web, new infrastructure, consisting of web servers, emerged to ensure the web was always available to users, and programs like web browsers allowed end nodes to view the information and web pages stored in the servers.

Source: __Our World in Data_._

As the number of connected people increased in hockey-stick fashion, carriers finally began realizing that dial-up—converting digital to analog signals—was not going to cut it anymore. They would need to rebuild the physical connectivity layer by making it digital-first.

The single biggest development that would enable this and alter the internet forever was the mass installment of fiber-optic cable throughout the 1990s. Fiber optics use photons traveling through thin glass to increase the speed of information flow. The fastest connection possible with copper wire was about 45 million bits per second (mbps). Fiber optics made that connection more than 2,000 times faster. Today, residences can hook into a fiber-optic connection that can deliver them 100 billion bits per second (gbps).

Fiber was initially laid down by telecom companies offering high-quality cable television service to homes. The same lines would be used to provide internet access to these households. However, these service speeds were so fast that a whole new category of behavior became possible online. Information moved fast enough to make applications like video calling or video streaming a reality.

The connection was so good that video would no longer have to go through the cable company’s digital link to your television. It could be transmitted through those same IP packets and viewed with the same experience on your computer.

YouTube debuted in 2004 and Netflix began streaming in 2007. The data consumption of American households skyrocketed. Streaming a film or a movie requires about 1 to 3 gigabytes of data per hour. In 2013, the median household consumed 20-60 gigabytes of data per month. Today, that number falls somewhere about 587 gigabytes.

And while it may have been the government and small research groups that kickstarted the birth of the internet, its evolution henceforth was dictated by market forces, including service providers that offered cheaper-than-ever communication channels and users that primarily wanted to use those channels for entertainment.

A new kind of internet emerges

If the internet imagined by Cerf and Kahn was a distributed network of routers and endpoints that shared data in a peer-to-peer fashion, the internet of our day is a wildly different beast.

The biggest reason for this is that the internet today is not primarily used for back-and-forth networking and communications—the vast majority of users treat it as a high-speed channel for content delivery.

In 2022, video streaming comprised nearly 58 percent of all Internet traffic. Netflix and YouTube alone accounted for 15 and 11 percent, respectively.

This even shows up in internet service provision statistics. Far more capacity is granted for downlink to end nodes than for uplink—meaning there is more capacity to provide information to end-user nodes than to send data through networks. Typical cable speeds for downlink might reach over 1,000 mbps, but only about 35 mbps are granted for uplink. It’s not really a two-way street anymore.

Even though the downlink speeds enabled by fiber were blazingly fast, the laws of physics still imposed some harsh realities for global internet companies with servers headquartered in the United States. The image below shows the “round-trip time” for various global users to connect to Facebook in 2011.

Source: __Geoff Huston_._

At the time, Facebook users in Asia or Africa had a completely different experience to their counterparts in the U.S. Their connection to a Facebook server had to travel halfway around the world, while users in the U.S. or Canada could enjoy nearly instantaneous service. To combat this, larger companies like Google, Facebook, Netflix, and others began storing their content physically closer to users through CDNs, or “content delivery networks.”

These hubs would store caches of the websites’ data so that global users wouldn’t need to ping Facebook’s main servers—they could merely interact with the CDNs. The largest companies realized that they could go even further. If their client base was global, they had an economic incentive to build a global service infrastructure. Instead of simply owning the CDNs that host your data, why not own the literal fiber cable that connects servers from the United States to the rest of the world?

In the 2020s, the largest internet companies have done just that. Most of the world’s submarine cable capacity is now either partially or entirely owned by a FAANG company—meaning Facebook (Meta), Amazon, Apple, Netflix, or Google (Alphabet). Below is a map of some of the sub-sea cables that Facebook has played a part in financing.

Source: __Telegeography_._

These cable systems are increasingly impressive. Google, which owns a number of sub-sea cables across the Atlantic and Pacific, can deliver hundreds of terabits per second through its infrastructure.

In other words, these applications have become so popular that they have had to leave traditional internet infrastructure and operate their services within their own private networks. These networks not only handle the physical layer, but also create new transfer protocols —totally disconnected from IP or TCP. Data is transferred on their own private protocols, essentially creating digital fiefdoms.

This verticalization around an enclosed network has offered a number of benefits for such companies. If IP poses security risks that are inconvenient for these companies to deal with, they can just stop using IP. If the nature by which TCP delivers data to the end-nodes is not efficient enough for the company’s purposes, they can create their own protocols to do it better.

On the other hand, the fracturing of the internet from a common digital space to a tapestry of private networks raises important questions about its future as a public good.

For instance, as provision becomes more privatized, it is difficult to answer whose shoulders the responsibility of providing access to the internet as a “human right,” as the U.N. describes, will fall on.

And even though the internet has become the de facto record of recent society’s activities, there is no one with the dedicated role of helping maintain and preserve these records. Already, the problem known as link rot is beginning to affect everyone from the Harvard Law Review, where, according to Jonathan Zittrain, three quarters of all links cited no longer function. This occurs even at The New York Times, where roughly half of all articles contain at least one rotted link.

The consolation is that the story of the internet is nowhere near over. It is a dynamic and constantly evolving structure. Just as high-speed fiber optics reshaped how we use the internet, forthcoming technologies may have a similarly transformative effect on the structure of our networks.

SpaceX’s Starlink is already unlocking a completely new way of providing service to millions. Its data packets, which travel to users via radio waves from low earth orbit, may soon be one of the fastest and most economical ways of delivering internet access to a majority of users on Earth. After all, the distance from LEO to the surface of the Earth is just a fraction of the length of subsea cables across the Atlantic and Pacific oceans. Astranis, another satellite internet service provider that parks its small sats in geostationary orbit, may deliver a similarly game-changing service for many. Internet from space may one day become a kind of common global provider. We will need to wait and see what kind of opportunities a sea change like this may unlock.

Still, it is undeniable that what was once a unified network has, over time, fractured into smaller spaces, governed independently of the whole. If the initial problems of networking involved the feasibility of digital communications, present and future considerations will center on the social aspects of a network that is provided by private entities, used by private entities, but relied on by the public.


Anna-Sofia Lesiv is a writer at venture capital firm __Contrary_, where she originally published __this piece_. She graduated from Stanford with a degree in economics and has worked at Bridgewater, Founders Fund, and 8VC.

阅读关于 How We Built the Internet 的文章
不合时宜TheWeirdo Saved@

AI狂飙的时代,人还有价值吗?

图片

最近两个月,受到香港中文大学卓越传媒人驻校计划的邀请,我在香港进行了为期八周的访学,并为新闻学院的学生们开设了一个工作坊,主题是关于“如何提问”。就在我们上课的几周时间里,ChatGPT 以迅雷不及掩耳的速度进入了大众的视野。我在课上与同学们进行了讨论。有人说,在 GPT 的时代,会提问可能比会回答更加重要。有人欣喜,认为 GPT 将大大提高人类工作效率,减少无意义的重复劳动;也有人担忧,认为 GPT 可能会带来大规模失业,甚至动摇社会的基本结构。

王磬: 今天录制之前,我也在微信上刷了一刷。我看到昨天被分享了很多的一篇文章。这个标题我给你念一下,感受一下焦虑的程度。叫“微软深夜放炸弹、GPT4office 全家桶发布,10 亿打工人被革命”。这类型的标题在过去这段时间里面已经可以说是屡见不鲜。一方面,媒体在写作的时候会希望通过这样的一些标题去吸引更多的流量。但另一个方面,我也在读木遥老师的微博时感受到:现在如果仍然评价 ChatGPT,取得的这些进展“什么都不是”,其实也是很有误会的一种解读。我这学期正好在香港中文大学新闻学院做访学,在给这边的学生在开一门课程,也是在我们上课的过程当中,GPT 火了起来。在我们新闻业,大家就会担心。码字这件事儿以前可能还算是一个智力活儿,但是现在 ChatGPT 出现了之后就不一定了。我觉得但凡亲自玩过的人都会惊讶于是它遣词造句的成熟的程度,虽然它仍然有一些问题。我觉得当它以这种一个高度智能化、高度拟人化的形态出现在大众面前的时候,是会让人产生一些焦虑。我是文科生,不懂技术,会提出一些比较基本的问题,希望能够回应到普通大众对于这个议题的一些疑惑。我知道你这几年其实一直都有在关注 AI 的发展,也在社交媒体上有做一些分享。你要不要先分享一下,你最开始接触到 ChatGPT 大概是在什么时候?

木遥: 我可以简单梳理一下 GPT 的发展,我不想把它变成一个像科普一样的严肃讨论,但是我觉得理清一些时间线可能会对大家了解这个事情有帮助。顺便说一下,你刚才描述的那种心理,就是一部分人非常焦虑,另外一部分人可能会有一点不屑一顾,甚至怀疑这个媒体是不是过度炒作了,包括那些震惊式的自媒体是不是在故弄玄虚。我觉得这都是非常真实的反应,我们待会也可以展开讲讲我觉得遗憾的、大家可能视角不够完善的部分在哪里。但是我现在回答你的问题就是时间线的问题。ChatGPT 不是第一代 GPT,很多人可能知道它背后的技术叫做 GPT3.5。GPT 大语言模型本身进入研究者的视线是两三年前,但是第一次比较成熟应该是 GPT3,但是 3 的时候还是更多停留在业内,跟一般的大众没有什么关系。ChatGPT 作为 3.5 的一个推向大众的 demo 版本,一下子引起了普通人的关注。这是在去年年底的时候。我在去年年底的时候发过一条微博,我说我觉得以后历史书上会记载 2022 年最重要的历史事件是 ChatGPT 的发布,而不是俄乌战争。当时很多评价是觉得完全莫名其妙,怎么可能。但我觉得今天可能同意这个说法的人会多一点。前两天大家也知道 OpenAI 推出了 GPT4。这个版本号听起来有点琐碎,有点像我们说 iPhone13、14、15 一样。但其实不是,因为碰巧是在 GPT3 和 3.5 之间,它的能力发生了一个飞跃。这个飞跃使得 GPT3.5 一下子冲破了我们之前认为大语言模型不太可能冲破的一些限制,使得它到达了一个新的高度。但也正是因为突破本身非常新,它发生在过去的一两年内,它没有进入大众视野。大众也不太了解这个飞跃的实质和它的影响。所以很多人可能还在用一种比较过时的眼光来看大语言模型,所以对它会有误解。这些人不光是一般的老百姓,包括一些非常知名的人士。我相信磬肯定知道两周前乔姆斯基在纽约时报上发表了一篇文章,主题就是这个东西没有什么大不了的。但这篇文章发表出来之后,基本上被业内人群嘲,大家觉得真的是廉颇老矣。原因不在于乔姆斯基本人的语言学观念是不是正确,原因在于他对这个新技术明显停留在一个过时的认知上。他中间举了一个例子说,你看 GPT 是不可能回答什么什么什么样问题的,但是事实上你只要打开 GPT 试一下就知道其实是可以的。所以我觉得要理解 ChatGPT 这个事情,需要了解过去时间线,特别是我刚说的飞跃是什么。简单的介绍一下这个事情,为什么大家过去觉得这个事情是有限制的,而今天又发现它的限制被突破了。大语言模型,传统上被认为是一个统计模型。什么是统计模型?很多人可能听过这样的描述,它的工作机理是你给它一些你说过的词,它根据在语料中学到的统计相关性来预测下一个词是什么。机制听起来过于的简单粗暴和无聊,以至于很多人觉得这怎么可能描绘人的大脑的工作方式,我们大脑又不是这么简单的机理——你看了 100 万个文本,你记住哪些词后面有可能跟哪些词。这不是我们思考的方式对不对?也正是因为如此,很多人对这一类统计模型的能力的上限,事实上一直以来是低估的,直到 3.0 为止,它确实表现的就像是一个统计模型,它能够说出一些比较像是人说的话,但是你说它有意识,好像还不至于。从 3.0 到 3.5 之间发生了什么?发生了一个新的飞跃,这个飞跃是因果链条能力的建立。我以前在微博上写过这个事情。什么是因果链条?就是它可以做一些推断性的事了。它不只是我通过前一段词来推断下一个词是什么,而是我能进行一些类似于逻辑上的思考。比方你给他说我把一个香蕉放进一个纸袋子里面,但我又从纸袋里面取出一个苹果,就说明什么事情。如果你只是从字眼上的概率,你是很难想象这段话的下一个字眼最大概率是什么的。但是我们有逻辑,我们可以想说,这是因为纸袋里面本来就得有一个苹果,对不对?这个事情是逻辑上的想法,它不是单纯字词上的相关性导致。它需要你对这个纸袋子是什么东西,为什么香蕉进去,苹果出来有一点特殊性。它反映了什么问题?你需要有一个世界知识在后面。这个东西传统上是大家认为在语言模型的限制之外。但是从 3.5 开始,大语言模型可以回答这类问题了,可以建立这样的因果链条了。这个飞跃很大程度上是出乎人们意料的。事实上,它为什么能够做到,在今天仍然是研究领域的一个热门话题。即使 AI 的研究者也不是百分之百的理解它为什么能够做到了。但是越来越多的实验表明,它真的可以做到。关于这个领域的论文,如果有感兴趣的专业读者可以去搜所谓的思维链条的领域,它是过去两年的一个非常非常热门的领域。因为这个领域的出现,使得从 3.5 开始,语言模型一下子变得成熟起来了。不管它怎么做到的,至少它有了一个好像是世界图景在它脑海之中的时候,它跟你聊天的就会显得非常非常的真实,就不像是只是话赶话在说一些似是而非的东西。正是因为这个飞跃,使得 3.5 一下子变得可以面向大众了。所以从去年底开始,OpenAI 推出一个 demo 推到大家面前,引爆了整个媒体和一般老百姓的视野。之后,今年 3 月份顺势推出了比较成熟的 GPT4。GPT4 具体会引爆什么样的?接下来的连锁反应我们还要再看。但是这是正在发生的故事。

王磬: 你刚刚提到的真正具有突破性进展的是关于因果链条的建立。为什么建立因果链条那么重要?之前技术上不能够达到的难点主要是什么?

木遥: 这有点技术性,但是我可以试着回答一下这个问题。如果我的回答有点过于枯燥,你可以随时打断。有一本很著名的书,叫做《思考快与慢》,它讲的是人的思考的两种模式,一种模式叫做快模式。什么是快模式?就是你看到一个东西,你本能地做出反应,这个本能是来自于人的动物性,所以这部分是人和动物共有的。你在眼前闪现过一个红色,你马上感知到危险。这个东西是不经过思考的。就是千百年来的生物本能,让你感觉到危险。你看到一个好看的异性或者同性,whatever,你会觉得 ta 对我有吸引力。这个也是,它不经过思考,它直接就触发你的荷尔蒙。这东西叫快思考。慢思考是你必须要一步一步想问题。就像我们做高考题一样,你不可能看到题目马上脑海中就闪现出答案来,除非那个题你见过。你必须要一步步想题面题干内容说明了什么,它又说明什么,所以推出答案应该选 A。这个过程是快不了的,它必须有一大堆中间步骤。这个东西叫慢思考。慢思考一般认为是人类有的,动物是没有的,或者至少极少数的高等动物,海豚这样的可能会有,但大部分动物是没有的。传统意义上的神经网络模仿的是人的快思考,哪怕像 AlphaGO 这样会下棋的非常聪明的神经网络,它也是快思考。为什么?它就是一个单纯的网络。一头有输入,一头有输出。我们通过训练使得它知道什么样的输入,应该有什么样的输出。把它放在现实生活中,给它一个输入,它给你一个输出,在这个过程中是没有步骤的。这也是为什么神经网络长期被人诟病,说它是一个黑盒子,因为它没有任何中间的过程,就是一头输入,一头输出。神经网络可能非常深,它中间的模仿函数的网络的结构可能是好多步,但是只是它思考的函数非常复杂,但它仍然没有步骤。它只是一个非常非常复杂的函数,仍然一步到位的从输入到算出来。而思维链条(COT)是完全不同的方式。**它不是从输入一步到输出,它在模仿人类思考的东西。我给它一个输入,它先想第一步中间过程,用第一步中间过程想一个第二步中间过程,第二步让过程想第三步中间过程,推出一个结果。一旦你能够建立起这种结构来,你就能够做到快思考不能够做到的事情。**因为我们很多人类的思考过程是这样的,你要把一堆信息综合在一起,推出一堆中间结果,最终得到一个我们要的结论。这个东西不要说低等动物,就是比较高级的,哪怕像猫和狗这样的动物,它其实都未必能做到,对吧?猫能够做到一步步想问题,其实有点悬,对吧?但是今天的 AI,至少 2021 年以后的 AI 开始逐渐能够做到这一点了。这就是我刚才为什么我说它是一个非常本质的飞跃。

王磬: 我觉得刚才你那个例子还是很有帮助的。我只能说我现在比刚才 5 分钟之前稍微了解的更多了一点。但是我仍然感觉到有很多疑惑的地方,比如像 AI 有多聪明这个事,其实也是过去这几年或者十几年大家一直在聊的一个事,包括像去年也比较火的那种 AI 绘画,你输一堆东西,AI 它能给你画出那么漂亮,甚至是独一无二的一些作品。所以我觉得是不是对业界人士来说,ChatGPT 它实现的飞跃其实是一个一系列的技术进步中的一环,但是到了社交媒体上之后,因为大家可能之前没有一直在关注,才会有一个印象,觉得这是一个技术性上的前所未有的提升,以至于导致了某种程度的恐慌。在你看来,技术飞跃的实现是一个怎样的过程?

木遥: 我觉得是个很好的问题,飞跃怎么样放到一个更大的坐标系里面来观察。事实上,这个问题的业内人士本身在社交媒体上也有触及过。很多人发现了一个现象,好像业内的兴奋更大,业外一部分人觉得焦虑,而另外一部分人觉得这跟我有什么关系?或者是不是又是狼来了,又是炒作。而更重要的是,就是如你所说的,因为我们都知道,今天大家已经被社交媒体训练的已经皮了,对吧?不管多大的事,都是震惊,其结果就是你分不出这个震惊的数量级,到底是 10 倍的震惊还是 1 万倍的震惊。反正它的标题都是震惊、叹号。所以你有必要把它放在一个真实的坐标系里,来考虑这个东西到底是多大的一个事儿。它和别的事,比方和 Alphago 这样的事儿,或者和画图这样的事儿相比,是怎么样的?这里面经常有一个概念叫做 AGI,就是通用人工智能。通用人工智能一般被认为是人工智能领域的圣杯。什么意思?通用人工智能是一切问题的母问题。你要让 AI 或者让机器来做一个特定的任务,这件事情断断续续是一直都有进展的。AI 进展会下棋了,AI 可能也会作曲了,AI 也会画画等等。但什么叫通用人工智能?**同一个模型能够同时做很多事,这件事情是困难的。因为同一个模型能够同时做很多事,意味着它不只是被某一个特定的任务所训练成了一个熟手,不管怎么训练出来的,而是它真正好像人一样,了解了关于世界的某些更本质的运作机理。**你可以想象,你训练宠物狗帮你叼拖鞋。有一天,它非常非常熟练,可以认出你喜欢穿什么鞋,知道你每天回来最喜欢穿什么样的拖鞋,知道你哪天回来心情不好,不用给你拿拖鞋,这都是有可能的。这说明这个狗真的很聪明。但是如果有一天这个狗开始说我不只是帮你拿拖鞋了,同时我还帮你做饭,你就会觉得这里面一定有某些不寻常的事情了。因为你再怎么训练教拖鞋,这个能力不可能转化到做饭上。而通用人工智能的意思就是我能够训练出一个模型,既能够拿拖鞋,又能够做饭,这说明什么?这说明它不只是单纯被你训练成一个熟练工,它一定了解了某些关于世界运作的方式——鞋是什么,饭是什么,以及我该怎么做这些东西。这个认知就要到一个非常非常底层的层面了。这就是为什么 ChatGPT 它本身引起的震动比之前那些震动都大。因为 ChatGPT 可以说是人类看到 AGI 通过人工智能的第一线曙光,它终于有点通用的意思了。你今天也试用过,你也知道,你问它的问题并不需要局限于任何一个特定的话题方向,对不对?你问它什么都可以让他写诗。你让他模仿胡锡进写一个微博,或者你问它一个技术问题,让它写一个代码都可以,这就有点通用的意思了。特别是你可以很容易想象,既然它可以说话,它就可以通过这些话再去指导别的行为,对不对?今天也有很多这样的工具,让 GPT 去控制一个 agent,就是一个代理让它来进一步控制电器,进一步控制跟物理世界发生关联的、操纵的东西。就理论上来完全可以通过语言来真正做一些事儿,而它的语言本身又不限于话题,他就好像真的可以做很多我们生活中可以做到的事情。我不知道你有没有看上周四所发布的微软发布的新的 office。这个东西对人的冲击是很大的,因为大家都用 office,如果 AI 只是能够用来跟你聊天,还只是一个聊天机器人。**如果 AI 可以帮你写文档,可以帮你写 PPT,可以帮你写邮件,可以帮你做会议总结,它就几乎可以做 95%白领的日常工作了,对吧?通用性是飞跃在业界引起最大震动的部分。**所以如果我们用震惊体来描述这次的震惊,是真的比较震惊,比之前的那些震惊要高至少一个数量级。

王磬: 如果从你刚才说的意思来看,它之所以能够高这一个数量级的一个很重要的原因是在于它好像让语言具有了一个直接去行动的能力。这部分能力可能以前的时候大家还会觉得未来的方向可能会是 AI 结合,人仍然还是占据一个非常重要的角色,但只不过你用了 AI,这样可以让你工作中更有效率。但是一旦 AI 具有了直接的行动能力,它其实是完全可以某种程度上取代掉人的。可以这么理解吗?

木遥: 我觉得取代不是一个好的词儿,因为取代是一个非常容易反驳的词儿。我可以说我仍然会干什么什么,AI 干不了,所以它取代不了我。但正是这种字面上的抬杠,使得问题的本质被掩盖了,因为 AI 在人的生活中的渗透是一个逐渐的过程。百分之百地取代你可能仍然不会发生,可是它也不需要百分之百的取代掉你,只要 50%的取代掉你的某些工作职能,AI 就会对就业市场形成非常大的冲击。我有一个纽约的律师朋友,他是很早就开始用这个东西。他本身不是一个技术人员,他是一个标准的文科生,平常用一个新软件都要紧张半天的那种人。但是他开始用这个之后,因为律师的工作很大程度上是依赖于文本的,而文本是 GPT 的长项,所以他就开始用。之后,我就问他说,所以你真的开始辞退你的员工了吗?因为他自己是一个律所合伙人。**他说我还没有真正开始辞退任何人,但是我确实打算今年暑假不用再招实习生了,因为给我省下的活完全可以让我腾出手来做一些事,以至于我可以省下招一个实习生的 AD account。**这就是一个真实的影响对不对?它没有真正取代什么东西,但是它仍然冲击了一个真实的就业市场上的职位。我觉得 AI 对我们社会的影响会以这种方式出现,它不会马上一下子让你这个人变得没有意义,但是它可以让三个人的活,两个人现在能干完,多出来那个人就没有存在的必要了,所以老板就可以把他开掉。**它并不是百分之百取代人的方式来逐渐进行的,而且这个事情是非常真实的。这也是为什么我觉得很多人对冲击仍然没有做好心理上和事实上的准备。其实有点令人忧虑的原因就是,如果你今天还用一种,这东西都是媒体的炒作的态度来对待这个问题,你就很可能会在真正的影响你切身生活的冲击到来之前,没有做好对自己来说比较有用的帮助。

王磬: 我觉得我们可以顺着这里聊一下,聊一些可能更具体的使用的场景和可能会影响的群体。在你看来它的技术进展可能影响哪一些人群,哪一些工种?或者哪一类生活方式是最容易受到它的影响的?在我们目前已知的这种技术条件下,不用考虑它未来几年这种发展。

木遥: 我来简单解释一下为什么它能够帮到你的工作。我今天在网上看到一个笑话,说 GPT 这个词儿在法语中会非常好笑。我自己法语很烂,我不知道为什么。如果在传统时代,我要么去问一个懂法语的人,我要么去搜,但是这个就很难搜,因为除非有人在网上贴过这个笑话,否则你也搜不出什么东西来。但现在有 GPT,我就打开 GPT 搜为什么。**GPT 这个词在法语中非常好笑,让它非常快地告诉我答案。因为 GPT 在法语中的念法是“我在放屁”的意思。**我不是说笑话很好笑,我的意思是过程反映了为什么它会有用,因为我们在生活中大量的事物本来是以这种形式在人和人之间发生的。你有一个琐碎的事儿,这个事情你需要别人帮你来做,或者你需要一个秘书,或者你需要什么,但是在没有机器的时代,我们只能使唤一个人,或者我们自己花时间来做。但是有这个东西,它就可以帮你做,而且你去问它没有任何心理压力,你不需要付出心理成本。你不需要想说我要请教一个人,或者我要占他的时间,不需要的。用这种模式来考虑这个问题,你就会发现,其实我们生活中工作中的很大比例都是这样的,事情琐碎、小,但又花时间。基本上我们所说的一个白领的工作,我不能给一个精确的数字,但是我可以有把握可能 50%以上都是这种事情。你帮人写一个东西,或者你帮人回答一个日常生活中的问题,或者工作上的问题,或者回答一个知识性的问题,或者把一个什么材料总结一下。大部分人,我们今天所谓坐办公室的工作,都是这样的工作。极少数的工作是有创造性的、有原创性的。老板可能需要决策,大部分员工也没什么需要决策的。老板说小张你帮我把什么事搞一下?小张其实完全可以被 GPT 所取代。所以如果你问我哪一种职业最受冲击,我只能说任何需要在写字楼里面有一个小张跑来跑去的工作,都会被它所影响。因为小张所做的事情其实就是这类事情。我曾经写过一篇微博,GPT 的本质不是一个对话集群,GPT 的本质是一种以对话为界面的服务。什么叫以对话为界面的服务?当你是一个老板,或者你是一个所谓的 professional,你日常生活中在不断调用这样的服务。你有一个法律问题,你需要有一个人来给你回答法律困惑。你有一个编程时候的问题,你需要请教一个人。诶,为什么这里有一个 bug,或者我听你的,你让我安装了,但是现在界面上弹出一个错误,我不认识这个错误,我该怎么办?这样的问题是我们工作中需要遇到的。在没有 GPT 的时代,我们需要有一个人,或者需要一个能够至少说话的东西来帮助我们来往下走。而 GPT 提供的就是这样一种服务。它以对话为界面,帮助我们获得我们所需要的信息,而这种服务在之前是不存在的。之前当然也有一些类似于智能音箱之类的东西是假的,它只能回答特定的有限的问题。**但今天的 GPT 是通用的,它可以回答我任何问题。所以一切以对话为服务形式的工作都会被改变。而对话基本上是我们日常的白领工作的核心。不管是书面对话还是口头对话。**你今天在香港,放眼望去那些凌厉的写字楼里面的工作,你想象他每天在干什么,想象一下为什么他们的工作不能够被 GPT 所取代。其实你能找到的理由是非常少的,因为他们大部分所做的事情,不外乎就是把从 a 那里遇到的问题,自己消化一下,再问 b,然后从 b 那里得到的回答再消化,也再传递一个 a。而这个事情,GPT 是完全可以做到的。

王磬: 我觉得在这里有几个点,一个是你刚刚说到消化以及转述的过程,就让我想起,其实在我职业早期,我曾经有段时间是在各机构里面给他们每天写 news brief,其实就是我把头一天这个地方所有的重要的媒体关于某一个行业的报道找出来,进行消化和转述,去 highlight 出一些比较重要的信息,这大概是我十几年前刚开始进入职场的时候做过的其中的一份工作。如果放在今天的语境下来讲,这个是一份非常完美的肯定可以被 ChatGPT 去取代的一份工作。因为今天 ChatGPT 已经可以不光是帮我们去搜索新闻,也可以帮我们搜索可能更复杂的学术型的文献。但是另一个方面,我自己也会感到,当我们去说到消化和转述这个事儿的时候,这中间也存在一个质量的问题。比如当时我的老板,他有时候会跟我抱怨之前的助理,他经常会觉得他提供的 news brief 质量上可能达不到一个 brief 的要求,因为不够 brief,或者有时候 highlight 的点不够 to the point。我觉得这也回到刚才我们提到的另一个点,也是我自己觉得很想去深入了解的一个问题,就是 ChatGPT 从能做这个事儿,到能够以一个符合这个人完整的要求去做这个事儿,中间是不是其实还是有一定的差距,包括刚才你提到的,比如大家有时候抱怨 ChatGPT,它很擅长一本正经的胡说八道,它有时候会给你提供一个字面或者这种形式上看起来非常正确的文本,但事实上它的文本不太能够经得起考验。所以你会怎么样看待这个过程中可能出现的质量上的一个问题,以及你觉得质量的问题它多大程度上可以解决?是什么时间框架内可以解决的问题?

木遥: 这个问题是 ChatGPT 刚出来这的时候,很多人抱怨的核心,也是很多人觉得这可能不过又是一场炒作的根本原因,就是他可能用了两下,发现这不就是说车轱辘话嘛,而且好像也没有很深刻,而且很多时候还在胡扯。但是这里面有两个认知上的分歧需要被摘出来讨论。一个是 ChatGPT 其实不是一个产品,它是一个 demo。所以当你用消费者评估一个产品的视角评价它的时候,评价可能是不公平的。消费者评估一个产品,你可能会说我想要一个帮我扫地的机器人,这个机器人把地扫得不干净。这就是一个很糟糕的机器人,为什么要为它而激动?但是这种视角,只当你讨论的是一个渐变式的新产品才有意义。当我们讨论一个突变式的新产品的时候,你这种评价很可能就会因小失大。我举个例子,在马车的时代,有了第一辆汽车,在各种性能上都碾压马车了吗?其实是不可能的,因为马车被优化了几千年。而第一辆汽车,它一定是非常粗糙的,对不对?马车可能很舒服,抗震性能非常的好,它已经能想到的部分都尽善尽美了。而汽车,它可能会掉链子,它要加油,它可能滴里呱啦的,没什么防震,它一开始是有很大缺陷的。所以,如果你直接比较舒适程度,可能汽车未必比得上马车。至少第一辆汽车是这样。但是它仍然是碾压性的优势。为什么?因为它是一个断层式的革新。所以当你评价 GPT 的时候,你必须分清楚哪些是我刚刚说的这种,它只是因为一个新的东西没有来得及做得好,哪些是它就不可能做得好。但这牵扯到第二个问题,还是那句话,我们大众其实过去已经被这种新技术的轰炸式的新闻弄得神经疲惫了,每个东西都告诉我能够改变世界。3D 打印改变世界,5G 改变世界,比特币改变世界,对吧?每一个东西它都会告诉你改变世界。关于元宇宙的新闻言犹在耳,今天已经没有人提了。你当时也说它改变世界,哪改变了,对吧?所以这种狼来了的心态是非常真实的。我们今天凭什么说 GPT 是不是又改变世界,还只是我们这帮人在认知上……我得承认,你不可能百分之百的准确。你有的时候弄错了,你有的时候以为它改变世界,其实什么事也没发生。这种错误的概率是存在的。但是我仍然个人觉得 GPT 可能比刚才说的那些东西都更有可能是真的。我不能说百分之百,但更有可能是真的。它的缺陷包括两个层面的缺陷。一个层面是它的表达是不是,用你的话说,to the point,或者是不是足够精准,这个东西是很容易通过模型不断地训练改进的。另外一个缺陷,它是不是胡扯,在学术上被称作 fact grounding。它的表述是不是基于真实的事实?这其实是一个非常有趣的技术问题,因为我们今天知道 GPT 也好,GPT4 也好,它都是一个封闭模型。什么是封闭模型?它运行的时候并不实时查阅任何背后的数据库,它只是在复述在训练的时候记住的东西。如果在训练的时候这个事情还没有存在,它就永远都不可能知道。但这不是本质缺陷,这只是碰巧,因为从 OpenAI 公司的角度来说,它总得推出一个什么东西,而这个东西,你要让它查阅现实的数据库,你需要跟很多领域去谈,对吧?你要让它查阅法律数据库,你总需要去跟一个法律数据库的供应商去谈一个什么 deal 出来。或者你要让它实时检索网络,你总得让它真正部署到一个可以实时检索网络的服务器的层面,服务器本身要处理大量的跟现实网络的交互,这不是很容易的事情。Bing 是一个很好的尝试,Bing 把 GPT 置入到搜索引擎之中,但是又同时能够实时检索网络。但是你可能更需要更专业的,比方你需要他能够回答医学问题的时候,不是靠你的记忆来回答,而是你真正去查一个真实存在的医疗文献出来。这是我们作为消费者一个很自然的需求。而这个东西实现起来是需要时间的,因为它牵扯到跟现实的已经存在的知识信息、网络上存在的资源有一个沟通的过程,这个事情不会一夜之间发生,但是它也没什么技术上本质的障碍存在。所以我几乎可以肯定在未来一两年内,你会看到越来越多的基于真实数据的、做好 fact grounding 的 GPT,那个时候 GPT 就不只是靠它训练时候记住的东西来回答你了,它就变成一个中间的 layer,它负责理解你的问题,输出一个答案。但是它背后的事实来自于一个更真实的,比方说法律文书的数据库,或者一个医疗资源的数据库或者等等。那个时候它胡扯的几率就会大大降低。这件事情并没有很困难,我相信会很快发生。

王磬:而且其实你说让我想到它跟人脑的结构也是有点类似的。**比如我在跟你进行对话的时候,如果我不是同时在用互联网,我在跟你进行对话的时候,我所告诉你的所有的东西,其实我在这个点之前,我已经接受到那些东西,我不可能在跟你对话的时候实时去查询。**比如今天天气怎么样,香港的人口是多少,我没有办法实时去查询这样的东西。如果我现在跟你讲了这个东西,只是因为我之前就已经知道了,所以从那个程度上来说,ChatGPT 如果真的如你所说,它能够在接下来一两年内,不光实现理解、回答你的问题,这样一个需要一定的逻辑能力,需要一定的这种交互能力去完成的动作,它同时还可以在交互的同时进行一个无限的连通,相当于让你在跟他对话的时候,你可能获得的信息比你跟一个这方面的专家获得的信息更及时、更准确。如果真的是这样的一个情况,你会觉得这其实是会让人感觉有一点焦虑的时刻吗?

木遥: 首先,这不如果,这是必然,因为这个事情已经发生了。今天的 Bing 就是微软新的搜索引擎,我们一般叫 new Bing,但是读起来有点怪。它就是这样一个东西。它是实时教育,只不过它因为服务上的限制,它没有办法查阅的非常多,因为对服务器压力很大。它也在不断优化这件事情。特别是如果你用中文,用 new Bing 效果并不是特别好,因为由于各种法律上的众所周知的原因,它中文所能搜索到的东西是非常局限的,可能局限于百度知道这样的来源。而这些来源本身的质量你我都知道是有问题的。但是如果你用英文的 new bing,今天事实上是已经在回答你的问题的时候实时调用互联网了,已经不是在靠它的记忆在回答了。但这只是一个通用的搜索引擎,以后会有越来越多专用搜索引擎出现。我跟它聊的时候,它去实时调用一个真实的专业数据库。而这件事情在技术上没有任何难点,它唯一的困难是你得真的去做这件事。得有一堆工程师负责把这些该连的接口连起来,这是需要花时间的,而且需要对方答应给你提供数据的提供商得愿意让你去访问。但这些问题都是可解决,它没有技术上的本质障碍。所以归根结底,GPT 它就是一个中间的过渡层,它背后是真实的、大量的、无限的网络知识。它前面面对的是我们这样的人,它起到的是我一开始一个作为对话的服务。它负责把结构化的知识翻译成我们人类可以接受的自然语言,又把我们人类的自然语言问的问题,翻译成从结构化的知识中提取信息的这么一个 action。这件事情会不会让你焦虑?我打一开始就说了,**它当然应当让你觉得,咱们不说焦虑,至少让你觉得做好准备,否则你就会在真正的变革发生的时候措手不及,因为这件事情不是万一会发生怎么办的问题。它是正在发生,并且很快就会。因为这个东西它带来的效率提升是碾压式的,所以它速度会非常快,就像是当年汽车取代马车一样。它毕竟是一个代际之间的差距,有点像我们中国人刚刚接触到洋枪洋炮的时候,差距是你还是红缨枪,对面已经是火枪火炮了。**那个差距是你没有办法抵抗的,一触即溃的。所以这个过程本身会非常快。而且你必须做好准备,不能还在想说这只是未来,它万一可能会发生,它不是万一,它一定会发生。

王磬: 我就把这个问题再推得更极端一点,因为我觉得在科技发展期,其实大家一直以来也都会聊到科技奇点的问题这个概念。当然你可以给出个更好的解释。我非常肤浅的解释是,根据科技发展史,有一类观点认为,在某一个点,人类可能会接近一个使得现有的文明完全被科技发展所颠覆的这样的一个事件点。这个事件点某种程度上它具有一定的科幻的色彩,可能在一些这种科幻电影中也曾经不断的被描述。但是在现实生活中,到目前为止,它仍然是作为一种假想而存在。在你看来,你觉得这会不会是一个人类发展史上的一个奇点时刻?

木遥: 首先,如您所说,奇点的东西不是一个有共同接受定义的东西,所以你很难精确地说什么今天早上,我们醒来,发现世界怎么样了。这是一个文学性的比喻。你并不会真的找到那么一天或者一个时刻。但是你要说这次的,咱们不说它是不是工业革命,它至少是一个不管什么意义上的革命。它有没有特殊性?有的。我们人类在过往的工业革命史上对机器有一个非常本质的优势。我们虽然在体能上远远输给了机器,但我们的脑力从来没有输给过机器。而我们一般认为人类的能力不外乎就是体力加脑力,或者我们的肉体加上我们的灵魂。如果你在脑力上也被,至少在很大一部分层面上被机器取代了,这就不只是你被机器取代了一部分的问题,是你必须要严肃地问一问自己,我还剩下什么是机器做不到的?这不是一个很容易的问题。我们必须理解,过去两三百年的现代社会,是被这样一种基本认知所塑造的。人类的价值体现在他的脑力上的价值。一个小孩身体非常好,但是脑子很笨。另外一个小孩身体素质一般,但脑子很好。我们一般认为后者更有出息,但这个认为是哪来的?这并不是自古以来就有,这就是工业革命的产物。工业革命让我们觉得脑力比体力在社会价值的鄙视链上更高,而它更高的唯一原因是它是我们人类的优势的体现。我们再把话题再推得极端一点,我们想想,有三个小孩,一个小孩身体倍儿棒。一个小孩脑袋非常好,会做奥数题。一个小孩长得非常好看,他身体也未必有多么大的体力优势,但是他就是长得非常好看。我们今天的家长会觉得哪个小孩最有出息?我们会认为脑子好的小孩最有出息,对不对?学好数理化,走遍天下都不怕。第一个小孩是最没出息的,他只能去送外卖。第三个小孩他可能也能挣很多钱,他长得很好看,但是我们今天的价值体系认为你靠脸吃饭,不是说不可以,但他好像有点不是正道,或者不是我们家长会希望小孩子走的道路,对不对?你今天问一个家长,希望小孩他是做工程师还是去当网红?他可能会觉得网红也挣很多钱,但是他仍然希望,如果你能做工程师,还是做工程师好。但这个价值排序,它不是天上掉下来的,它也不是自古以来就有的,它是工业革命的产物。工业革命让我们觉得脑力是最高级的。脸也挺重要的。你要只有肌肉,那就好像等而下之。但假如你的脑力也被机器碾压了,这个价值体系还能不能维持?显然就不能了。你没有任何理由认为聪明是一种优势。因为你反正也不如 AI 聪明。当然,今天还不是这样。**今天我们仍然比 AI 聪明,但如果 AI 进一步变得更强大的话,你就没有 AI 聪明了。那时候,我们人类的价值体现在哪里?**如果你还是长得很好看,你是当网红,如果你长得不好看的,你存在的意义是什么?这是一个非常本质的存在主义的问题。而这个问题我没有好的答案。因为我们人类没有经历过这种时刻,我们人类没有经历过在方方面面所有的维度上都比不过机器的时刻。所以把它叫不叫奇点,我不知道,但它确实是一个崭新的、没有存在过的一个状况。

王磬: 另一个问题也是刚才你提到历史上的这种情况。所以,如果比如要帮助我们理解今天的情况到底有多特殊,你会觉得在人类历史上曾经也是出现过的、这些对世界格局,对人类的发展进程产生了深远影响的技术革命,你会觉得有哪一次可能会是跟这一次可以相提并论的吗?

木遥: 这两天会在网上看到很多比喻。很多人说周四的微软发布会是微软的 iPhone 时刻,相当于苹果在 2007 年推出第一代 iPhone。也有人认为这次的革命的幅度会超过智能手机的革命。我们这代人其实最近的两个革命,一个是互联网革命,大概诞生在我们这代人刚出生的时候。一次是智能互联网或者是移动互联网,一般被认为就是乔布斯那次著名的发布会,2007 年的时候。这是我们能够拿来做参照系的东西。当然我刚刚说了,这两个做参照系都不是特别合适。首先,我个人觉得这次人工智能革命的激烈程度会至少大于移动互联网,是不是大于互联网本身还不好说,我们还要再看。但是另外一方面,我刚说了,这两次革命再怎么说,已经发生这两次互联网加上智能手机,都没有触及到我们人的存在意义的问题,对不对?你并不会觉得有了互联网,你人就没有存在的意义了。但是当这世界上大部分人,他会问自己,我在这个世界上能够干什么?如果这个问题没有答案,就算我们社会结构因此适应了我们,给那些找不到工作的人发一个今天在西方讨论很多的 UBI,就是基本生活补助,或者给你一个基本的钱,让你不至于死掉。即使这样,这是不是解决了问题?其实没有,因为我们人毕竟不是只能靠混吃等死就能过一辈子的生物,我们需要有一个存在感,我们需要有一个存在意义的自我追问。哪怕是可能不知识分子的人,哪怕是一个普通的日常的老百姓,他也需要有某种意义感。我们都听过那样的故事,就是一个人退休之后,或者一个妈妈发现她的儿女长大成人,不再需要她的建议之后的那种失落感。为什么你会觉得失落?因为你觉得我希望成为一个有用的人,对不对?有用并不一定体现在我挣工资,但我希望别人认可我的存在,我希望我以某种方式在跟别人交互的时候发挥出某种价值。**但如果我不但身体的能力比不过机器,连作为一个可以对话的人所能提供的价值都比不过机器的时候,它对人类的心理上的冲击是无可比拟的。**你很难跟互联网或者跟汽车或者跟飞机的比较来做衡量,因为那些东西并不触及这个层面,而这次是真正触及了这个层面。你作为一个普通人,你既不特别漂亮,又不特别聪明,你不能够成为那些去开发 AI 的工程师,你只能用它。你工作的意义是?你生活的意义是什么?这是一个真实存在的问题,我没有答案,但是它确实是我们人类第一次碰触到这样的问题。

王磬: 我想反向来问一个问题,我们刚才其实谈了很多 GPT 可能带来的技术变革,它能做什么,现在能做什么,未来可能能做的更多。从你的角度来看,你觉得如果我们要去定义 ChatGPT,它不能做什么,你会怎么定义?

木遥: 我们都知道,在过去的二三十年里面,我们社会的家庭观念,或者我们社会的关于家庭劳动的价值发生了一个很大的转变。在上一辈人的观念中,比方假定你是个家庭妇女,你的工作是不被认可的,对不对?老公出去挣钱,他觉得他在挣钱养家。老婆在家里工作了一整天,甚至不是一周工作 5 天,是工作了 7 天,但她在家里面收拾东西,洗碗做饭,照顾好小孩。这个工作不被认为是挣钱,不被认为是平等的劳动。所以老公可以回来往床上一躺。我在外面挣钱挣了一整天,好累,你给我干什么干什么。过去 20 年,由于女性主义思潮的兴起,由于社会更全面地进入现代化,我们开始意识到,这个观点发生变化了,我们开始意识到家庭劳动也是平等的劳动,这部分劳动很大程度上是不可取代的。但它再怎么说平等,它也只是我们把本来不被承认的劳动价值提到了一定层面上。AI 的出现会让变化更剧烈的,我甚至都不能说推动,而是把它会打乱。为什么?因为你会发现,它会把这两件事情的重要性调过一个个来。AI 仍然不能帮助你洗碗,它仍然不能帮你照顾小孩,伺候老人、收拾家。某些部分可以,比方扫地机器人可以帮你扫地,但是很多事情今天仍然大家做不了。最简单的,你想把衣服都叠起来,这个事情你雇一个机器人来干,仍然不是马上就会发生的事情。传统上认为是成功人士的,每天出入于写字楼的西装革履的老工作,干的事情反而会变得毫无意义。他的工作既挣不来钱,也挣不来意义感,因为他做的事情,AI 都能做了。我们的不管是家庭观念也好,劳动价值也好,会发生什么样的变化,我自己不知道,但是它是一定会发生的。因为你刚问我什么样的工作仍然不能够被取代。这些东西仍然不能被取代的。那些照顾人的部分,那些在情绪上,在肉体上,在一切人和人交流的意义上所付出的劳动,都仍然是不能被取代的。当然,今天 ChatGPT 已经可以跟你聊天了,所以你可以跟它倾诉,甚至可以跟它谈恋爱,在某种意义上来说,但是它仍然不能取代你真实人和人之间的 care 对不对?但它可以取代你在白天上班的时候看起来光鲜的白领。所以,**它会非常非常深刻的影响我们整个社会的对价值的排序。我们本来被看作比较低级的所谓的家庭劳动,或者是那些不挣钱的劳动,会变成人类真正的安身立命的东西。**而那些传统的被认为是高级的 professional 的挣钱养家的劳动,我也不知道像什么一样,但是它会逐渐消散掉。

王磬: 你提到这个,我觉得挺有意思的,比如像照护或者情绪价值。我记得前段好像是 ChatGPT 刚出来那阵子,当时有一个主流媒体的记者去跟 ChatGPT 进行了一场聊天,他后来把整个的转写发在了网站上,他说他聊完了之后,其实当时有点恐惧,因为 ChatGPT 跟他聊到他的感情,并且劝他离开他的妻子。我不知道那个东西它在发出来的时候,以那样的一种 highlight 发出来,这背后有多大的一个真实性,或者是不是中间有一些过度阐释的部分。但我觉得它某种程度上其实是在于是 ChatGPT 它可能提供的想象确实我们之前从未想过的。我记得曾经有过一部电影,叫做 Her,讲的就是一个人跟人工智能在谈恋爱的故事。人工智能跟他交互的方式是以一个女性的声音,当然那个声音非常的好听,是斯佳丽约翰逊配音的。在故事当中,这个男主角确实是不可自拔地跟 AI 在进行一场恋爱。所以某种程度上,你要说他是可以部分的去取代对人的这种情感价值、陪伴价值,甚至可能有一天也能够实现照护的一些功能。如果按照刚才我们讲的逻辑,它现在既然已经能够比如从 ChatGPT,包括在 office 里面的这种应用,它是可以指导你去进行一些行动的。如果加上之后这种物联网的一些发展,像比如叠衣服,现在可能会是一个比较相对来说比较复杂的动作,但是听上去其实是一个相对来说技术上更容易解决的一个问题。你不需要把动作拆分成很多的步骤,但实现它可能也许只是一个时间的问题。比如再早一点,像洗碗机这么复杂的功能也得到了一个实现。所以我想讲的就是,听你聊完了这些之后,我自己现在对于 ChatGPT 的感受确实是还挺复杂的。一方面知道它会对你的这种工作、现在这种生存状况带来很大的影响,这种影响可能都不是一个未来,是他很有可能就已经是一个现在进行时。但另一个方面,它其实也把现在的结构当中,**可能很多重复的部分,或者很多不尽如人意的一些资源,让他进行一轮更好的整合,也许会在某些程度上把人类从大卫格雷博所说的那种 Bullshit Job 当中解放出来。**但是我想知道,从你自己的角度来看,如果去描述你在面对 ChatGPT 的这种巨大的技术进步,你的这种情绪上的回应,或者情绪上的一个波动,你会怎么样去描述它?

木遥: 先回答刚才纽约时报的问题,就是他跟 ChatGPT 聊了一晚上,谈了一个非常荒谬但好笑的恋爱。我们会不会有一天真的觉得 AI 可以跟我们谈恋爱了,或者满足我们的情绪价值需求了?我不知道,可能会,可能不会,可能我们这代人还不会,因为我们这代人的思维形式已经定型。但是今天才出生的小孩,他会不会?我一点概念都没有。**我有很多朋友告诉我说,他们家的小朋友其实在家里跟智能机器人聊天是非常常见的事情,我们很难想象,因为你觉得你在家里跟一个音箱聊天,是不是有点 creepy?但是如果你出生的时候家里就有一个智能音箱,他可能不觉得这任何特殊之处。你就聊了。

王磬: 我补充一个例子,我最近在学校里面教课,我的学生就有跟我说,他们的同龄人里面在跟 AI 谈恋爱已经不是一个非常少见的现象。

木遥: 所以我们会不会真的跟它谈恋爱,我不知道。如果一个宅男,他本来也没有什么真实跟人谈恋爱的能力,他确实觉得 AI 可能是一个更好的选择,这也是有可能的。它会不会能够帮我们叠衣服?你刚用了洗碗机的例子,其实洗碗不是一个好例子,因为洗碗那个东西是碗,碗大不了就打碎了,也就是个碗。我这么说好了,我举一个很简单的现实生活中的例子。你要给小孩换尿布,这个事情什么时候能够让机器来干?我认为不会很近,因为活生生的一个小孩对安全性的要求不是像洗碗机这样的。它虽然是个技术问题,但它不是一个马上就能解决的问题。我觉得它反而比很多我们认为本来遥遥无期的事情——比方说让 AI 写一个长篇小说——更难。当然,这是关于未来的判断,很难百分之百的确定。但是,归根结底的本质问题是,我们在情感上的需求是什么?我们这代人可能已经逐渐步入中年,我们可能思维模式已经定型了。下一代人是不是这么想我不知道。但是我们人的情感需求是不是只是有人陪你聊天就够了?还是你真的需要一个活生生的人?这个是一个哲学问题,我没有好答案。这应该是一个用你一开始的说法,这其实应该是一个文科生的问题,对不对?我觉得它是一个很重要的问题,但是我没有很好的答案。但我觉得有两件事情值得一提。一件事情是,AI 会在很大程度上会提升我们传统上认为女性更擅长的很多优势的重要性,因为那些东西相对而言不太容易被 AI 迅速取代。这句话当然很容易找到各种各样的漏洞,但是我来解释一下什么意思。我们传统上认为,我们今天的职场上,你说它是偏见也好,说它是刻板印象也好。但今天我们确实更普遍地把跟理工科的或者跟定量思维有关的任务派给男生,不管男生是不是实际上更好。你要问我,我并不认为男生更好,但是现实社会结构是这样的。我们认为男生来做这样的事情是让社会上更约定俗成的一种办法,而把那些跟沟通、跟协调有关的事情派给女生。我需要强调,不是这件事情有什么必然性,但今天的社会事实上是这么运作的。这两类工作,哪一类更容易被 AI 去代替?显然是前者。AI 今天会让你处理一个 Excel 报表的工作变得完全不重要,因为它做 Excel 比你做得好多了。但 AI 能不能更好地协调一个团队?未必。因为其他团队。我们仍然是人的生物。本能需要有某种人和人之间的 bond,人和人之间的非常微妙,非常难以言表、但真实的 human interaction 所带来的 chemistry。这种能力,AI 暂时是做不到的,或者我们想不到它用什么形式做到。我们人类可以服膺一个真实的人的协调,但是我们人类会愿意服膺一个 AI 的协调,或者它的领导和指示吗?这其实我不太确定下一代人会不会,他们可能会觉得更自然,但是我不知道,只是我们这代人,可能需要一点心理上的转变。所以在这个意义上来说,这是我刚回答你的问题的第一个层面。我们人类仍然是有一些工作暂时不会被马上取代的,这种牵扯到人和人交流的。

王磬: 我想问你,从你个人来说,你觉得你会跟 AI 谈恋爱吗?

木遥: 我不会,但是我已经是成年人了,我的思维方式已经定型了。下一代人会不会我不知道。

王磬: 你不会跟 AI 谈恋爱的这个点,你觉得 AI 它不能够给你提供的是什么?

木遥: 不能给我提供的是一个我在活人那里获得的认可。这里面牵扯到一个本质问题,就是为什么活人的认可那么重要?我不知道,但是我小时候是这么被培养长大的。人总有他的时代局限性。我和你是一代人,我们这代人就是这么觉得的,觉得活人的认可比一个算法的认可重要。但是我们小时候也没有什么算法的认可这回事,对吧?所以你打一开始你追逐的就是活人的认可。如果小时候就告诉我算法的认可也挺重要的。那我今天是不是另外一种想法我不知道,但我们毕竟已经长大了。第二点是我们所描述的是一个动态的过程,所以它并不会让你在一夜之间看到,它必须跟我们别的社会议程一道发生作用。我仍然想说的就是,我们刚才说的很多社会结构的变化,其实在没有 AI 时候也在发生。我们今天的领导层上越来越多见到女性,我们强调 diversity 等等。这些东西长期以来只是被认为一个纯粹社会议题好听点叫社会进步,说难听点叫白左的 agenda。但不管怎么说,它是真实在发生的东西,但 AI 的介入会跟它同步发生,使得这个过程变得更加有趣,也难以预料。因为有很多我们传统上被认为重要的特质会变得不再重要,所以整个权力结构会因为 AI 的参与进来而发生重要的调整。而这部分我是很难用一个简单的非黑即白的方式来把它总结出来的。我是在回答你一开始的问题。我们认为哪些事情能够不被取代?我不知道。因为新的权力结构中可能有一些新的角色出现,而这些角色在旧的世界里根本就不存在,所以我根本无法预料到。比方有些新的决策。也许 AI 沟通师或者什么之类的,根本以前不存在的角色,而这些角色可能会变成某些人的专长,我不知道。这是我要想说的第二点。

王磬: 刚才说到我们从小怎么样被教育的问题。确实,作为人来说,你是有成长期的,你过了成长期之后,其实你的这种价值观、世界观,你怎么样去认识你周围的世界,这一套结构已经被建立起来的时候,其实我们就已经变成了一个所谓的成熟的人,一个成年人。但是我不知道对于 AI 来说会不会其实会更是一个线性的过程,是一个扁平的过程。没有所谓的比如青春期,也没有人生,不会存在不同的阶段,他可能也不会死亡。

木遥: 它没有人生,但它会有换代。我们人在整体上来说,虽然我们每个人有人生一说,但我们的人性在整体上来说,上下限是比较固定的。而 AI 的特点是它每一代跟前一代都不一样。所以你不是面对一个 AI,你是面对好几种不同的 AI,每两三年就会面对一个全新的 AI,而那个 AI 又要让重新适应一遍,对吧?所以其实 AI 是一个更大的集合。AI 的 diversity 其实比我们人的 diversity 要更大,只不过我们今天只有一个 player,就是 ChatGPT。但很容易想象,10 年后、20 年后,这个世界上是有很多种完全不同的 AI 同时存在的,所以它每一个个体是固定的,但它们之间内部的方差会远远大于我们人类之间的方差。你刚刚说人类的适应性的问题,我想一个很有意思的问题。我相信很多人也很关注的问题就是未来的教育哪些东西还重要,哪些东西变得不重要了。我们这代人的教育重要不重要,是我刚刚所说的那种我们现有的社会结构决定的。我们认为数理化最重要,其次是文科。我们虽然政治不正确,但是我们都心知肚明。在我们念书的时候,理科是比文科被大家认为是更好的专业。我知道今天网络上会对这种问题有很敏感的反应,但是我们不是说这件事情应该如此。但是,我想说的是,我刚说的是工业革命的语序。工业革命让我们觉得文史哲相对没有数理化那么重要,或者是跟现实生活直接发生联系,或者有 impact。但是在 AI 介入之后,这个结构会被打破。所以会不会走到下一代人,他们就会觉得“学好数理化,走遍天下都不怕”这句话没有任何道理?我们今天是很难想象的,但是下一代人可能会觉得当然应当如此。你学好数理化干什么呢?而且这种变化也不是没有发生过。你想象一下清朝末年的最后一批翰林,他们面对的是同样的情况,他们读了一辈子四书五经,靠着这个安身立命,靠着这个当上大官,靠着这个变成国家领导者。但他们下一代是完全不学这个了。我小的时候曾经有一个困惑,就是**1840 年英国人打过来了,那个时候难道你就没有意识到四书五经已经没法面对这个现实世界了吗?为什么中国人要到 60 年后才取消科举?**你难道要花 60 年才能意识到科举已经完全没有实际意义了吗?后来我长大了,我就意识到这件事情的必然性了。为什么要 60 年?因为 60 年差不多就是两代人。一个小孩是没有权利去取消科举制度的,只有那些已经功成名就、位高权重的大人们才有权利取消,而他们自己是科举上来的。你让 1840 年的那些宰相翰林大学士们取消科举是不可能的,因为他们自己一辈子只经历过科举制度,他们的儿子那一辈 30 年后也不会取消科举,因为他们虽然在 1840 年的时候还不是掌权的人,但是也已经 30 岁了,世界观也已经定型了。因为他们的孙子辈,1840 年刚刚出生的人走上权力中枢之后,那要到 60 年后才取消,科学的真正的动力才会大于阻力。物理学家普朗克说过一句很有名的话,“物理学的每一步前进,都是由伟大的物理学家的葬礼构成的”。他的意思是说,只有老一辈人死掉了,那个旧的观念才会真正消失,新的观点才会出来。你说当时英国人打过来的那个冲击够剧烈了,冲击再怎么剧烈,还是要两代人才能完成观念上的转变。**今天很可能你仍然会发现,人的固有的惯性、生物上的惯性仍然会起作用,我们仍然会试图捍卫我们这代人或者我们下一代人的世界观,直到我们都死掉了,我们下一代人也垂垂老矣,再下一代人才会彻底迎接 AI 的新的时代。**到那个时候,他们才会真正觉得,为什么人要花那么多时间去学习所谓的理工科知识,这些知识难道不应该让 AI 来做吗?那一天的教育是什么样子,我不知道。今天还有很多人会说,你应该去学习理工科的,甚至还有很多人让你去学编程。我那天看到一个非常好玩的新闻,有一个非常著名的在线教育机构,叫做 Khan Academy,可汗学院,是一个非常著名的做在线教育的机构。他们很快地跟 GPT 接触,用 GPT 来改善他们的教育。一方面你会觉得不错,动作好快。另外一面,你又会纳闷说我到底为什么还要再学你这些课程?这个感觉就好像是你一个马车夫,明明都看到汽车发明了,他兴高采烈地去学开车。但你问他学开车干什么,是为了去更好地喂他自己的马。你会有一种时空错置的感觉,他那些课程本身到底还有什么用?虽然我可以通过 GPT 作为助手学得更快,但是我为什么还要学这个东西?包括今天很多人还说人工智能是 Python 写的,所以我要现在学 Python。问题在于,人工智能固然是 Python 写的,可是人工智能自己也会写 Python。所以你在一个已经有了人工智能的时代,你为什么要去学 Python?这些问题是真实存在的。但是人会有固有的惯性,我们不能够一夜之间就调整到新时代。我们需要花很多时间,很可能要消耗到一两代人的时间,才能够真正跳转过来。中间这个过程可能是非常混乱的,可能是非常无序的,甚至可能是波浪型的,我不知道。

王磬:你这里就讲到一个我觉得挺有趣的逻辑上的矛盾,就是人工智能仍然是由这些人工智能的软件工程师书写的。可以这么说,如果从现在开始,新的这一代,他们就已经觉得学习编程是一个不需要再去学的事儿。他们可能永远都不会达到可以去编写人工智能的水平。因为你要写,你肯定还是需要一系列的技术才能到达那个水平。如果是这样子,未来的人工智能,它的更新换代将会是一种什么样的情况?自己给自己更新吗?还是说会怎么样?你为什么笑?这个问题很蠢是吗?

木遥: 不蠢,这个问题是非常好的问题,但是它过于科幻,以至于我很难忍住笑。我觉得长远来看,人工智能自己更新自己是一定会发生的。但是重点不在于长远,因为那天到来的时候我们都死了,重点在于我们怎么过渡到那一天,中间是什么样一个状况。简单的说,我不知道,因为你问的问题其实是一个不光是在编程领域,在各个领域都存在的问题,人工智能首先淘汰的是任何一个技能上的平庸劳动者。这很容易理解,对吧?因为如果你是真的一个极其出色的人,你仍然是有一技之长可以做得比较好的。但如果你只是平庸,只是 average 水平,人工智能就很容易把你去掉。但你马上就会问,你把平庸的人都淘汰掉了,那些少数的人,他们从哪里成长起来,对吧?我就像我们刚才说了一个公司里面那些小张小王都被淘汰掉了,老板不会被淘汰,可是老板也不是天上掉下来的,他也得从小张小王那个地方干起来。用中国人的话说,“宰相必起于州部”,他必须从一个小官干起,一步步干到宰相。如果你把第一层的平庸的东西都干掉了,社会职业路径是怎么样的?我们没有经历过这种情况,所以我不知道未来的社会到底怎么样。如你所说,大家都不学 Python,到底一个人怎么变成写 Python、写人工智能的工程师?虽然那可能是个很小的群体,全世界只需要 1000 个人就够了。但他的职业路径是怎么样的,我不知道,但我说我比较有把握的是这样一种现象会一定会发生。人工智能的出现,会极大地放大人和人之间技能差异所带来的资源差异。这个过程不是新的。人类历史就是这样一个过程。在农耕时代,一个好的农民和一个坏的农民的年的收成的差异,不会有特别大的差异,差出一倍撑死了。到工业革命时代,一个好的工程师或者一个好的技工,他所能创造的价值就已经比一个平庸的人、平庸的技工创造价值要高很多了。因为机器可以放大差距的能力。到了编程时代,过去 20 年,你已经会发现一个好的软件工程师,他所能的创造的价值,他所能够造成的社会影响,会远远高于一个平庸的、学了两天 Javascript 就跑到社会上找工作的一个普通的码农,差距会非常非常的大。我曾经跟磬有一次私下聊天聊过这个问题,Google 有一个非常著名的工程师叫 Jeff Dean。当然了,很多人说他已经不是工程师,应该叫领导。但是他自己确实写程序上来的,他今天也仍然在写代码,技术上来说,他也是一个码农。他和一个一般码农所能创造的价值的差别可能是成千上万倍的。当然,他拿的工资也确实是成千上万倍。而 AI 会把这个曲线再进一步推得更陡峭。AI 会让极少数控制 AI、掌握 AI 的人,他们所作为资源的网络的枢纽节点,他们所创造价值的能力和调动资源的能力会远远超于普通的一半人。这是我们今天社会面对的真实问题。我们本来已经面对很大的社会不平等了,但 AI 会把这个东西更进一步地放大。这个现象很多人今天已经发现了。今天如果你去推特上看业内人士对 AI 的辅助编程这件事情的讨论,大家都发现了一个现象,AI 会成百上千倍的提高一个好的工程师的工作效率。只要你能够很快掌握跟它共同工作的节奏和模式,它会让强者更强的马太效应极其显著。所以在那种情况下就会发现,一般的社会职业也好,或者少数的我们小时候特定的编程这样的工作也好,大量的工作是由极少数人承担的,而那极少数人因为有了 AI 的帮助,他会非常容易地调动各种各样的资源,而大量的人会完全无法跟上。这种社会结构显然是有它的问题的。社会不平等大家都知道是非常深刻的问题,但是它跟我刚刚说的大部分人会失去存在意义,或者会面对一个存在主义危机结合在一起,它会以什么样的形式延续,它会不会导致整个社会的不稳定?我不知道,因为了我们没有碰到过这样的情况,但是至少目前来看,趋势确实是这样的。

王磬: 我觉得我们可以顺着这里聊一下 AI,或者我们先聊 ChatGPT 可能会面临的伦理的问题,以及监管的问题。我也在港中大课上跟我的学生简单交流了一下,我就问他们,你对于 ChatGPT 可能最想了解的是什么?其实很有意思的是,不少同学都提到希望了解 ChatGPT 应该可以怎么样去更好的监管。我觉得这其实可能一方面是因为课上的大多数朋友还是文科生,所以我们思考问题的角度更是从一个社会治理的角度去思考。但另一方面,我觉得其实也能够体现出某种程度的焦虑。在焦虑的情况下,可能是有一部分人会希望 AI 发展的更慢一点,给不受监管\不受控制的这种野蛮生长去提供一定的阻力,或者提供一定的规范框架。所以我也想了解你是怎么样看待这个事儿的。科技监管这个事儿我觉得也是一个老生常谈。我们知道在美国、在中国、在欧洲,其实不同的制度下对科技监管是有不同的态度。像我比较熟悉的欧洲,其实对于这些年来比较主流、比较迅猛的一些科技发展,一些科技公司的壮大,都是采取了一种相对来说监管为主的这样一种思路。但在美国和在中国,一方面由于这种科学巨头的存在,另一方面我觉得也跟本地的社会还有企业文化有关系,对监管会呈现出一种可能相对来说更开放的态度。我不知道在你看来,你觉得对 ChatGPT 来说,我们现在去聊监管是不是为时尚早,还是我们现在去聊它已经有点晚了。

木遥: 首先,我百分之百的同意 AI 必须以合适的方式监管。但监管本身是一个含义模糊的词,根本不让 AI 发展也是一种监管。但很显然,这未必是你想要的监管。你刚说到中国、美国、欧洲的差别,我相信你自己在欧洲,你一定对这个情况非常熟悉。欧洲一方面确实它监管更严厉,但另外一方面,它也因此在过去 20 年的科技浪潮中明显落后于中国。所以它固然避免了很多问题,但其结果就是今天的互联网巨头可能一半在中国,一半在美国。在欧洲的几乎没有,不是完全没有,但是明显落后了,跟欧洲应当在科学技术浪潮中的应有的地位完全不相称。

王磬: 而且某种程度上我了解到的正好是因为它没有这种科技巨头,所以它在通过一些监管法案的时候,它面临的游说的阻力更小。所以它是有点相辅相成的过程。

木遥: 对,它就变成一个恶性循环了。因为政客并不需要顾忌巨头的压力,所以政客就可以通过各种各样的立法,通过立法之后,他又未必真的懂这一行。其实我是立法可能扼杀了创新,或者至少阻碍了创新,更加难于生长出新的巨头出来。但总而言之,我不知道欧洲的政界怎么看待这个问题,但是至少你从一个旁观的角度来看,它确实落后了,对吧?可能在监管上没有落后,但是在经济上、在技术上都落后,这种落后长远来看是福是祸,很难讲。特别是欧洲人,你也知道,他本来可能觉得我生活也就挺好了,我干嘛要中国人那样卷对吧?每年夏天我去海边度假就好了,我并不需要科技巨头,这当然也是一种生活哲学。但是当这种差别更大的时候,我不知道欧洲人能不能还那么心平气和。如果他发现 AI 真的是新的工业革命,而他被工业革命放弃了。就像早年的工业革命诞生于英国,从欧洲扩散到整个全球。如果今天反过来,欧洲变成了工业革命的洼地,我不知道欧洲人会怎么来理解这个事情。但是到监管的时候,你必须要考虑的一个问题是,你不能做膝跳反射式的监管。什么叫膝跳反射式的监管?你在还没有了解这个事情的本质之前,就凭着恐慌或者凭着焦虑来做很容易被时代抛弃的决定,你的决定很可能不是基于完备的事实做的,也不是基于对长远的深刻洞察做的,而是基于你在那一刻的本能反应做的。这种监管很容易变得毫无意义,要么过度严厉,要么被现实抛在后面。在这点上,我其实……下面这句话很可能又会引起很多争议,但是我是对所谓的文科舆论界也罢,知识界也罢,对这件事情的反应,让我是觉得有点失望的。因为我觉得大部分我看到的反应、大部分我看到的批评。都不在点上的批评就不是真正的批评,也不能构成有效的监管,这很容易理解,对吧?我刚才已经举了一个例子,就乔姆斯基那里。但他毕竟 90 多岁,大家知道他老了。但另外一个很好的例子就是前一阵子非常流行的那篇文章,姜峯楠那篇写在纽约客上的文章。他的那篇文章是发在 1 月份,他自己是科幻作家,大家认为科幻作家应当是比较有前瞻性的,但是他那篇文章就非常落后于现实发展。他写得非常好,那篇文章本身写的就文章而言是很好的,唯一的问题就是它落后于现实。它文章的结语是,ChatGPT 不过是关于现实互联网的一个拙劣的、模糊的复印机,你有真实的世界在那里,你要复印机干什么?这个结论是,说白一点,错的。ChatGPT 并不是现实世界的复印机。我相信他如果哪怕推迟两个月写文章,他都不会把文章写成那样,因为今天的现实已经非常明确地揭示这一点。这文章写得很早,所以他做出了一个在我看来膝跳反射式的反应。如果你基于这样的反应来做监管,当然不会形成任何有意义的监管。这反映一个现实问题就是,我们不说文科生或者怎么样,但是确实大部分人,如果他不处在这个技术的核心地带,他确实容易因为技术上就不是很了解,所以会有各种各样不正确的反应。如果你是个老百姓,当然无所谓,但如果你是知识界的重要领袖,或者你是政客,你是能够真正参与监管过程的人,你在你不了解的时候就做出反应,就会导致这样的误区。但是了解又非常困难,因为一个人可能没有这样的知识储备,对不对?我相信像神经网络这样的词,你今天也耳熟能详了。但是大部分如果不是做这一行的人其实对神经网络只有一个非常抽象的、模糊的概念。了解到底什么叫一个神经网络,一个神经网络有多大,怎么运行,是没有一个上手的概念的。在这种情况下,你到底怎么监管?你是不是要等到他已经全世界开花结果了再去监管?那个时候确实太晚了。但你早期监管的时候,你怎么介入?所以我觉得比较重要的办法就是多进行像我们今天这样的讨论,尽早了把不熟悉技术背景,但又在舆论场上,或者在政治上,或者在知识上,重要的既是业外又能够影响社会的声音纳入进来。让大家怎么说?on the same page,至少在事实层面上弄清楚发生了什么,什么即将发生,它的能力的上限在哪里?哪些事情我们今天仍然不认为它能做到,哪些事情你们以为它其实不可能做到,但是它其实今天已经能做到了。把这些事情先弄清楚,再来谈我们该怎么监管的问题,对不对?有些问题可能是吸引眼球的,比方我们禁止它谈恋爱,或者禁止它给人看病。有些东西是更本质的,和我刚刚说的,如果它极大地冲击了我们今天社会上已经很加剧的不平等,怎么办?我们有没有社会上的好的机制去介入,去做一个补助,或者是一个对人的关怀。这些问题是更现实,说老实话,也更紧迫的。王磬:说到监管的问题,我觉得其实这几年不光是欧盟相对比较偏严格的立法的思路,还是在美国之前这些科技巨头去国会做听证的时候,你也能看出来。其实我觉得很多的议员对科技是非常缺乏了解的,如果你考虑到他们的年纪,也对这个情况并不意外,可能他们能够问出的一些问题是他们的助手给他们的,他们自己可能本身对这样的最新的技术进步并不感兴趣,但他们手中同时握有非常大的关于这个社会应该如何结构的权利。就是你刚刚提到的为什么要花 60 年才能够废除科制。所以我觉得这是一个可以是人类遗留的一个这种劣根性的问题。另一个问题,我觉得可能对于当下的人来说更迫切的一个问题,你刚才也提到的,我们需要让不管是哪个行业,哪个领域是文科生、理科生,是中国人、美国人、欧洲人,大家可能需要对一些即将改变我们生活的科技技术有一个相对来说在同一个水位上的认识。我觉得认识其实是很难达到的,某种程度上在集体层面上去提高这种观念的水位。比如到一个比较实际的问题,你今天提到了很多次,说我们应该为社会去做准备,因为它不是即将发生,它是已经在发生、正在发生。如果要你给出一些建议,你会给出怎样的建议?我们可以怎样去为社会做准备?

木遥: 这是个很好的问题。我先给你讲一个我自己的体验。我自己在网上经常会聊这个事情,我发现当我长篇大论的讲我觉得技术大概怎么回事的时候,当然反应也很好。但是反应最好的永远是,我贴出一个视频说你看现在也可以干这个了。这种事情当然让你觉得有点好笑,因为你付出的劳动反而后者是最轻的,你就贴一个视频就可以了。但是我们社会就是这么运作,对不对?大家你看一个长文,想象它给你带来的影响总是不直观的。而直观就是,哇,AI 可以干这个了,一个短视频,越短越好,1 分钟以内,你放到抖音上,马上一夜之间,所有人都看到。大家说怎么办,失业了。这种冲击是最强烈的。这当然是一个非常尴尬,也不是一个很理想的状况。但是这是一个真实的状况。你刚刚说的关键的水位很难持平。如果是 1840 年那个时候,你让大家都接受科举制,已经过时了,很困难。今天的好处,也不能叫好处。今天现实是,你不用真的等那么久,因为大家很快就会见到真实的东西了。1840 年那个时候,毕竟你让中国一个内陆县城感受到洋人的冲击,没有那么剧烈,对不对?顶多能见到一个火柴,但是他们可能见不到。铁路修建需要时间。但是今天你再怎么对技术怀疑的人,其实也你也不需要跟他争论,因为几天之后,他就会在现实面前败下阵来,对吧?他周围人都开始在 office 用的时候,不再打一整行字了,他就直接在旁边问我现在想写这么个东西,帮我列一个稿子来,它就列出来了。你再怎么怀疑技术的人,他也很快就会用上这个东西。这是一个事实层面的征服它的过程。所以关键首位反而是比较容易持平的。因为大家会眼见为实。你让大家想象一个未来是比较吃力,但是你让他看到大家比较认可,你让他用到,他就更加哑口无言了。我刚才说我律师朋友,他自己其实是非常非常不喜欢探索新技术的人。你说服他用一个新的 APP 是非常困难的。他真的一用,他发现这东西真的管用,他很快就会被说服。但是被说服这东西有意义、这东西有影响是一回事,做好准备是另外一回事。**因为很多人我刚才说了,他不是资源的占有者,他很可能是在浪潮中间被摆布的、被淘汰的,或者至少是被冲击的对象。他可以说好的,我现在知道了,我观念跟上了,我知道 office 可以干这个了,我本来花上 1 小时才能做到幻灯片,他 2 秒钟就给我干好了,但这只能说明我老板不需要我了,我该怎么办?**首先,我最大的回答,当然是最简单的回答就是我不知道,因为我确实不知道。但是如果你今天是一个仍然在职业生涯初期的人,我觉得有一个可能是老生常谈,但也确实真实有效的回答是这样的。你必须意识到,当大潮袭来的时候,你最大的资产,一是你的安全保障。安全保障当然体现在各种方面,而且这东西很大程度上也不是你自己能够想有就有的,也取决于你的家境或者怎么样。但是安全保障是第一位。

王磬: 富二代水位会高一点是吗?富二代就在泰坦尼克的……开玩笑,你说。

木遥: 不是开玩笑,这是真实的。但是第二个问题就是你保持自己的灵活性。灵活性体现在,不管发生了什么样的未来,你都有以某种方式可能是比较你不好想象的方式,包括很多人开玩笑,好的,我也会去给人送外卖,或者好的,我也会去当厨子,有开玩笑的成分。**但是无论如何,你越有选择,或者你越能够保持自己的选项的 flexibility,你就越能够迎接变化。**你越早把自己锁死在一个道路上,你就越不容易迎接变化。今天很多在互联网上的关于 AI 讨论,下面最常见的评论是什么?说,好的,我明天就去考公。因为你知道,对中国人来说,宇宙的终点是体制,考公永远显得像是最后的救生衣。但考公就是一个非常典型的把自己的所有路径都锁死的一个东西。我不是说大家不能考公,我只单纯说这是限缩了自己的 option。当你限缩了自己的 option 之后,当大潮袭来的时候,你的灵活性就会降低,你的安全感就会降低,你就会更加深刻的陷入焦虑。所以我知道这话听起来非常的虚,而且这也不是什么有 action item 的建议。但是保持自己的 flexibility 可能是面对大潮的时候,能为自己做的最好的事情。

王磬: 我分享几个最近也是在网上看到的和身边接触到的关于 ChatGpt 的段子。就一个是 ChatGpt 接下来就会把我们的智力情感的功能部分取代,甚至是全部的取代。我们还剩什么?还剩一副皮囊,不如从今天开始就每天去健身房,起码是 ChatGPT 不能够取代的一副美丽的皮囊。第二个也是我在课上也跟我的一个学生交流,我就说其实像他们现在都还在念本科生、研究生。就像你刚刚提到的这种职场初期,可能还没有进入即将步入职场的这么一群人。其中一个女孩,她之前是特别喜欢写作,我就问她,你现在知道 ChatGPT,它可能会在未来有这样的一些影响,你会怎么样去调整自己现在的时间分配?他现在可能就会希望能把更少的时间放在写作上,因为他发现 ChatGPT 已经可以写出非常漂亮的、非常精准的句子。所以更多的时间放在写作上,会让她觉得浪费时间,浪费精力,不能够对未来去做出一个更好的准备。这些时间要放在哪?她的回答是,她希望能够放在更有创造力的工作上,能去做一些更有创意性的事儿。我觉得这里就陷入一个其实有点吊诡的状态。首先,**在过去,在我们看来,写作本身就是一个具有创造性的事儿。其次,如果写作都不算是一个具有创造性的事儿了,什么样的事儿算?在 ChatGPT 的时代,它仍然是具有创造性的,它仍然是足够创新,足够创意,以至于它不可能会被 ChatGPT 取代的,因为这种创意性的工作不会被人工智能取代。**我觉得这也是一个科技界的这种老生常谈,我不知道是不是就讲出来安慰文科生的。但是我这几天在比如网上刷一些评论的时候,也看到 ChatGPT,它其实现在也可以部分地去进行创造了。我也想把这个问题丢给你。你觉得这种我们可以把人的精力、智慧更多投入在创造性的工作,而不是重复性的工作上。这个说法在 ChatGPT 时代是站得住脚的吗?是可以让我们免受冲击或者减少我们所受的冲击的一个行动吗?

木遥: 你刚刚讲了两个事情,我觉得都挺值得回应的。我现在先回答第二个问题。

木遥: 我先回答第二个问题,然后回头来讨论皮囊的问题。第二个问题是创意的问题。我的简单的回答是可能不是那么简单。今年 2 月份有一个论文是讨论怎么用 GPT 帮助科研工作者做 research,他就找了一个领域,让 GPT 来完成四个任务。一个任务是产生新的 idea,一个任务是综述已经有的工作,一个任务是准备数据,一个任务是实现和测试。你听起来这 4 个任务,第一个任务就是你刚刚说的更接近于人所说的创造情况,对不对?产生新的 idea。后面那些听起来好像更琐碎一点,更技术性一点。他把这四个任务都交给 GPT 来做,把 GPT 的工作交给专家来打分。最后发现什么?发现 GPT 得分最高的是第一项,不是 2、3、4。为什么?因为产生新想法这个事情反而落到了 GPT 的强项,它从已有的各种各样的知识的海洋中,我们不管这个比喻什么意思,或者一堆语词的海洋之中找到可能可以连接,但人们还没有想出连接的东西出来,把它作为一个新的 idea,propose 出来,这个东西反而让它来做更有效。真正的你让他老老实实去准备数据测试,可能反而……至少今天的 AI 水平就那么回事。这个故事告诉我们两件事情。第一就是**所谓的创造性活动,其实没有那么不容易被 AI 所攻克,AI 是可以做这种事情的。**第二,存不存在 AI 暂时也做不到的?真正的创意一定存在。我们能找到某些极端的例子,在艺术上,在科学上,在文化观点上,完全原创性的,它不存在在既有的世界上的东西完全从无到有的创新出来。我举个很简单的例子,假如今天没有比特币,ChatGPT 能不能设想出比特币这样的东西?我其实有点怀疑,因为它缺少一种完全新的想法。这东西不是从既有想法中间联系出来的,它是一个新的东西。当然你也可以。它其实是把某一个 idea 跟某一个 idea 放在一起,它总不可能真的从天上掉下来。但是它不能够从现有的所谓的知识元素的海洋之中挖掘出来。这样的例子是有的,但是这样的例子本来对普通人来说也没什么实际用处,你一个普通人有多大的几率在一生中发明一个像比特币这样的东西,不太可能,对不对,所以它作为一种安慰是没有什么意义的。你必须要真正非常非常原创才够用。那 1000 万个人中只有一个人,这对大部分来说不构成任何实际的操作性。这是我对你第二个问题的回应。这是一个不太振奋人心的回应,但是结论就是原创性这个东西,至少平庸的原创性或者日常普通的老百姓可以达到的。原创性其实没有那么神秘,AI 是可以达到的。第一个关于皮囊那个问题,我觉得它不是一个段子,它是一个真实的问题,就是皮囊听起来有点过于物质化,对吧?你就可以靠整容来获得一个好的皮囊。但是我刚才说了,在未来的职场上,**或者是未来社会结构上,AI 可能最无法取代人类的,是关于人的 interaction 的部分。你怎么样说服一个人,你怎么样领导一个人,你怎么样团结一帮人,你怎么样去塑造共识,怎么样去弥合分歧。**而这些东西确确实实在很大程度上是依赖于我们人作为生物上的人的一些特性的。如果你在过去的时代,你说职场上长得好看的人会被优先提拔,虽然大家知道这可能是真的,但是大家认为他至少不应当如此。你应当提拔的是谁?应当提拔能干的,聪明的,而不是长得好看的。但是如果你的能干和聪明被 AI 取代了,你剩下的可能也确实就是好看了。

木遥: 但是我这里来把他说的政治正确一点。我们这里说的好看,不是弄一张网红脸那种好看,而是更抽象的 leadership,或者是影响人的能力。

木遥: 对,克里斯玛,这个词比较政治正确一点。不是单纯搞一个韩式半永久就可以搞定的,它需要一些更抽象的东西。但确实这个东西对 AI 来说是最困难的。因为说老实话,当你说我们应该提拔最聪明的,其实难道聪明不是也是一种类型上的生殖彩票吗?为什么?聪明作为天生的天赋作为评价人的标准就好像很合理,而皮囊也是一个 DNA 矩阵,就不合理?你仔细想想看,这件事其实也没什么必然性,它也是一个工业革命建构出来的观念。所以这个观念既然可以被建构出来,它也是可以被打破的。你没有理由认为 100 年后的人们仍然把聪明排在皮囊之前,因为它其实也没有什么特别本质的原因。所以,克里斯玛这个词会好一点,这个东西可能是如果你今天想自我改造,从自己身上做起,可能着手都比较有效的途径。锻炼自己的影响力,锻炼自己的沟通能力,锻炼自己 build 一个 team 的能力,锻炼自己,用美国人喜欢说的那套 MBA 的词 make things happen 的能力。这个东西可能仍然是真实的。所以我觉得第一个反而不是一个段子,它是一个确实存在的问题。

王磬: 现在听完了今天这 2 个小时的科普也好,解释也好,就是自己觉得确实我自己会需要更多的消化一下。我觉得不光是它作为这种技术上的基本的结构,也包括它可能会带来的一些这种社会上的影响。如果往深一点去想,它真的是会重塑社会的方方面面。我平时很少讲这个话,因为我觉得这是一个非常空的话。哪件事说白了,任何一个小的这种进步,它都有可能达到这样的一个目标。但是我在今天听了这 2 个小时之后,我确实会有这样的一个感觉。如果我稍微往深去想,它确实是会重塑我们社会的方方面面,从我们的工作,从我们休闲的方式,我们跟人打交道的这种方式,我们的教育,我们对于社会中什么样的角色是更有优先级的或者更本质的。我们作为人之所以为人的这种更存在主义的一些思考,我觉得它确实是一个非常非常值得去实时的关注、保持更新的一件事儿。最后我想问一下木遥老师,你个人有在为这一场变革的到来做一些个人层面的准备吗?

木遥: 我觉得我能够做的最目前来看最重要的事情就是,我得理解它发生了什么事情。即使我自己程序员出身,所以理解起来可能比一般人容易一点,我也仍然觉得要跟上每天新的东西的冲击是一个很困难的事情。真的太快了。这周二 ChatGPT4 发布的那一天,推特上有个段子说 3 月 14 号那天刚好是 π day,所以 Google 和 OpenAI 都推了新的东西出来。网上有段子说,2023 年 3 月 14 号是人工智能发生史上重要的一年,它的意思是,那一天发生的事情就像平常一年发生的事情一样。你想跟上这个速度是很困难的事情。所以我觉得我努力跟上,努力了解它的潜力,努力了解有什么事情可以自己上手去做,这也很困难。我也周围有很多朋友在做类似的事情,我们每天会交流有什么新的工具出来,这些东西可以试着用一下。它的好处是你真的很容易上手。以前你要一个心动技术出来了,你要把手头既有的东西放下去学它是有点心理障碍的。这东西只要你有点技术上的积累,要上手没有很困难。你可能找一个周末,花上 4 个小时,就可以做出很多很多东西出来了。这也不是开玩笑,GPT4 发布的时候,他照了自己纸上的草稿,交给 GPT。几秒钟之后就生成了一个网站出来。大家说 OK,你既然说得这么厉害,我来试试看。然后一夜之间,真的是一夜之间。Twitter 上就出现了用 GPT4 来做一个小游戏,用 GPT4 来做一个 APP,用 GPT4 来做一个互动性的服务。都出来了。这种时候,一方面会让你觉得焦虑,大家动作好快,一方面也会让你觉得有信心,因为你觉得好像也没有很困难,这么多人几个小时都做出来,我应该也可以。所以上手是比较容易的事情。积极地投入进去可能是我今天能做的最容易的事情。当然,你可能会问,我不会写程序,我连上手都不会怎么办?我也不知道。这不是一个很容易回答的问题,但是对我来说,跟上技术浪潮本身既有挑战性,但同时还挺有乐趣的。

王磬: 我问一个也许普通人也能够有一定参与感的问题。比如,如果作为一个不是特别有技术背景的人,想比较快的、比较及时的去跟上现在的一些信息,你有什么推荐的工具或者信源吗?

木遥:最简单的办法就是了解这样一个总规则。第一,这也是老生常谈了,少看简中社交媒体。一方面它有一个现实的信息壁垒的问题,大家都知道的问题,我们就不展开了。第二,反正简中大多数是转述,你还不如直接去看源头,只要你有看英文的社交媒体的能力和技术手段,你就应该直接去看源头,会比较快。第三,多看一线的资浅的但是活跃的工作人员的讨论,少看 big names 的讨论。因为越是功成名就的人,不是说他们的观点一定是错的或者落伍的,但他们不是在一线工作的。所以他们第一还未必有那些名不见经传的一线工作人员的知识来得更新。第二,他们会很容易受到他们既有成见的影响。比方我们大家都知道一个非常著名的人工智能专家,图灵奖获得者 Yann LeCun(燕乐存),他是一个非常重要的专家。但是他在过去几个月里面一直在连篇累牍地写为什么这东西不重要,或者这东西方向是错的。这是不是意味着他已经彻底被时代抛弃了?那也不一定,但是他确实有他的成见在,他觉得这个方向价值不如大家想象那么大。但是他最近好像渐渐也开始承认这个比他想象的要更有价值了。而这种错误,一线的研究人员是不容易犯的,而一线人员很多人是非常活跃的用社交媒体的。所以最简单的办法就是你去推上关注那些今天正在 Berkeley,今天正在 MIT,或者今天正在 OpenAI,今天正在 deep mind 做这个东西的人。他们很多人是保持非常活跃的社交媒体的曝光的。去关注他们,去看他们的讨论是最容易跟上浪潮的方法,而且他们会彼此争吵。你通过他们之间的争论,就能够更容易获得很多 insight。我觉得其实我们都在面对一个非常大的未知,而这个未知很可能会超越我们之前的未知。我们之前的未知会带来一种想象,而这个未知会带来一种恐慌。我承认这一点,而且我也非常理解这一点。但是我自己从我自己的社交媒体上的活动所后面收到的反馈,最大的感受是很多人仍然在用一种看热闹的方式来理解这件事情。他们可能会借机抒发一些焦虑,甚至借机抒发一些不满。比方,很多人会借机讨论为什么我们中文的语料不如英文的语料好,因为 blah blah。这些当然都是非常真实的情绪,但是有的时候会让你觉得很多人是在用一种情绪化的方式在看待这件事情。我们当然都知道今天的互联网本来就是这样,每件事情都显得像是一个 drama 一样,大家会用一种看热闹的方式来理解我们周围生活中的每个变革。但这件事情,我觉得它比一般意义上的表面的 drama 要更深入一点。所以它值得你去抛弃成见与抛弃膝跳反射式的情绪化反应,而去更仔细地理解一些事情,包括理解一些平常可能不会问自己的问题,比方说什么对你的人生来说是最重要的。**如果今天你对人生的理解被证明是要被推翻了,或者至少是要被潮水冲破了,你将以什么样的方式来重塑你对人生的观念?**或者再问的极端一点,这种问题一般人不会每天问自己,如果你今天可以选择你人生的一个 purpose,这个 purpose 会是什么才最让你觉得,即使你的工作被 AI 取代了,它也仍然能让你觉得你在这世界上安身立命是有意义的。

阅读关于 AI狂飙的时代,人还有价值吗? 的文章
来源 Saved@

卡片笔记实践

最近看了少楠推荐的《卡片笔记写作法》。

虽然听他提到过很多次,但内心还是觉得不就是一本工具书嘛,做为一个知识工作者这类书看太多了,往往是有启发但带来实质的改变不多。

但这次很惊喜的是《卡片笔记写作法》在只看到绪论部分时,就带给我很多颠覆性的观点。

读到后面更是发现,它将我之前知道的那些读书、做笔记方法和理念融合的非常好,它不再是一个工具,而是一个高效的流程和系统,并且是一个有可能改变我们人生成就的笔记写作流程。

废话不多说,开始了解这个神奇的笔记系统。

///

今天的这篇文字比较多,有 5000+字,在前面放个目录:

  1. 卢曼的开挂人生&卡片式笔记法的诞生
  2. 卡片笔记写作法的简单流程&进阶流程
  3. 工具推荐:Notion & flomo
  4. 最最最重要要是,形成总体工作流程
  5. 结语:简洁是最重要的原则

但请放心,主要是介绍的部分,挺好读的。

# 01. 卢曼的开挂人生&卡片式笔记法的诞生

(足够清楚这段经历的小伙伴可以跳过)

卢曼最早是一名德国的公务员,每天工作结束后,他就找借口回家,做自己最喜欢的事情——阅读和关注自己感兴趣的哲学、组织理论和社会学内容。

在做笔记的过程中,他意识到,一个想法、一条笔记只有在它的上下文语境中才有价值,而上下文并不一定是它的出处。

所以,他开始思考一个想法,那就是如何让笔记与不同的上下文相联系并起到相应的作用。

这张图生动的展示了信息连接的重要性。

他没有再将笔记添加到现有的类别或相应的文本中,而是将它们全部写在小纸片上,并在纸片的角上编号,然后将它们收集到卡片盒中。卡片盒成了他的对话伙伴、主要的创意来源和生产力引擎,对他组织和发展他的思想大有裨益。

此后,他的人生就像开了挂一样。

卢曼将盒子里的想法整理成手稿,交给了德国颇有影响力的社会学家赫尔穆特·舍尔斯基。

舍尔斯基把它带回家,读了这个学术外行写的东西后,很快跟卢曼联系,建议他到新成立的比勒菲尔德(Bielefeld)大学担任社会学教授。

这时候卢曼并不是一名社会学家。事实上在德国,卢曼甚至连做社会学教授助手的资格都没有 。但卢曼没有拒绝这个机会,反而是在卡片盒的帮助下,在不到一年的时间,就完成了博士论文和定职论文,这期间他还上了社会学的课。

不久后的 1968 年,卢曼就被选为比勒菲尔德大学的社会学教授,并且终身担任这一职位。

29 年半以后,卢曼完成了《社会的社会》这本分为两卷的大部头的最后一章,轰动了学术界。这是一个激进的新理论,不仅改变了社会学,而且激起了哲学、教育学、政治理论和心理学领域的热烈讨论。

30 年间,他出版了 58 本著作和数百篇文章(不包括译本),许多都成为各领域的经典之作。甚至在他去世之后,他办公室里留下的快完成的手稿被整理出来,又有六七本关于宗教、教育或政治等不同主题的书以他的署名出版。

这段卢曼的经历很重要,他的人生印证了卡片式笔记的重要价值。在后面我会说到,想要让卡片笔记写作法发挥它的威力,需要我们在整个阅读和写作的行为习惯上都配合它,只有了解到卡片式笔记写作的巨大价值,我们才会更愿意做出如此深入的改变。

Niklas Luhemann 一生的 24 个盒子

# 02. 卡片笔记写作法的简单流程:

考虑到有些读者看完书不知道怎么上手,这里我总结了一个简单流程:

1,平时学习的时候不只是阅读听课,一定还要多记录自己的想法(写的时候,先不去评判想法的好坏);

2,将摘抄和想法全部记录到一个笔记工具中,比如 flomo,且不做分类;

3,时不时回顾翻阅自己写过的知识卡片,发现关联的时候就将他们放到一块儿;

4,当一个主题的卡片积累多了,就尝试将它们串成一篇完整的具有洞见的文章。

卡片式笔记写作法就是这么简单,相比于传统的写作法,卢曼更强调在白纸上写作之前,我们应该做更充分的准备(写了大量相关的想法卡片)。

他认为输出一篇完整的文章,不应该在脑子里完成,我们的大脑特别不擅长这类线性的叙事,写文章(对一堆知识卡片整理编辑)应该是在纸上进行的。

另外,卡片笔记写作流程非常强调记录想法。

下面这张图大家肯定看过很多次了,但回想一下,你在学习的时候最多的状态是哪一种?

卡片笔记写作法就是这个理论最简单实现方式

再次看到这张图让我想起一位朋友,他很喜欢阅读,时不时就会发我一些好的文章。

有次见面我就问他,你刚才发我的那篇文章讲了什么?它好在哪里?朋友努力的想了半天,才发现自己刚看过就不记得文章讲了些什么了,只能说出一些大概的关键词。

学习金字塔中说的阅读是比较专注状态下的阅读,我很怀疑,平时在手机上阅读的时候学习的留存率能否有 5% 。

但是卡片笔记写作使用的方法(其实就是著名的费曼技巧的运用),能让学习效率提升到 50%以上。

也就是说我们只需要使用一个简单的技巧,每次学习完用几分钟的时间,就可以使我们的效率提升 10 倍不止。

在这个需要终生学习的时代,日积月累,是多么夸张的一个优势啊。

◎ 重点强调

多记录自己的想法,试着每天都写几张卡片。

不用分类、不要管是不是写的好、不用管以后怎么用,将当下的想法写成卡片即可。信赖卡片笔记写作法的流程会让你的想法变成金子。

# 03. 进阶流程:融入知识工作者的心得技巧

所谓进阶其实基本流程是一样的,只不过因为我每天大量都是在处做知识相关的工作,会有一些心得技巧可以很好地融入流程当中。

你要是看了有感觉也可以试着融入自己的流程。

# 1,临时笔记:边学习边记录重点

这一步我相信很多读者平时都有在做,我就只分享一些让做这件事更轻松愉悦的小技巧:

◎ 如果听课内容比较简单,通常我会边听边写完整的想法卡片。每次记一大堆笔记事后整理也是一个很重的负担,直接当堂整理完清清爽爽的,会让这次学习体验非常愉悦。

◎ 如果遇到比较困难的内容,就只需要先将重点记录下来,把理解的工作放到后面来做。 这样会大大减低我们的畏难心理,可以让我们在学习困难内容的时候更轻松更有乐趣。

这就是流程的好处,可以讲将一件事情放到最适合的时候去做,让本来困难的事情变得轻松。

◎ 信赖自己的感觉,专注于那些让你有很多思考的知识。不要总担心错过重要的知识,于是硬着头皮去啃很多自己还没有体验的知识。

现在每天好的知识应接不暇,挑自己正需要的学习就好(学起来特别快),其它的如果真正重要以后总会有机会遇见的。

◎ 很推荐用电脑在网页端用微信读书阅读书籍,在电脑上可以直接将有感觉的摘抄复制到笔记软件中,这样书看完就可以直接把书扔了,对着有摘抄写想法就行,这样阅读一本书特别轻松。

# 2,文献笔记:用自己的语言翻译原材料

文献笔记要非常简短,精心选择,并使用自己语言记录,对引文要格外挑剔,不要只是抄写,而不去真正理解其含义。

如果你想真正理解某件事情,你就必须把它转化为自己的语言。思考既要在自己的脑子里进行,也要在纸上进行。

如果有一件事是专家们一致同意的,那就是你必须将你的想法外显化,必须把它们写下来。理查德·费曼和本杰明·富兰克林同样强调这一点。

《卡片笔记写作法》非常强调用自己的语言再表达一遍,这是让学习效率飙升的关键。而文献笔记在卡片笔记写作流程中的定位,是一个帮助我们理解和把握文本的工具。

以前我总是阅读大量的文章、书籍、材料,笔记软件也放了很多很多摘抄。但我作为一个写作 5 年的公号博主,可以说 95%的摘抄都只是摘抄,它们再也没有出现过在我的思考和文章里。

下次,在大家摘抄之后,放入文献笔记之前,请在摘抄后面用你自己的语言翻译一遍,这会迫使你充分读透刚刚摘抄的文字,并且让你下次需要用到的时候更快记起并使用。

我会在处理临时笔记的时候,会反问自己一个问题,这段话或者这个章节讲了些什么?然后用总结和复述的语气写出来,如果熟练的话,可以想象要把新看到的这个知识讲给别人听的状态。

这个步骤的初期更推荐自由写作,就是想到什么写什么,想到多少写多少。想到的多就多写点,没什么想法的时候也可以不写。想要坚持做一件事情就一定要让这件事变得快乐。

关于快乐的自由写作,推荐一本很好读的书《写出我心》,我之前也写过详细介绍的文章:推荐一种很爽的写作方法

# 3,永久笔记:将要进行写作或者深度思考的主题

仔细阅读你在第一步或第二步所做的笔记,并思考它们与你自己的研究、思考或兴趣所在的相关内容有何关联。永久笔记不是为了收集,而是为了衍生想法、论点和讨论。

对于用自己语言翻译过一遍的文献笔记,我自己有几种处理方式:

1.只是觉得自己增加了一部分新知,并没有更多的想法。那就保存到文献笔记中,设定好关键词方便要找的时候找得到;

2.有更多的想法,就把想法写下来,然后想想有没有和之前永久笔记盒中的主题有关联,有的话就放到那个主题下面。

3.没有的话,就建立一个新的主题(序列),将想法放入其中,期待后续有更多想法加入进来。

这样,我们就会在永久笔记盒中有了很多主题,这些主题都还缺少材料,不用现在就着急将他们补充完整,而是在后续的阅读中,不断按照流程一步步做下去,让永久笔记盒中的笔记越来越多、越来越完整。

直到某一次再次添加永久笔记的时候,突然发现有一条清晰的叙事线出来了,这时候只需要将相关的材料复制到自己熟悉的编辑器中,对文本进行编辑优化,最终产出一篇优秀的文章。

最后,整个流程看起来好像笔记很复杂很累,但其实用到的都是我们常用的学习习惯和工具,所以稍微适应之后很容易上手和变得顺手,每次学习的时候都会真自然地一路做下来。

卡片笔记写作法最牛掰的地方就在于,只要坚持这个刻意练习,就可以不断的“自动”输出很多完整的具有洞见的文章。

这种正反馈反过来会激励我们更多的记录自己的想法,这才是一套高效的系统。

永久卡片笔记样式@Introduction to the Zettelkasten

◎ 温馨提示

初期最好是在精神状态好的时候做以上流程,尤其是思考和写的部分。

我前几天晚上 21 点多听完少楠的直播分享,听的很有感觉但当时我有点累,只能勉强记下几个关键词。然而第二天早晨的时候,想到昨天学习到的一些概念和观点,一口气写了 2000 多字。

真的,想法枯竭的时候就去玩耍和休息吧!

# 04. 工具推荐:Notion & flomo

很认同书中的一句话:工具是为了让事情更简单而不是变得更复杂。

所以,这方面大家只需要根据自己的习惯来就好了,尤其是有双链功能的 Notion 和 Obsidian 这种使用难度比较高的,在没有熟练之前只会成为麻烦,新手不推荐使用。

flomo也是今年用的爱不释手的轻量化笔记,Notion 适合放有主题的内容,而 flomo 非常适合用来存放各种突发奇想。也不知道以后会不会用到,但都是矿,说不定哪天挖出来就是宝藏。

这种极放松极自由表达的感觉真的只有 flomo 能带来,这就是产品的气质赋予的,在这个无比焦虑的时代很难得。

任何超过 2 天没有去动过的笔记我都会第一时间把它删掉或者存到 Notion 中,不让暂时没有灵感和积累的文字影响我思考,留下的都是我有把握可以写出新思考的文字。

Notion是我今年开始弃印象笔记后启用的笔记软件,非常适合用存放需要长期保存的笔记,并且自带简单的引用系统,目前够用,期待以后能有插件可以实现更多可视化的功能。

Notion 笔记初期觉得很难用很嫌弃,后期觉得很亮眼,其背后的思路远优于其它笔记软件。(虽然还是很不爽 Notion 中的某些细节)

可以切换到列表视图后按标签检索

# 05. 最最最重要要是,形成总体工作流程

准确的说,卡片笔记法不是一种做笔记的技巧,更不是笔记收纳盒,而是一个帮助我们深度思考和写作输出的高效流程。

我上面卡片式笔记的方法和工具写的非常详细,以至于有点啰嗦的程度,但这很重要,这些都是我在将卡片式写作融入我的写作习惯当中。

只有当所有相关的工作都相互衔接成为一个整体,所有的瓶颈都被消除、并且每个环节都能相互促进时,卡片式写作开挂般的能力才会显现。

这种二阶效应,在书中用的是麦克莱恩集装箱改变世界的案例,这个案例在罗辑思维的第 84 期《集装箱改变世界》中有详细讲述,非常精彩。

毫不客气的说,我们能享受全球化的红利很大程度上仰仗于集装箱的货运流程。

但其实集装箱的发明是早就有了的,直到麦克莱恩做出了大量的努力,推动码头工人、推动整个产业链上下游的企业、从出货的仓库、工人、运送的货车、港口码头、轮船,都为集装箱货运做出优化,才使得效率有这么惊人的提升,才能让国际货运成本直接降低了 95%的程度。

卡片式笔记的巨大价值,同样需要我们将这个流程贯彻到我们日常的各种行为当中。

我虽然很早就意识到工作流的重要性,但只注意到了建立流程,忽视了将流程中的各种摩擦消除,也没有改变自己整个工作习惯来配合这套工作流, 所以之前的工作流并没有给我带来多大的价值。

在这本书多次强调下,我才突然意识到这点,瞬间清醒,也因此在这里也特别强调配合流程做出改变以及消除流程中的所有摩擦的重要性。

什么时候算是卡片式写作流程成功?

就看你有没有开始非常轻松愉悦的完成流程中的每个环节,并且能源源不断自发涌现各种成型的文章主题。轻松输出文章的同时,这种正反馈反过来激励你写下更多笔记。

# 写在最后:

书中还有很多惊艳的理论,比如不要自己费力,拼命消耗意志力去做事,这样是不长久的,要让让工作推动你前进。(第二章第四节)

还有,不同的任务需要不同的关注度、在兴趣的驱动下完成任务、放弃做计划才能成为专家、培养抓住要点的能力……

这些重要的法则和我最近的很多思考神同步,在以后的更新中会不断分享。

最后的最后,不要被前面复杂的讲述吓到,卡片式写作是一个强调简单为重要哲学的方法。

现在,你只需要在理解上面基础流程之后,开始每天写 3 条或者 6 条笔记卡片,并收纳到自己的笔记卡片工具当中关联起来就可以了。

我自己也需要用更长的时间,来践行和检验卡片式笔记,希望过一段时间我能分享关于卡片式笔记更深的思考,我们下期再见~

# Reference

1.《卡片笔记写作法:如何实现从阅读到写作》(德)申克·阿伦斯(Sönke Ahrens);

2.什么是 Zettelkasten 卡片盒笔记法?- 土嗨英语的回答 - 知乎 https://www.zhihu.com/question/384309878/answer/1120682799

3.罗辑思维第 84 期:改变世界的箱子:https://m.igetget.com/share/course/article?id=RQLYWyjMZoa0J1y6dJp4wvzDbO26Bq >

阅读关于 卡片笔记实践 的文章
胡九思 Published@

重新发现 1969 年的知识生产术:读《智识的生产技术》 - 少数派

重新发现 1969 年的知识生产术:读《智识的生产技术》

我曾是那条教育传送带上的一件「标准」产品。

每天按时接收封装整齐的知识包裹,熟练地将它们拆解、背诵、重组为试卷上的标准答案。 直到一个深夜,当我往脑子里硬塞第 N 个信息点时,我感到一阵眩晕。

可怕的是所有人都染上了同一种病。明明书架上堆满好书,我们的眼睛却只会盯着重点符号 打转。老师把知识剁成方便消化的小块,我们就乖乖坐在课桌前,像等着喂食的小动物。时 间久了,连自己找食的本能都退化了。

最要命的是思维生了锈。十几年听课、记笔记、考试的死循环,让我们形成了条件反射:看 到新知识就自动启动背诵模式,却关掉了思考的开关。等到毕业那天,突然置身知识旷野, 很多人连怎么迈步都忘了——手里握着老师给的指南,却找不到自己的方向。

当我翻开《智识的生产技术》时,震撼于这位先知般的学者如何在上世纪 60 年代,就精准 预言了数字时代的信息困境。彼时个人电脑尚未普及,这位日本学者构建的知识生产体系, 不仅开创了日本信息化管理的先河,更暗合了当代认知科学的最新发现。

为了突破传统学习方式的局限,让我们从最基础的阅读方法入手,探索这套系统的具体应用 。

萌芽:阅读的艺术

梅棹忠夫主张通读全书。他认为只有这样,才能真正理解作者的意图。

起初,我误读了他的本意,以至于在两者之间摇摆不定:全盘接受通读,或者完全拒绝它? 后来我发现,他的阅读哲学是在强调灵活取舍:对于需要深度理解的著作,他主张通读全书 以把握作者的完整逻辑框架;而对纯粹消遣的阅读,则不必拘泥于逐页推进。

比如,我在读《社会心理学》教材时,会按顺序梳理每个理论的发展脉络;但读东野圭吾的 推理小说时,常常忍不住先翻到结尾看凶手是谁。

阅读的节奏

梅棹忠夫的阅读法中,有一个非常重要的策略,那就是「阅读节奏」。他建议根据书籍特点 和个人状态来调整阅读速度,避免过度疲劳。

「一鼓作气」是他提出的核心概念,可惜并未在书中详细解释。我补充一下个人理解:它指 的是在短时间内,集中精力读完一本书,保持思维的连贯性。这种方法适用于篇幅适中、难 度中等的书籍,通常需要在 2 到 3 小时内完成。超过三天,连续性就会被打断。

但不是所有书都适合这样读。对于难度较大的书籍,梅棹忠夫建议搭配阅读。在读专业书时 ,可以同时读一些轻松的内容。

许多朋友每次只读一本书,虽说个人习惯不好妄加评判,但我不提倡这么做。书籍难度低些 还好,若是书籍难度太大,岂不是一旦卡壳就难以继续推进?说不定过几天书都懒得拿了。 而面对高深巨著时,我会启动「ABN 模式」:难书 A + 简单书 B + 消遣书 N。比如,在阅 读卡尔 · 萨根的《宇宙》时,我就配合观看了同名纪录片,还读了《极简宇宙史》和三岛 由纪夫的《鲜花盛开的森林》。

在思考这种做法的时候,我发现**「一鼓作气」还可以用在作者身上。**当你对某个作家产 生兴趣时,不妨一口气读完他的多个作品。这样能发现作品间的联系,理解作者思想的演变 。结合作者的生平,你甚至能看到现实生活在作品中的影子。我曾这样读完伍尔夫和三岛由 纪夫的作品,也读了大部分苏珊·桑塔格的书。

想一想,你有类似体验吗?

阅读的流程

梅棹忠夫的阅读流程相对简单,核心就在于反复梳理与思考:

  1. 读书时标记重点:不要过多摘抄,而是用简要标记来记录。类似于 Antinet 系统 中的「观察笔记」;
  2. 通读全书:阅读时,快速通读整本书,了解全书脉络;
  3. 书后笔记:全书通读完后,把部分重要标记重写为笔记。梅棹忠夫通常写 3-30 张 卡片。

很简单,不是吗?似乎每一个步骤你都知道。 然而,重点从来都不是流程和方式,而是 思考的过程。

阅读的方法

阅读不仅是被动地接收信息,更是一种主动的思维创造过程。

梅棹忠夫提出了三种阅读方法:堆读、双重读书和创造性读书,非常值得分享出来。

梅棹忠夫的阅读方法

堆读的核心,其实是暂时放下读过的书,不急于马上整理和消化,而是让它们「静置」 在视线范围内。我常常会把最近看完的几本书堆在桌子的一角,大概五六本,有时甚至更久 地让它们呆在那儿。这种状态很有趣——书没动,但我的思维在暗暗地酝酿。当我偶尔随手翻 开它们时,总能在曾经标记过的地方发现新的感悟,甚至是某些被我当时忽略的细节。那种 「静置」 后的冷静和距离感,会让我用一种全新的视角去重新理解书里的内容。

双重读书则是一种让阅读更有层次感的方式。梅棹忠夫提倡在书中同时标记「重要」和 「有趣」的部分。这种做法非常贴合我的阅读习惯。我一般会在重要的地方摘抄下来,比如 那些代表核心观点或逻辑框架的内容,而对有趣的部分,我会直接在旁边批注或者写评论。

有趣的东西往往和我的直觉或情绪挂钩,比如最近读到一本书时,作者提到「热门的东西不 一定赚钱」,这让我一下子意识到自己对热门和价值的简单关联是多么狭隘。当下,我标记 了这句话,还写下了自己的感想:赚钱可能更多需要冷静的判断和精准的选择,而不是盲目 追随潮流。有趣的地方总是能让我停下来思考,而那些重要的框架则会成为我进一步验证和 探索的依据。

创造性读书是三者中最让我受益的,也是最具有挑战性的一种。梅棹忠夫认为,阅读不 只是吸收信息,而是通过书本激发出新的思考和创造。恰好,Antinet 也在反复强调输出的 重要性,因此我开始更加注重反思书中内容,而不是单纯摘抄。

比如在阅读 Antinet 相关书籍时,我深入研究了卢曼编码,学习了书写笔记和思考的方式 ,最终写出了一篇近两万字的书评(见上一篇文章)。这种阅读方式特别有趣,因为它让我 在思考时,不断发现生活中的联系。

还有一次,朋友问我 「婚姻是喜欢重要还是合适重要」,我其实没太想明白,总是觉得很 混沌。然而有一天,在阅读「长期主义」 和「副业」的两个笔记时,我突然意识到:世界 上许多看似二元对立的问题,其实都可以从更高维度去重新审视。这两份笔记的记录相隔 59 天,而与朋友的对话穿插其间,没成想它们有一天被连接在一起——创造的快乐霎那绽放 !

借助这三种阅读方法,读书不再只是完成某个既定的目标,而是一个不断发现、反思和重构 的过程。这种感觉很好,它让我觉得自己不是在被书牵着走,而是通过阅读主动建构属于自 己的知识世界。

在掌握了深度阅读方法后,我们面临的下一个挑战是: 如何将获取的知识转化为个人的 智慧资产? 这就需要借助一个强大的工具——卡片系统。

生根:卡片系统的构建

载体:京大型卡片

梅棹忠夫的卡片规格有着明确的设计理念:

  • 大小:B6(12.8cm x 18.2cm);
  • 纸张:105g 图画纸(反面书写)。不可太厚或太薄,要吸墨快;
  • 细节:淡蓝色行。1cm 间距书写:单面书写;
  • 封皮:硬质塑料板。胶带缠紧;
  • 日期:左下角标注;
  • 系列卡片号:同一事项有多张卡片。3/8(8 张中的第 3 张)。

京大型卡片原书示例

那么,他是如何发现这种卡片的?

从灵感到系统

这个故事要从梅棹忠夫的高中时代说起。当时的他读到达芬奇有个特别的习惯:随时随地记 录观察和灵感。和诸多朋友一起,他开始模仿起写笔记的习惯。

但这个看似完美的记录方式却藏着令人烦恼的缺陷:翻页麻烦,内容难整理,重要发现容易 被时间的长河冲散。梅棹在实践中不断思考改进方案,他尝试过活页本,却又被脆弱的纸张 打败。

直到有一天,灵光乍现!

他突然意识到:与其被记事本的形式束缚,为什么不把每个想法都写在独立的卡片上呢?卡 片更结实,可以自由组合,想法可以随时「跳出框架」。

这个简单的转变带来了惊人的效果。在蒙古的田野调查中,梅棹用卡片记录的方式大大提升 了研究效率,很快就完成了几篇重要论文。这种方法不仅让同行惊叹,更在学术圈掀起了一 场研究方法的革新。

从田野调查到百科全书研究,梅棹的卡片法展现出越来越强大的生命力。他明白了:卡片不 只是记录工具,更是一种能够承载任何知识、不断进化的思维系统。

卡片何以承载思维

或许通过梅棹忠夫的亲身实践,你已经领悟到卡片法的价值:它确实是承载信息的最佳方式 。那么,为什么卡片如此有效呢?

卡片不仅是一种简单的记录工具,它背后深藏着深刻的认知科学原理。

这一部分涉及较多理论内容,如果不感兴趣可以跳过。

信息组块:拆解复杂为简单

米勒在 1956 年提出的 「神奇数字七」 理论 1 揭示了一个令人沮丧的事实——我们的认知 能力有限,大脑一次只能处理约 7 个信息单元(±2)。你是否曾经尝试在短短几天内消化 一门全新的复杂学科,却被庞杂的信息量压得喘不过气?事实上,这并不是能力的问题,而 是我们在与大脑的天生局限做斗争。

信息组块的作用,正是帮助我们突破这种局限。通过将零散的知识点重新组织成更大的 「组块」,我们不仅能更高效地消化信息,还能打破认知的边界。这就像初学者学习象棋时 ,面对眼花缭乱的棋盘感到不知所措;但经过长时间的训练后,他能将棋盘上的所有棋子归 纳成有机整体,从而快速做出判断。卡片笔记的核心便在于此——通过拆解和重组信息,使它 们不再零散、碎片化,而是形成一个关联性强的知识体系。

举个例子,如果你试图一口气读完《资本论》,很可能会被其中庞大的理论框架和复杂的语 言压得头昏脑胀。可要是你将书中的核心概念——如商品的二重性、剩余价值等——分解为一张 张单独的卡片,你会发现原本复杂的内容变得易于消化。

生成效应:激活知识生命力

你有没有注意到,当你亲自 「生成」 知识时,它总比单纯接受来的内容更容易记住?1978 年,心理学家 Slamecka 和 Graf 通过实验发现 2,参与者主动生成单词时,记忆效果明显 优于直接看到完整单词的人。这个现象被称为「生成效应」。其背后的原理既简单又深刻—— 我们在大脑中生成的内容,不仅能更深刻地与其他信息建立联系,还能激活大脑中的更高层 次认知网络。

卡片笔记法正是利用了这一点。在记录卡片时,你通常不会照搬原文,而是倾向于用自己的 语言进行改写。通过这种 「生成」 的过程,知识不再是简单的复制,而是经过深思熟虑的 重构。

试想,你在记忆光合作用时,如果只是简单地复述 「光合作用的定义」,那无异于在学习 过程中进行机械输入。而如果你将其转化为一个问题:「为什么缺少阳光、水和二氧化碳, 绿色植物就会死亡?这三者如何共同作用,维持生命?」 你不仅在 「生成」 信息,还激 活了自己的思考能力,使知识变得更加生动、立体。这种转化与重构,正是加深记忆的关键 所在。后续研究表明,主动生成的效果,甚至能持续一周以上。

信息组块生成效应结合时,卡片笔记法的优势便愈加明显。它不仅帮助我们高 效整理信息,更通过主动生成过程让记忆和理解变得更加深刻。你可以将复杂的概念分解为 几个核心维度,每个维度制作一张卡片,并通过索引系统将它们关联起来,形成一个庞大的 知识体系。这不仅仅是组织信息,更是通过知识的连接和重构,让我们对知识产生更深的思 考和领悟。

当然,卡片笔记法并非万能,它最大的缺陷在于可能带来过度的碎片化。如果我们只关注每 张卡片的独立性,而忽略它们之间的联系和背后的理论基础,就可能难以形成一个完整的知 识体系。因此,卡片笔记更适合作为支撑深度理解的工具,而不是单纯的「记忆工具」。它 帮助我们找回对知识的控制感,但真正的智慧,依然来源于我们的不断探索和整合。

成长:从输入到输出

掌握了基础原理后,下一个挑战在于:如何将这些零散的知识片段转化为有价值的成果?梅 棹忠夫为我们提供了一个清晰而实用的流程。

梅棹忠夫写卡流程

第一步是准备卡片。梅棹忠夫使用的是京大型卡片,卡片上只标注日期和主题,书写内容简 洁直接。这些卡片的目的是快速记录灵感,因此,过分追求完美的表达,反而可能会拖慢思 维的敏捷度。

第二步是快速写卡。当灵感闪现时,立刻将其记录下来,不必纠结顺序,也不需要为了格式 或语言优美而犹豫不决。遵循 「一卡一事」 的原则,把每一件事情简明扼要地写在卡片上 ,捕捉那一瞬间的闪光点。我自己在使用类似方法时,常常发现,越是轻松随意的记录,越 能激发后续的深度思考。那些 「未完成」 的片段,反而往往更具启发性。

第三步是盘活卡片。梅棹忠夫的妙处在于,他不仅仅是记录信息,而是通过重新排列和组合 ,让卡片之间建立起新的联系。这些联系,可能是逻辑上的递进,也可能是主题上的交织, 甚至是两条看似完全不同的思路在偶然碰撞中迸发出的火花。

第四步是润色成文。通过卡片提供的线索,进一步查找资料,填补那些模糊的部分,最终将 卡片整合为一篇完整的文章。

然而,卡片法的魅力不仅仅体现在这些步骤,更在于它背后的灵活性。卡片并非死板的分类 工具,如果仅仅用来存储信息,任何一本笔记本也能胜任。它的核心价值在于「活用」:让 知识在不断的排列、组合与碰撞中,焕发出新的意义。我们有时过于执着于将卡片进行「归 类」,将它们强行塞进一个严密的体系,然而这样的分类反而可能成为一种桎梏。与其追求 客观的分类标准,我更倾向于按照个人兴趣与直觉来安排卡片,让它们真正为我的思维服务 。

印象最深的是:有一次整理关于 「长期主义」 的卡片时,突然发现几张卡片可以与 「短 期行动」 相关联。两种看似对立的概念,通过排列组合后,促成了更高维度的理解。那一 刻的顿悟最迷人,更给了我极大的成就感。

开花:思维方式的蜕变

当我们真正掌握这套方法时,会发现最大的收获并非知识的简单积累,而是思维方式的深刻 蜕变。

从 「假知道」 到「真知道」

许多方法看似 「显而易见」 甚至 「基础」,但真相是:很多人都以为自己掌握了知识, 实则停留在「假知道」 的层面。

他以卡片为例证明了这一观点:「卡片的价值,不在于存储多少信息,而在于通过反复翻阅 、整理、组合,激发新的思维火花。」我们做笔记、整理资料时,往往只求记住信息、归类 内容,却忽略了它们的真正意义。

「假知道」仅仅是对表象的理解,而 「真知道」 则是通过反复实践、反思和重组,最终催 生出全新的见解和深层认知。细读梅棹忠夫的文字,我发现了一条认知进阶的轨迹:他 如何在知识管理的道路上不断精进,又如何将个人的积累,升华为足以启迪后人的智慧?

他如何发现问题,如何创造答案

梅棹忠夫擅长观察,总能敏锐地识别出潜在的挑战。

梅棹忠夫思考之道

在求学期间,他观察到一个有趣的现象:无论是哪门课程,老师们都热衷于传授专业知识, 却很少教导学生如何高效地获取与处理这些知识。那些看似基础的能力——做笔记、整理资料 、撰写文章,往往被视作学生应当 「自然而然」 掌握的技能。然而,现实是,绝大多数人 却在这些方面效率低下。

梅棹忠夫并未止步于观察与抱怨,而是通过深入思考,发现这一问题不仅困扰着学生,更是 整个社会面临的共同难题。从学校到职场,从个人到组织,大家都在为信息整理与知识表达 而感到困惑。他逐渐意识到,这些看似零散的困扰,实际上隐藏着一个系统性挑战——我们缺 乏一个高效且系统的知识框架。

在探索解决方案时,他展现出独特的跨域思维。比如在探索文件整理方法时,他跳出传统档 案管理的思维定式,从可儿藤吉的抽印本整理法中获得启发。这种看似不相关的联系,在他 的思维中产生奇妙的化学反应,最终促成了直立式文件归档法和敞开式文件系统的诞生。

梅棹忠夫的创新,正是来源于这种深入的思考:通过观察日常困扰,对比不同方案,再通过 实践不断调整、优化。

在实践中,梅棹忠夫展现出难得的耐心和系统性思维。他不满足于想到什么就试什么,而是 建立了一个完整的实践 - 反思 - 理论循环。以使用卡片为例,他最初只是按常规方式记录 和分类。但持续观察和思考过后,他发现卡片的价值不仅在于存储信息,更在于通过反复翻 阅和重新组合,激发新的火花。这个发现让他对卡片的使用方式产生了全新的理解,并据此 调整了操作方法。

我们最后来用图片回顾整个过程:

梅棹忠夫的思考模式

结语

表面上看,梅棹忠夫在教我们如何管理知识。实际上,他展示了知识工作者应具备的核心能 力:如何发现真问题,如何突破思维定式找到解决方案,如何将经验提炼为智慧。正如梅棹 忠夫所说:「一件事情,如果连它的利用方法都没有确定,那么,它是无论如何也不会长久 持续的。」

藏而不用,毫无意义。

六十余载岁月尘封,书中那些工具与方法或许已被时代的浪潮悄然淹没,显得陈旧。但作者 在字里行间所闪耀的思想光芒,以及背后蕴藏的卓越思维能力,却如熠熠星辰,永不褪色。

或许有些人会觉得此书尚浅,不值一提。然而,随着阅读的深入,我惊觉自己已然告别了往 昔那种浅尝辄止、随意评判的阅读模式,不再是走马观花般「阅过即焚」。在书中,我找到 了一片可以尽情探索的天地,让文字不再是冰冷的符号,而是能够流淌进血液的活水。

三人行,必有我师——我在阅读里明白了这句古语。

> 关注  少数派小红书, 感受精彩数字生活 🍃

> 实用、好用的 正版软件,少数派为你呈现 🚀

© 本文著作权归作者所有,并授权少数派独家使用,未经少数派许可,不得转载使用。

阅读关于 重新发现 1969 年的知识生产术:读《智识的生产技术》 - 少数派 的文章
Bekir Çankaya Published@

How to Extend GitHub Copilot Context for RAG

After watching GitHub Universe 2024 presentations, I decided to explore and test some of the new features. While it works great in VSCode, I wanted to dig deeper into its background. Specifically, I aimed to explore whether I could enhance its context capabilities without relying on additional plugins or programs. In this post, I’ll share my somewhat scattered notes on experimenting with the context of GitHub Copilot in VSCode.

Environment Setup:

  • VSCode Version: 1.95.2
  • Copilot Version: v1.245.0
  • Copilot Chat Version: v0.23.2024102903 (pre-release)

In VSCode, I frequently use the @workspace symbol while working with Copilot. This allows Copilot to index all files within the workspace (except those ignored in .gitignore).

What Happens When You Ask a Question?

  • The question is converted into an embedding vector.
  • This vector is compared to the pre-generated embeddings of your project files.
  • The closest matches are retrieved and sent along with your question to the LLM.

This approach is known as Retrieval-Augmented Generation (RAG).

Get Bekir Çankaya’s stories in your inbox

Join Medium for free to get updates from this writer.

Advantages of This Approach:

  • Speed and Efficiency: In large file archives, this method is significantly faster than traditional keyword-based searches.
  • Semantic Search: Embeddings allow for context-based retrieval, not just keyword matches. For instance, asking about “AI technologies” might surface files containing “artificial intelligence.”

Notes:

  • To begin indexing, type ‘Build local workspace index’ into the command palette (⇧⌘P). Even if you do not run this command, the indexing process starts when you ask a question starting with the @workspace symbol in chat.
  • To view logs, go to the Command Palette and select Output: Show Output Channels, then choose GitHub Copilot Chat. You can see more logs by clicking the settings button in the top right corner and selecting Trace.
  • It’s essential to execute the “developer: reload window” command when adding a file to .gitignore or removing a directory from the workspace.
  • For simultaneous use of different folders in the same chat, you can add different folders with the “Add folder to workspace” command.
  • Typing Build local workspace index in the command palette (⇧⌘P) might return: “Could not build local workspace index. @workspace’s indexing currently is limited to 2000 files. Found 2504 potential files to index in the workspace. A sparse local index will be used to answer questions instead.”
    If there are too many files, indexing won’t occur, and just the IDE’s indexing will be used, potentially leading to poorer answers. To overcome this, you can alter the plugin code.
    Edit the getAutoIndexFileCap and getManualIndexFileCap functions in the extension file, /Users/{computerUserName}/.vscode/extensions/github.copilot-chat-{version}/dist/extension.js by replacing their contents with return 3000 and return 4e3. The value 2e3 is in scientific notation, equating to 2000.
  • On Windows, the extension file path is: C:\Users\\{computerUserName}\\.vscode\extensions\github.copilot-chat-{version}\dist\extension.js
  • After modifying the extension file, run the window reload command or restart extension host command.
  • Since the extension code is minimized, using [js-beautify](https://github.com/beautifier/js-beautify) can improve readability when inspecting the code.
  • I inserted console.log() at places in the extension code I wanted to monitor. Open the console with the Toggle Developer Tools command and follow the logs from there.
  • Given that my computer has 8 cores, I changed parallelism: 2 to parallelism: 8, but I haven’t measured any impact on performance.
  • Upon asking questions while indexing isn’t complete, a warning appears: “Still building the workspace index, response may be less accurate.”
    This indicates the usage of a local index (maybe IDE’s index).
  • Cache files on my Mac are saved to /Users/{computerUserName}/Library/Application Support/Code/User/workspaceStorage/{workspaceId}/GitHub.copilot-chat/workspaceEmbeddingsCache-text-embedding-3-small512.json.
  • A workspaceEmbeddingsCache file of maximum size 31.9 MB is generated, though I’m unsure of the reason and specifics behind this limit. Excess files might generate unhealthy data. To increase the limit, I incremented the max: 5e3 when creating the _embeddingsCache value. I modified it to 20e3.
  • In sizable projects, a timeout error arises while searching in context. Hence, I changed this.shouldSearchTimeout from !0 to !1 in the extension file.
  • I experimented with using symbolic links to index files with Copilot without transferring them to the project, but Copilot didn’t recognize them.
  • We have the ability to index our repositories on GitHub and use them as context, but there are certain limitations.
  • I couldn’t find a file listing indexed items. Instead, I reviewed the references sent during the chat.
  • We can use cmd+enter to submit questions without explicitly typing @workspace.
  • We can navigate through previously asked questions using the up/down arrow keys.

I honestly don’t know what caused the removal of these restrictions, I just changed the allowed parts and learned information I didn’t know before. I hope it is useful information for those who read it.

Sources:

阅读关于 How to Extend GitHub Copilot Context for RAG 的文章
Madeleine Gross Published@

A key part of creativity is picking up on what others overlook | Psyche Ideas

Abstract painting of a river with geometric, brightly coloured buildings and trees on the riverbank and a bridge in the background

Have you ever wondered why creative individuals seem to spot things that others miss? Whether it’s an inventor who finds an innovative solution to a familiar problem or an artist who reinterprets a landscape in a fresh way, many creative people have a special ability to find significance even in the mundane. Research suggests this isn’t just a coincidence: differences in the way someone’s brain prioritises information might actually fuel creative thinking.

Let’s consider how your brain prioritises information in everyday contexts. Every time you open your eyes, you’re flooded with visual information – way more than your brain can handle at once. Yet you aren’t overwhelmed, thanks to sophisticated attention mechanisms that filter out unnecessary stuff. These mechanisms typically prioritise information based on how important, valuable, surprising or relevant it seems. For example, you might be admiring some ripe pomegranates in a tree (a valuable resource), but if a snake suddenly slithers down the bough, your attention will snap to the snake because its presence is far more urgent. Evolution has fine-tuned this process to ensure we react quickly and appropriately to the most critical information; this may be a valuable resource in one moment (eg, pomegranates) but a dangerous obstacle the next (eg, snakes). As a result, people tend to notice similar things in their environment. But there are some intriguing differences in what captures each person’s attention. That’s where our research comes in.

My work explores the ways in which creative individuals prioritise information differently to their less creative counterparts. In one of our studies, my research collaborators and I used a classic task to see how the brain responds to another type of high priority information: surprising information. Participants listened to mostly repetitive auditory tones with the occasional rare – or ‘oddball’ – tone, while their brain activity was recorded using an electroencephalogram. Typically, individuals’ brains respond to the rare stimulus with a well-defined spike in neural activity, known as the P300, which indicates surprise. But for creative individuals? We find this spike is less pronounced.

In other words, it seems that creative people don’t see unusual information as quite so unusual. This may offer a big advantage for creative thinking because it blurs the line between what’s typical and atypical, allowing unusual ideas to be considered – and ensuring that the most obvious parts of a problem do not take up all the attention.

**The idea that creativity and attention **are linked isn’t new. Research has long shown connections between creativity and different types of attention, including links to ADHD, broad or unfocused attention, and so-called ‘leaky’ attention – that is, a less efficient attentional filter, through which irrelevant information is able to ‘leak’ into focus. Our research is suggesting that these differences in attention may come down to variations in how our brains prioritise sensory data – a dopamine-driven process called ‘incentive salience attribution’.

Incentive salience attribution is the process by which raw sensory data is unconsciously assigned significance and deemed worthy of attention, making certain information stand out from the rest. This process is closely tied to attention but also plays a major role in motivating thoughts and actions in response to significant information. This motivational aspect seems to be key to understanding how salience processes support creative thinking.

Newton saw an apple fall from a tree – something most people might view as trivial. Yet, he saw the apple’s fall as significant

Several theories of attention – such as the idea that creatives have a ‘leaky filter’ – help explain why creative individuals notice new information, but not why they are motivated by it. Creative minds seem irresistibly attracted to novel or unconventional information. My colleague Jonathan Schooler and I propose that this attraction is driven by the motivational properties of salience. When unconventional information gets flagged, it acts like a magnet, compelling individuals to explore it. This exploration boosts the chances that novel information will become a part of the creative problem-solving process, sparking innovative ideas.

This framework offers a new way to understand both creative traits and creative states. By creative traits, I mean the consistent differences in creativity that we observe when we compare individuals. Research indicates that how a person processes what’s important – the brain’s salience system – varies systematically from person to person. For example, people with schizotypy or autism often show unique patterns of salience processing, meaning they are naturally drawn to unconventional details. For example, individuals with autism tend to pay less attention to faces and social cues, such as where someone is looking, but more attention to mechanical objects or objects related to their specific interests. Similarly, we suggest that variations in the salience system may predispose some individuals to notice and then consider the unconventional, fostering a natural tendency toward original, creative thinking.

Now, let’s delve into creative states – those spontaneous bursts of creativity that can happen at any moment. Even the most creative individuals aren’t always in a state of creativity, nor are they creative in every situation. But during moments of creative insight, less obvious aspects of a problem can suddenly stand out, leading to that thrilling ‘eureka’ moment when new connections are made. On the other hand, uncreative ideas often emerge when someone can’t see beyond the obvious, getting stuck on familiar patterns. This is where common barriers to creativity come into play, including functional fixedness – a cognitive bias that prevents people from seeing alternative uses for objects or alternative solutions to problems.

We suggest that the functioning of the salience system plays a crucial role in these different modes. When attention is captured by an aspect of a problem or situation that isn’t usually prominent or relevant, the salience system has flagged atypical information for further processing, paving the way to a creative insight. On the other hand, creative blocks, such as functional fixedness, may arise under ‘typical’ salience functioning, where the system flags only the most prominent, obvious features of the problem for consideration.

Think about Isaac Newton’s famous insight into gravity. According to the story, Newton saw an apple fall from a tree – something most people might view as trivial. Yet, in this instance, he saw the apple’s fall as significant, prompting him to contemplate it more deeply. Entertaining the potential importance of this seemingly irrelevant occurrence led to a breakthrough connection: that the same force causing the apple to fall also influences celestial bodies like the Moon.

In this example, the creative individual’s brain flags unusual or ‘irrelevant’ information as significant, prompting them to explore it further. This exploration allows them to consider remote ideas and associations that others overlook, increasing the likelihood of a creative insight. Notice how the information that gets flagged doesn’t necessarily have to be directly related to the problem at hand; its value lies in the potential connections it can inspire, leading to innovative and unexpected outcomes. A similar process likely unfolds in artistic contexts, such as when a painter, musician or filmmaker sees a seemingly irrelevant detail as meaningful. For instance, an artist may find themselves captivated by the shadow cast by an object, finding it more interesting than the object itself. This might inspire a series of works exploring the hidden beauty of shadows.

**Thinking of this atypical salience functioning **as a state suggests that it could be ‘switched on’, potentially leading to creative thinking. Although direct evidence is lacking, there are several examples that hint at this possibility.

One example comes from individuals with Parkinson’s disease (PD). In particular, some patients receiving dopaminergic therapy to treat their PD have been shown to exhibit the characteristic symptoms of atypical salience processing; they sometimes report experiencing the world as teeming with unusual significance, where even trivial or irrelevant information seems to carry hidden meaning. A separate line of research shows that treated PD patients can experience sudden artistic developments or a drive to create. An open question is whether the atypical salience processing in these patients motivates this artistic drive.

What might seem like irrelevant information could actually offer an adaptive advantage, leading to unexpected insights

Certain kinds of everyday experiences might also influence how the brain assigns salience. For instance, some types of visual art, such as abstract or surrealist works, disrupt a viewer’s usual way of seeing by creating paradoxes and visual conflicts that don’t occur in nature. We believe that the unconventional nature of abstract art encourages the brain to enter a different state, relaxing its default perceptual predictions to accommodate the unusual sensory input. Supporting this idea, our lab has found that viewing art leads to some of the outcomes we theorise are associated with atypical incentive processing – including creativity. Now, we intend to examine whether atypical salience processing is responsible for driving the effect of art on these outcomes.

Another example where creativity and atypical salience processing intersect is in the context of cannabis use. Many users claim that cannabis sparks their creativity, helping them think outside the box and come up with original ideas. This perception might be linked to cannabis’s ability to induce atypical salience processing, which has been shown to drive some of the downstream effects associated with its consumption. However, the connection between creativity and cannabis is challenging to observe in laboratory settings. Most scientific research examining creativity and cannabis has focused on very specific types of creative thinking – such as the kind captured by lab-based tasks in which participants must generate as many ideas as possible in a limited time. These tasks rely heavily on cognitive control, which is the ability to focus and filter out irrelevant information. This style of thinking may actually conflict with the more free-flowing, open-minded attention style associated with atypical salience processing. Thus, existing research may be obscuring the broader impacts of cannabis on creative thinking.

This brings us to a crucial point: the concept of creativity is broad and multifaceted. Under the umbrella of ‘creativity’, researchers have identified two distinct attention styles. One of these, described previously, is leaky attention, which has been linked to real-life creative achievements. The other type of attention is characterised by highly controlled, ‘watertight’ focus. People with this attentional style are great at blocking out distractions and can shift their attention based on what’s needed for the task at hand. And this kind of attention is often a strong predictor of success in lab-based creativity tasks, especially those that are time-sensitive and require generating lots of ideas quickly.

Our atypical salience framework aligns best with the leaky attentional style and is therefore most likely to explain creative performance in artistic domains and predict real-life creative accomplishments. By distinguishing between these types of attention, we can better understand the diverse ways creativity manifests, and tailor our approaches to studying and fostering creativity across different contexts.

Taking a step back, our research proposes a new outlook on what is traditionally seen as ‘healthy’ neural functioning. While it’s often helpful, of course, to focus on the most clearly relevant information, this can sometimes constrain creative potential. In contrast, what might seem like irrelevant information could actually offer an adaptive advantage, leading to unexpected insights. From this perspective, the uniqueness of creative individuals lies in their ability to perceive and prioritise information in distinctive ways, embracing the unconventional and unexpected.

阅读关于 A key part of creativity is picking up on what others overlook | Psyche Ideas 的文章
来源 Published@

Early Bookcases, Cupboards & Carousels - Lost Art Press

Saint Jerome in His Study, by Colantonio, c.1445-1446, from the collection of Museo di Capodimonte, Napoli.

Scholars, translators, transcribers and writers have always needed to have multiple books and other resources within easy reach. Illustrated manuscripts give us a good look at how medieval scribes stored and arranged their often large and hefty books.

In the image above, Saint Jerome, identified by the halo, red galero and the lion with a thorn in its paw, is viewed in his study. The shelf above his desk, and the large open shelves surrounding his desk, are cluttered with books as Jerome works on translating the Bible into Latin. The nails on the side of the desk reveal it is of boarded construction, while joinery on the small chest (with Jerome’s red galero atop) is frame and panel.

An image drawn and painted over 700 years earlier gives us a different arrangement.

Codex Amiatinus or Codex Jarrow, completed before 716 in Northumbria, England. Florence, Biblioteca Medicea Laurenziana, MS Amiatino 1.

The Prophet Ezra, a scribe and priest, is illustrated in the Codex Aniatinus, the earliest and most accurate copy of Saint Jerome’s translation of the Latin Bible. He sits in front of a cupboard with a pediment and frame-and-panel double doors. The left-side door has an astragal fashioned into the shape of a column. The frame above and below the doors is carved (or painted) with decorative shapes and symbols. The cupboard resembles a temple, as is appropriate, for within, the shelves hold a Bible in nine bound volumes. Ezra works with his book propped on his lap and seems to have consigned his writing slope to be a footrest.

According to the Library of Congress this “illumination is among the oldest images in the Western world to show a bookcase and the bindings of books.” The codex is also huge. It has 1,030 folios and measures approximately 505 mm by 340 mm (19.9 in. x 13.4 in.) and weighs 34 kg (almost 75 lb.).

The codex was made in Northumbria, England, and was to be a gift to Pope Gregory. Ceolfrid, a Benedictine monk, was in Italy on his way to Rome when he died in 716 (hence the date of before 716). A further note is the codex was one of three copies of the Bible made in Northumbria, but the only copy to survive.

Why Were Books Stored Flat?

_Titles of books written on the fore edge and foot edge of books. _

Although many medieval books written on thick parchment or vellum and often bound in leather could possibly stand on end, titles were not put on the spine until the 16th century. There was also no standardization of book sizes. Some books were small enough to fit in one hand, while others were so large and heavy it took two people to lift one. As a result, books were placed flat, often with the spine turned inwards. The title might be handwritten on the fore edge or foot edge. Alternatively, the title could be written on the cover.

Boethius turns the pages of a book in Der Renner, last quarter of 15th century, Austria, Morgan Library, MS M. 763, f.195r.

Boethius, in his rather spare accommodations, allows us to see that all the books on his bookshelves have titles on the cover. The titles of the books on the lower shelf are “Musica” and “Arithmetrica.”

Roman de Troie (Romance of Troy), c.1340-1350 by Benoît de Sainte-Maure, Paris, BnF, MS Français 782, f.2v.

In this opening scene of the “Romance of Troy,” the manuscript’s author has imagined the moment when Cornelius Nepos, a Roman biographer, discovers the history of Troy as written by Dares the Phygian. This generous cupboard has sturdy shelves and – not bifold – but tri-fold doors and stands below a small vault that looks to be recessed into the wall. The vault is presumably for the most precious or controversial books.

The appearance of bifold doors in medieval manuscripts makes sense. Books were valuable and needed to be secured in cupboards and scholars and scribes worked in small and cramped spaces. The bifold door with its small footprint was the solution, in fact, it was a very old solution.

Bifold doors were found in ancient Egyptian tombs and have been found in Herculaneum.

Examples of bifold doors, both are dated 1st century CE and from Herculaneum. Top: Fresco of the Shoemakers, from The House of the Stags. Bottom: A small household shrine sealed and carbonized by pyroclastic covering, House of the Wooden Shrine.

The dimensions of the household shrine are 163 cm x 73 cm (64.2 in x 28.7 in). It has all the construction details one would expect in a full-sized cupboard. The Romans used metal for door hinges, as well as bone and ivory. The shrine hinges are an example of bone or ivory.

These types of doors are also described in the temple built by King Solomon in 1 Kings 6:31 and 33.

“For the entrance of the inner sanctuary he made doors of olive wood with five-sided jambs.”

“In the same way he made four-sided jambs of olive wood for the entrance to the main hall.”

**A Roundabout Device for More Clunky Books **

Left: Cornificia in a Flemish translation of “Le Livre de la Cité des Dames,” c.1475, Bruges, British Library, Add. MS 20698, f.70r. Right: Saint Proba reading at her desk, 1497, Italy, Bodleian Library, Douce 287, f.5v.

On the left, Cornificia, Roman poet and writer of epigrams is unhappy. She needs more books, but her desk is too small. The bookcase is almost full and the wall shelf holds only one measly book. Proba, on the right, also a poet, also has limited work space. She suggests a rotating book holder might be the solution.

“Somnium Scipionis with Macrobius’ Commentary,” 1383, Bologna, Bodleian Library, Canon. Class. Lat. 257, f.002r.

Marcus Tullius Macrobius takes a short break from his commentary on Cicero’s “The Dream of Scipio” to agree with Proba. He suggests a book carousel will double your poetic output.

The book carousel was, and still is, an efficient tool on which to prop, and refer to, multiple open books. It can be a desktop tool and has also been configured as a stand-alone piece.

Left: Saint Luke mending a quill in The Dunois Hours, c.1440-1450, Paris, British Library, Yates Thompson 3, f.15v. Right: Saint Luke, Book of Hours, c.1410-1420, Paris, British Library, Yates Thompson 46, f.14v.

On the left, Saint Luke pauses his writing to mend his quill pen. His study is crowded with a bookcase, desk and a roomy and ornate hexagonal book carousel. On the right, Saint Luke has a double-decker carousel with the possibility of raising the height for improved reading ergonomics.

Left: Benvenuto da Imola commenting on The Divine Comedy, beginning of 15th century, Italy, Bodleian Library, MS Canon. Ital 107, f.001r. Right: Saint Luke, Bedford Hours, c.1414-1423, Paris, British Library, Add. 18850, f.20r.

Benvenuto da Imola and Saint Luke also benefited from the innovative swing-arm carousel. On the left, Benvenuto, nestled in his own private letter, pauses a moment in his contemplation of Dante’s “Divine Comedy.” He has a revolving carousel that he can swing forward as needed. Saint Luke, on the right, has a swing-arm lantern, a really clever addition to a carousel and a clear precursor to today’s task lighting.

The Whole Enchilada

The scribe at work, c.1320-1340, Cambrai, Bibliothéque municipale, 620 (572), f.001.

This scribe, responsible for the manuscript in which he appears, sits ensconced behind his desk. In easy reach are a book cupboard (with bifold doors) and a double-decker carousel. Get a load of the wide book bench with three locking compartments. In his rich and fur-lined garments he mocks us (perhaps that’s just me) with his plethora of book storage. It would serve him right if, despite such bookish ostentation, there is no door behind the blue curtain and he is stuck in this panel of his own making.

What About the Rest of the World?

Many things were underway in other parts of the world. For instance, China invented paper with a full documentation of the papermaking process appearing around 105 CE. Papermaking techniques began in Vietnam in the 3rd century, spread to Korea in the 4th century and on to Japan in the 5th century.

Documents and books moved from handwritten to printing with woodblocks. Printing with moveable wooden type was developed in China around 1040. The printing of the first books with moveable metal type occurred in Korea in 1234.

Although the first 13th-century books printed in Korea with moveable metal have not survived, there is one portion of a 14th-century book that did. “Jikji” is a Buddhist text printed in 1377 and is the earliest extant book printed using this new technology. This treasure is in residence at the Bibliothèque Nationale de France.

Stitch-bound books in China, Korea, Vietnam and Japan had paper covers with the title written on the cover, or a label with the title was affixed to the cover. Similar to the European practice, the title might also be written on the fore or foot edge.

The cover of “Jikji,” earliest extant book printed with moveable metal type, pages from the book and the title written on the foot edge, 1377, Cheongju, now South Korea, collection of BnF, Coreen 109.

Books did not have rigid spines and were placed flat in open shelving. An example can be seen in this chaekgeori, or scholar’s screen, from Korea.

Chaekgeori (books and things) eight-panel screen painted by Yi Eungrok, c.1860-1874, Korea, collection of The Asian Art Museum, San Francisco.

It was painted by the artist Yi Eungrok and is dated 1860-1874. Chaekgeori translates as “books and things.” The things are items, such as vases, flowers, fruit and the scholar’s writing implements. King Jeonjo (reigned 1776-1800) is credited with the introduction of these screens. When his screen was introduced, court officials thought they were looking at real bookshelves.

The Abbasid Library, 1237, Baghdad, illustrated by Yahya al-Wâsitî, école de Baghdad, Paris, BnF, MS Arabe 5847, f.5.

In the 8th century in Baghdad, paper began replacing parchment for administrative documents. The Grand Library shows a similar arrangement to the open and evenly spaced bookshelves in Asia.

Before heading back to Europe, it should be noted one other very important paper item came about when the Chinese invented paper: toilet paper.

The Book Carousel Grows Up

In 1588 Capitano Agostino Ramelli had an idea for a book carousel. In his description of the device he wrote, “…it is very useful and convenient for study, especially for those ill-disposed…because with this type of machine a man can read a large quantity of books without moving from one place.”

Figure CLXXXV111 (188) from “Le Diverse et Artifiose Machine de Capitano Agostino Ramelli,” 1588.

Ramelli’s bookwheel had epicyclic gears, with one gear rotating around another, such that the shelves holding the books are held at a constant 45° angle.

Of course, smaller bookwheels, perhaps inspired by Ramelli’s idea, were made and used in libraries and they have their own kind of elegance.

Much smaller. Left: Bibliotheca Thysiana in Leiden, Netherlands, 1650. Right: Biblioteca Palafoxiana, Pueblo, Mexico, 1773.

Ramelli’s bookwheel did not stay on the pages of his book. The bookwheel and two other learning machines were made for Daniel Libeskin’s exhibit at the 1985 Venice Architecture Biennale.

The program (top-left) and photos of The Reading Machine (based on Ramelli’s 1588 design) for the 1985 Venice Architecture Bienniale.

The link below provides a few more details about the bookwheel’s construction, difficulties encountered in Venice and what happened to the device after the Biennale.

On The Making Of The Lost Biennale Machines Of Daniel Libeskind

The Robbins Library at the University of Rochester (New York), a non-circulating medieval studies library, has a Ramelli bookwheel. In 2018, the bookwheel was a collaboration between the librarians and four engineering students from the Rochester Institute of Technology. Turning the wheel is described as “an invigorating experience, both physically and intellectually.” The students made a second wheel for the Cary Collection, a graphic arts collection, at RIT.

Turning the bookwheel at the Robbins Library.

And, a link showing details of the construction:

https://www.rit.edu/carycollection/renaissance-bookwheel

However you organize your books (alphabetical by author, by subject, by research project, or the I- know-where-everything-is method), Charles Dickens said it best, “We never tire of the friendships we form with books.” Treat them well.

– Suzanne Ellison

阅读关于 Early Bookcases, Cupboards & Carousels - Lost Art Press 的文章
Mike Grindle Published@

My One Big Text File

I do all my writing in a text file. Not any text file or “text files.” I mean one single .txt file.

All my notes, blog posts, ideas, essays - anything not written in pen or pencil - live in or begin life in this document and its copies. Everything I post online is just a copy-paste.

Sounds chaotic, right? Maybe it is, a little. But not as much as you might think. Personally, I think it’s removed the distractions and fuss of previous workflows I’ve tried.

But to be clear, what I’m about to share is not some productivity hack. It won’t automate your workflow, “link your thinking,” or make writing easy. You could think of it as a lazy man’s PKM. Though it’s more for knowledge dumping than “knowledge management.”

For the record, I think the most “powerful” note-taking and writing system is the one that you find enjoyable to use, allows you to retrieve old ideas, and inspires you to write and think every day. Anything more is superfluous and might actually get in the way.

To this end, a notebook with an index (which I also use) is perfectly viable. As is a folder on your desktop or the note software on your phone.

And so is One Big Text File (OBTF).

What is OBTF?

Using OBTF is not a new idea. It was relatively popular among niche blogosphere circles in the mid-2000s. As far as I can tell from the surviving posts, the concept can be traced back to some observations by tech journalist Danny O’Brien regarding how technologists work.

In any case, the premise behind OBTF is simple. It is the idea of keeping everything - or nearly everything - in one .txt (or .md) file. You might use it to store to-do lists, URLs, meeting notes, a reading log, a calendar, blog entries, essays, or pretty much anything else. However, I wouldn’t suggest using it to store sensitive information like passwords, your darkest secrets or bank details.

Now, you might ask why anyone would remove all the categorization benefits of having separate files and folders. And wouldn’t the result be an unwieldy mess? Well, in my experience, finding things in OBTF is blazingly fast.

To be clear, I don’t scroll through my OBTF looking for things. That really would be hell. I don’t even touch a keypad or a mouse. Instead, I use tags and search. The latter of which can be done using hotkeys found on pretty much any modern text editor.

The base of my daily workflow is reading, thinking, and dumping thoughts that I think are worth remembering or writing (because a note is not always something you need to remember, but often something you need to write to think about) into my file. When there’s something I want to talk about more extensively, I look over my previous notes on the subject and start writing right there in said file.

Once I’ve written and am relatively happy with a long-form piece of writing, I’ll copy it over into a new .md file, run a few grammar-checking scripts (largely pinched from here), convert the .md file into an HTML file using a program called pandoc and upload it to my site (or copy-paste it to wherever I need).

The above may sound like a lot of work, but it mostly happens from my OS’s terminal with a handful of commands. I’m sure a similar workflow could be achieved just as easily using GUI tools.

Again, if the system sounds imperfect, that’s because it is. The appeal is not perfect “knowledge management.” It’s about removing any friction from my workflow.

OBTF lets me throw in knowledge, forget about it, and maybe retrieve it later. It’s kind of like a notebook in that sense. And as far as I’m aware, no one has yet proven there to be a better system than a notebook. So, why not replicate that?

Why would I do this?

What are the benefits of working like this? For me, a few points come to mind:

  • Zero distractions (no fiddling with formatting, fonts, plug-ins, or shiny new productivity tools - markdown formatting handles everything)
  • Miniscule storage and processing. Even a massive .txt file will run nicely on relatively ancient hardware and lightweight operating systems
  • Easy to sync data between computers
  • Can “dump” notes without worrying about where they “fit” in a system
  • Works with any text editor with search functionality (so, all of them), meaning there’s no fear of client lock-in, software enshittification, or losing access to your data. .txt will always be platform, system, and application-independent
  • Everything can be found in one place with relative ease. That means no logging into the cloud or switching between software to find stuff
  • Basically, zero task-switching
  • It works well with a mouse/keypad-free workflow
  • As the text file grows, you can look back at your progress (all those ticked to-do lists) and the progression of your thinking.

Of course, there are potential drawbacks to OBTF as well. If you don’t use tags, things will get lost (I’d argue some things are meant to be lost, but I digress). Also, if you’re not used to working with .txt files or text editors, the lack of inline formatting could be a little disorientating at first.

Nonetheless, I feel like OBTF manages to achieve a lot of the things PKM software promises with none of the fuss, set-up, or anxiety about using the “right” methodology (I probably couldn’t sell you a course on the “right way” to use a One Big Text File. Don’t worry, I don’t want to either). In any case, it works for me.

Final thoughts

I have an inkling that very few people who read this will attempt to implement their own OBTF. This is okay. Despite my personal love for the idea, I don’t want your big takeaway to be that using a big text file is the future. It isn’t.

What I will say is that whatever works, works. And it doesn’t need to be fancy.

Of course, you can keep your notes, ideas, and writing in a cutting-edge PKM program if that works for you. You can also use a notebook, index cards, a big f’n text file, a blog, or just keep a bunch of files in a folder. The truth is that the medium and the tools don’t matter. What matters is that you get that stuff in your head down. Tomorrow’s revelation might just be the fleeting thought you had today.

Further reading


阅读关于 My One Big Text File 的文章
张一鸣 Published@

张一鸣和他的产品观人才观

自我

我是张一鸣,是 80 后的“技术宅”,在朋友、同事的眼中,我是一个不善言谈、很低调的人,好像除了写代码,没有什么兴趣爱好。我觉得说自己是“技术宅”不够准确,确切地说,我应该是一个不安分的“技术宅”,因为我不安于现状,不愿意一直做一个码农。我喜欢有挑战的事情,喜欢有难度的事情,喜欢获得更大的成就感,而不是平平庸庸、碌碌无为。 所以,我选择了创业,选择了不断地创业,因为我觉得每一次创业都能让我获得前所未有的成就感。

那时候我也有困惑,觉得看的这些书和思考的问题都很有意思,但在生活中没什么用。直到后来我进入互联网行业并开始创业,各种各样的知识才连成线,帮我理解行业、理解管理,更快地掌握不熟悉的领域,包括如何让信息得到更有效率的组织和分发,从而改变各行各业的效率

当时张一鸣的一个同乡电脑坏了,他跑去帮她修电脑,回到宿舍时就兴奋地说,哇,她们宿舍一个女孩子不错!接着就总去修电脑,在 BBS 上聊天,经常约她出来玩,然后表白,被拒绝。“被拒后没有表现出一点气馁,”梁汝波说,“有什么呀,他说,照样约出来玩。” 有一次,梁汝波和女朋友还有张一鸣和这个女孩子一起去北戴河玩,玩到张一鸣身上只剩最后几个硬币时,他说,我们把它花光。于是张一鸣和这个女孩子就拿着这几个硬币去了一趟网吧,回来时便牵着手了。这个女孩子便是张一鸣现在的妻子。

我做事从不设边界。当时我负责技术,但遇到产品上有问题,也会积极地参与讨论、想产品的方案。很多人说这个不是我该做的事情。但我想说:你的责任心,你希望把事情做好的动力,会驱动你做更多事情,让你得到很大的锻炼。 我当时是工程师,但参与产品的经历,对我后来转型做产品有很大帮助。

我在生活中,不算特别有规律,也不算特别有纪律性,经常看手机,听音乐、看今日头条、刷抖音西瓜,跟外界传说的不大一样。有时候晚上计划做一个工作,但后来被西瓜上有意思的内容吸引了,看了很久。睡前又有点懊恼,唉,我要做的事情没有做,然后报复性地工作一会儿,但又导致晚睡(我真心觉得睡眠很重要),第二天重要会议上精神很不好。其实这个时候,你应该做的是赶紧去休息。我现在虽然还经常没计划,但是至少发现太迟了,不懊恼,马上去睡了。

问:别人都说你抗压能力很强,你怎么看? 张一鸣:我表面上看起来确实很平静,内心和表面差不多,多数时间也比较平静,当然,偶尔有波澜。 问:你觉得自己有事业心吗? 张一鸣:如果把很投入地做成一件事当作有事业心,那我还是有的。 问:平时有运动的习惯吗? 张一鸣:以前没有,但是从今年开始我觉得有必要开始锻炼了,因为熵值在增加。 问:熵值? 张一鸣:它表示一种无秩序的程度,对于人来说,脂肪就是混乱无序的。

延迟满足感经验:涵蓄情绪,让自己静止,不要在沟通交流的时候走动、晃动,情绪跳动,会让思维失去精确控制。 常言道:以大多数人努力程度之低根本轮不到拼天赋。我的版本:以大多数人满足感延迟程度之低根本轮不到拼天赋。什么是努力?早出晚归,常年不休的人很多,差别极大,区别好像不是努力。

今日头条

我们不是像网易那样做“有态度”的新闻客户端,而是要做“没有态度”的新闻客户端,为每个人提供自己感兴趣的新闻。我们一直在努力优化算法,当用户的兴趣发生变化时,如何能更迅速地捕捉到,并且做出回应。

我们从来没有研究过新闻客户端,所以能抛开包袱,不拘一格地来做这个产品。对于用户怎样获取信息的问题进行深入理解,而不用受困于新闻媒体自身的诸多缺陷。 我们的思路和理念与传统的新闻媒体不一样,能将搜索与推荐的技术优势最大化地嫁接在新闻客户端上,为每一个用户推荐切身相关的资讯。从更大意义上来说,它已经不再是一个新闻客户端,而是一个连接用户到信息的入口。

比如,家庭主妇会收到家常食谱的信息,体育爱好者会看到足球比赛推送。今日头条根据用户特征、环境特征、文章特征等数据,进行组合推荐。这背后是数据挖掘、神经网络、自然语言理解、机器学习等人工智能技术的支持。

信息的流动涉及安全、效率和自由等好几个维度。政府比较关注安全;文科生比较关注自由;作为理科生,我最愿意从效率角度看问题,即让需要某个信息的人,快速得到这个信息。效率是比较好量化的。比如效率讲究的是降低信噪比,减少无用信息对你时间的占用。用技术的手段提高信息流动效率,就是降低信噪比的过程,降低信噪比的很重要的内容就是消除有害信息,比如虚假信息,让信息有序有效流动。

移动互联网时代有一个“双向”的特征,即用户行为可以随时返回到内容发布者,并且内容发布者也有机会不经过第三方就能直接和用户发生联系。显而易见,移动互联网可以同时提供连接和信息服务。 所以,我们不仅帮助用户找到优质的内容,同时也帮优质的内容找到优秀的读者。 比如,有关科学、历史或者文化的内容,可能很难在邮局和机场这种地方发布,但有了推荐引擎以后我们就有机会推荐给用户。所以现在我们发现,在今日头条上已经产生了一些特别的信息爱好。

看似一片红海的行业,我却觉得是一片蓝海。在上线不到一年时间内,我们就有了一百多万日活用户,截至目前已累计 2.4 亿用户,每天日活用户超过两千万,每天阅读时长仅 APP 端就超过八亿分钟。 还有一个数据是社交分享量,大家在朋友圈会发现很多分享自“今日头条”的内容。据统计,“今日头条”在微博上的分享量是第一名,并且是第二名到第十名的总和,微信上亦如是,所以我们是社交网站上分享最活跃的应用

算法是一个生命体,你要调教它,驯养它。这个想法我在 2011 年的时候才开始萌发,开始只是想怎么样更好地满足用户对信息的需求,后来研究下去,用户对信息需求有越来越多的特征,比如说,不同人的信息需求不同,同一个人在不同时间对信息的需求也不同。算法对特征规律的总结与存储是要不断训练调教的,而且是因人而异的、动态的,就像一个自我演化的系统。你在看它(算法),它也在看你,它看你看得认不认真,并且不断地在做感知、存储、判断这一系列动作。算法是社会化的,观察你就能推导出他,因为你们有共享的特质。推荐系统很有意思,是活的,你做好了摆在那儿,它会越来越好。

2014 年,我们在决定做今日头条号平台的时候,进展是非常缓慢的。产品非常简陋,邀请作者非常困难。 当时今日头条号产品和运营在本职工作以外,每周都需要邀请作者入驻,在微博私信和微信公众号后台给创作者留言,从“智能推荐是什么”“今日头条是什么”开始解释,经常找几百个人才有几个愿意入驻。内部也产生很多质疑,疑问我们能不能做起来。 但我们还是觉得这对构建平台的内容生态非常重要,我印象中陈林特别坚持。在这种情况下,公司发动全体员工邀请创作者入驻,很多同事就从邀请自己身边的自媒体朋友开始,所有同事都兼任今日头条号作者的客服,答疑解惑,在内部沟通解决各类问题。 回头看,开始的时候我们的很多方法并不好,但是很努力、很专注,大力出奇迹。

产品和技术

同理心是地基,想象力是天空,中间是逻辑和工具。AB 测试只是一个工具而已,是测不出用户需求的,同理心才是重要的基础。如果没有同理心,做出的产品肯定没有灵魂,不能满足用户需求。但是光有同理心还不够,这样只能做出有用的产品。想要做出彩的产品,想象力非常重要。 在今日头条还非常简陋、信息非常少的时候,我们就想象着今日头条的 feed 连着一根智能的天线,天线连着无边的信息海洋,每一刷,就会从海洋取回此时此刻此地你最感兴趣的信息。所以我们努力涵盖各种各样有用的信息,从新闻到图片,从三农到学术。 抖音也是如此,想象全屏的视频让手机变成一扇窗户,你透过这个窗户看到一个丰富的世界,抖音是这个五彩斑斓世界的投影,感觉非常奇妙。如果没有想象力,你可能只会做出一款对口型的热门应用或者搞笑视频软件,抖音也不可能从一款炫酷的音乐舞蹈小众软件,演化成包容美丽风光、戏曲艺术、感人故事、生活消费的大众平台。

看一个产品是不是好的产品,最重要的是看产品能否满足用户的基本需求,如果这个需求是用户的基本需求,即使你的界面、交互略有一些缺陷,只要你在满足基本需求方面做得好,用户就会频繁使用。我曾经对比过各个手机下载的 Message 应用,我发现国外有的产品做得其实挺差,但它的活跃度却非常高,因为它在单体市场里是最大的,而这又是一个非常基础的需求。所以,它的使用频率非常高,几乎都不比微信差。现在有不少产品的设计让人眼前一亮,交互也非常有特色,也很新奇,但如果它不能满足用户的一个长期基本需求,还是会很难维持下去。

Reddit,包括 HackerNews,打开都是 H5 页面,非常简单,都是一条条的信息,我觉得这个形式很好。不像很多门户网站的手机版,他们标题都是对齐的,很讲究形式,还要加频道,搞得很复杂。所以我们最早做产品的时候,我一开始就觉得什么功能都不要加,就是一个 feed,然后做到随刷随有。另外就是根据用户行为按热度排序,虽然没有完全做到个性化,但当时也是可以的。

新浪微博告诉我们,只要抓住主要需求,产品再糙也能取得一定的成功。

今晚见了一个国内少有的技术团队,在一个技术领域耐心做了三年。不过,我自己持保留态度,还是在用户驱动或客户驱动的过程中同步完善和积累技术比较好。

可能很多今日头条的用户不知道,今年奥运会的时候他们看到的新闻,或许是一个名叫 Xiaomingbot 的 AI 机器人来完成的。 在整个奥运会期间,Xiaomingbot 写了四百多篇新闻稿,一条稿件的写作时间平均下来大概不到两秒钟。最后 AI 写的稿子大概有一百多万的阅读,有的阅读量甚至略高于记者的稿件。 有媒体对比了今日头条和华盛顿邮报的写稿机器人,发现头条的机器人不但信息量更丰富,能写配图长文,而且文字也更生动有趣。 这个 AI 机器人是我们今日头条实验室和北大计算机所合作完成的项目,也是国内第一个综合运用了自然语言处理、视觉图形处理和机器学习技术的写稿机器人。此前国外开发的写稿机器人,基本都是写一些简单的资讯,做一个模板,填上数据结果;Xiaomingbot 则可以通过获取网上对相关赛事的文字和讨论,总结归纳生成一篇较长的赛事资讯,并且还能自己选图。 其实今日头条一直在尝试类似写稿机器人这样的项目,我们希望用人工智能来帮助创作者创作更优质的内容。比如,今日头条号作者写文章的时候,选择一个合适的封面图常常是个难题,我们今日头条实验室现在做的工作之一就是用人工智能的算法去帮助今日头条号作者选出更好的图,或者取一个合适的标题。

从广告的生产方面来说,现在需要像做内容一样去做广告。 在智能分发时代,广告信息化是我认为的一个趋势。因为个性化推荐,推荐的是信息。而广告也是信息的一部分,它是有商业价值的信息。现在,强行插入的干扰阅读的广告不再是好的模式。当年门户网站的广告就是挂两边,甚至在网页旁边飘,挡住用户的视线,非常影响阅读体验。 而我们商业化的目标是让广告成为一条有用的资讯。广告必须具备可读性,之后它就能直接产生价值了。比如一个新品上市信息,或一个试驾活动,这种既具备商业价值,同时又具有可读性和可服务性的广告,我们就把它当做正常的内容推荐给用户。 2012 年初的时候,我去见投资人,他们当时还跟我说,移动屏幕这么小,你们广告肯定很不赚钱,因为屏幕小,广告的展示位也少。但是我们推出了信息流广告,生产出来的广告可以像信息一样分发,信息流广告可以不断刷新,没有展示位数量的限制,更不会像以前那种打扰用户体验。可以说,它就是一种信息。

做很多事情,初始都是很困难的,要调动资源全力以赴尝试很多次,才可能取得进展。现在,我们也有一些产品还不够好,我们欢迎积极吐槽提建议,但不要那么容易放弃希望。我觉得动不动就说“凉凉”是很势利的。什么是势利?势利就是只对表面现状的附和,不能超越现在,去想象还未发生的事情。

人才招聘

大家应该了解,我一直很重视人才招聘,对个人的潜力充满期待。我认同德鲁克的说法,对于公司内部来说,公司存在的意义,是通过公司这个方式实现人们的创造力。我会再加上另外一句——让每个人有更丰富、更有意义的经历和体验。对的,和我们用户产品的使命一样:InspireCreativity,EnrichLife(激发创造力,丰富生活)

张一鸣说:“现在部分年轻人流行把三四十岁退休作为理想,我不认同,我觉得理想是一直有机会创造、实现想法,有机会修炼、创造到老。为什么会想退休?想退休说明你认为现在是在‘忍’。我还有很多很多想法想做,希望三四十岁更有条件去实现想法。” 黄河就回他:“所以有人的选择让他取得了更大的成就。但是我也相信,有人的选择可以让他更快乐。” 张一鸣又回:“我们最后想要的,很多时候是更大的快乐啊,未必只是成就。” 黄河则说:“提高生产率不是通过延长工作时间。健身、娱乐、思考都必不可少。” 张一鸣则转评:“延迟工作时间,增加 50%已是理论极限,想要更好的结果要靠方法、状态、配合。”

2014 年初,快手把这个行业的估值抬起来了。美拍这个公司快不行了,快手估值涨起来。我不知道具体多少钱,所以我当时一直在关注这个。 在版权风波之前,我们一直在考虑,到底是收购快手,还是把张楠团队收了。我觉得快手很好,我比较推荐快手。陈林觉得快手太贵了,因为快手已经接受 1000 多万美元的投资了,收购的话,可能要几千万美元。 最后,我们从张楠公司回来的路上说,我们决定将这个团队收进来,尝试一下短视频这个方向。我们就不收快手了,而是收购了张楠。

有一天我看到咱们 HR(HumanResource,人力资源)写的招聘 PM(ProjectManager,项目主管)的 JD(JobDescription,工作说明),特别生气。有一条写着:有五年以上互联网产品经验,具有日活千万量级以上的产品规划和产品迭代实施经验。我跟这个 HR 说,按照这个要求,陈林、张楠、我们公司一大批 PM,一个都进不来,连我自己都进不来。别说千万 DAU 产品了,他们加入前,连百万,甚至十万 DAU 的产品也没做过。 很多同事加入我们公司的时候并没有光鲜的背景或者很好的履历,公司的产品经理,有设计背景的、运营背景的,还有代码写不好的工程师转岗的。也许有人倾向于招背景光鲜的男神女神,但咱们更爱朴素的“小鲜肉”。我们招人一直秉承的观念,是找到最合适的人,特质是不是真正契合,关注人的基本面。学校、相关经历、title(头衔)都没那么重要。写这样的 JD 很容易,本质上是偷懒,要发现人的特质才是困难的。

人才培养

我们是要保持学习的组织,因为我们做的是创新的事情,很多事情大家都没有做过。 移动互联网怎么推广呢?这个问题才诞生三年,不可能有专家,很多公司招聘是这么描述的:“大学毕业五年,三年以上经验,20 万代码要求……”在我们公司,要是 HR 写出这样的招聘启事是会被批评的。 为什么呢?比如说大规模机器学习只有两三年的应用场景,如果你要求一个很有经验的人,这本身就是不切实际的,这个技术本来就在日新月异地变化。 所以,我们在招聘过程中,一般对人最常见的要求是要有好奇心、爱学习、爱折腾、爱动手,我们希望构建一个学习型的组织。

很多人毕业后,目标设定就不高了。我回顾了一下,发现有同事加入银行 IT 部门,有的是毕业后就加入,有的是工作一段时间后加入。为什么我把这个跟“不甘于平庸”挂在一起呢?因为他们很多人加入银行,是为了快点解决北京户口,或者当时有些机构有分房补助,可以购买经济适用房。 后来我就在想一个问题,如果自己不甘于平庸,希望做得非常好的话,其实不会为这些东西担心:是否有北京户口?是否能买上一套经济适用房? 如果一个人一毕业,就把目标定在这儿——在北京市五环内买一个小两居、小三居——把精力都花在这上面,那么工作就会受到很大影响。他的行为会发生变化,不愿意冒风险。如果不甘于平庸,希望自己做得非常好的话,其实不会为这些东西担心,这一点很重要。 我说不平庸,并不是专指薪酬很高或者技术很好,而是你对自己的标准一定要高。也许你前两年变化得慢,但十年后再看,肯定会非常不一样。

我一直认为年轻人工作生活应该在城市中心,哪怕房子小一点(应该多出去活动啊),在市区有更多的活动和交流,下班之后也不需要浪费大好时光和宝贵精力挤地铁。年纪轻轻不要着急在郊区,尤其房山、沙河、天通苑之类的远郊定居,买了房我其实也建议搬到市区来。最后,我们的就近居住补贴(北京)已经涨到了 1500 元/月啦(和加不加班没关系,节省的时间用于健身、读书、看电影也很好),建议大家多多考虑住在附近。

我们不用敬语,我不知道在公司各位是怎么称呼上级的,有叫老板的吧,或者叫某某总,或者叫老大,或者叫某某哥某某姐,这在我们公司是不允许的,不允许使用敬语。 大家说我们在面临一个巨变时代,外部是不断变化的环境,公司及时对外部环境做出响应,平等的畅所欲言的氛围非常重要。敬语是形式化的东西,它会有心理暗示。我是不是不能批评他。比如大家都叫他张哥,所以我不好意思批评他。所以我们需要消除形式化的心理障碍,我们不提倡使用敬语,我们也不使用“您”,都称呼“你”,当然这也是简单,淡化复杂性。

“不装”也是我们的文化,我们觉得是保持简单和灵活性的文化。我们要求所有的 HR 的邮件,所有的同事沟通中要去官腔、去形式化,尽量不要做形式化的东西,表面上搞得很隆重,但其实没有实际的效果。

既然你已经考虑进入互联网公司,那就该选择快速成长的科技型公司,如果你是技术出身更应如此。但并非所有互联网企业都称得上科技型公司。前段时间流行很多互联网+传统行业的创新——互联网营销手段改造卖衣服、卖烧饼、养猪等,尽管我并不反对这类组合,也很认同其进步价值,他们通过互联网进行营销,使用已有的互联网工具抓住了商业机会。但在我看来,这更是像是生意人,而不是科技人应该做的事。科技人才应该选择创新、创造,让技术产生根本性进步或者解决之前不能解决的问题。 联系一直以来流行的“降级论”(大意是,干吗要做这么酷的事情,要学会用技术做一些风险低、竞争小的事,死在沙滩上的精英好傻),我不反对不同的人和不同阶段的人选择做降级的事情,但是我认为,应该有一些人、有一些公司可以有更高的目标,一流的技术人才应该加入顶尖的科技公司,顶尖的科技公司应该敢为天下先。 那么,什么是顶尖的科技公司,或者怎么考量一个互联网公司的科技创造力?我觉得,最该看重的是技术投入,以及技术因素对业务的贡献,公司为用户创造的价值里,有多大比例是通过技术投入而不是“地推”烧钱完成的。技术投入包括技术员工的占比、服务器的多少、算法构架上的投入等。从这个角度,我个人是很欣赏 ElonMusk(埃隆·马斯克)的,从 PayPal、SpaceX、Tesla 到 SolarCity,他是真正在做有科技含量,且能让未来提前到来的事情。当然过去的苹果、微软、谷歌也是如此。

作为一个企业雇主,我们更喜欢能够学习多种知识能力的人。 比方说我们公司的产品经理很多都是工程师转型的,还有一部分是设计师转型的;人力资源负责人是学电子转型的;行政的负责人是学计算机转型的。纯专业对口并不是这么关键,更需要的是能够学习多种知识,保持学习能力比知识的积累可能更重要。现在的互联网可以随时获取知识,你自己组织知识结构、更新知识结构的能力,我觉得可能更重要。

我们每两个月有一个全员会,有一个员工提问:公司如何变得很成熟?我的想法相反,我们恰恰要保持年轻,不要对新事物随便持否定批判的态度。新事物出现一定有它的原因,一定要去体验,去尝试,去观察它的发展。我们对团队有很多要求,很早的时候,我发现管理团队不用抖音,很着急。我要求他们每个月拍两条视频,要获得多少个点赞,用强制手段让大家保持年轻。我们公司企业文化是始终创业,类似亚马逊的 AlwaysDay1,永远像公司创业第一天那样思考,永远思考用户在想什么。

其他

一个身价两百多亿的老板不作秀、不爬山、不吹牛、不打口水仗、不接受采访、不上电视杂志,以身作则像一个基层员工一样每天脚踏实地测试产品,无止境地改进产品的体验。这才是腾讯成功的最大原因。而被腾讯打败的失败者们始终没有认识到这一点,要么骂他靠抄袭,要么说他靠 QQ 才能成功。

我其实不止一次听到团队说,哎呀,这个竞争怎么没完没了,到底什么时候才结束。 我觉得要以平常心对待竞争对手,要把竞争当作常态。不要想逃脱竞争,竞争也是好事。我甚至觉得,不应该通过并购来结束竞争。我们看到很多通过并购消灭对手的公司,越来越自我感觉良好,最后都懈怠了。 竞争对手是很好的蓝军。竞争对手可能有产品创新、市场策略等好的方面值得你学习。哪怕是竞争对手推动的批评文章,我们也认真看,而不是愤怒。也许文章里 80%都有问题,但 20%是对我们有启发的,那我们应该吸收那 20%。除了竞争对手,没有人会那么认真挑你问题。

我们重视技术,而重视的体现之一是工资。我一直认为,公司竞争的核心是 ROI(投入产出比)水平而不是成本水平。几乎没有行业领头的公司是控制人力成本来实现领先的,公司应该有好的 ROI,而这个好的 ROI 需要通过让员工收获好的 ROI 来实现。

还有一种走捷径的方式是:对事物的过度抽象,对方法论的过度追求。我自己的感受是,方法论其实没有那么有用,大部分情况下甚至可能是没什么用的。因为你对一个事情抽象,相当于思维上加杠杆。一旦这个杠杆加错,通常是失之毫厘,谬以千里。 其实这种现象有一个对应的说法,叫作“理性的自负”,这也是人的 ego(自我)。因为知识有限性是非常明显的,很多是非结构化的知识,过度地使用概念其实是无助于理解的,避免过度抽象使用方法,也是一种平常心。

平常心对待成功和失败,也包括不要错误归因,把外因当作内因,不要把运气当作能力,要找出成功或者失败的真实原因。我们最早做短视频,城市用户的留存不太好。讨论时,一个同事觉得肯定是因为城市白领做脑力劳动多,更倾向于图文表达。总结的逻辑乍一听很有道理,现在我们知道,事实并不是这样。 我不是说所有的结论都不对。只是要承认有的事情我们不知道。人很不喜欢不确定性,所以对成功和失败都希望找到符合自我叙事的归因。

阅读关于 张一鸣和他的产品观人才观 的文章
2