又心痒痒了,想试试用 htmx + Python 写写小项目。
不过 Python 的速度真不行,感觉 Bun 会好很多。
但是 Python 的 Ai 生态更好,JavaScript 生态圈内优质的 Ai 开源项目太少了。
好纠结啊。
又心痒痒了,想试试用 htmx + Python 写写小项目。
不过 Python 的速度真不行,感觉 Bun 会好很多。
但是 Python 的 Ai 生态更好,JavaScript 生态圈内优质的 Ai 开源项目太少了。
好纠结啊。
大语言模型「懂不懂你」取决于它能获取到多少你有价值的数据。所以能无感,或低门槛的让你把有价值的数据交给它至关重要。
从这个角度看,微软、谷歌是最有潜力打造出真正基于大语言模型的生产力工具。前者有 office 这个全世界最受欢迎的办公套件,后者也有一套用户基数很大的办公套件,以及持续收集用户数据的搜索引擎和浏览器。
国内在这方面最有潜力的还是字节跳动。飞书虽然市占率不高,但是飞书已经基于豆包推出了知识问答,可以全量获取用户飞书内的所有聊天记录、文档、知识库等数据。

字节在这方面唯一的短板是不像 OpenAI 能做开放平台打通第三方服务(让腾讯和阿里把自己的数据开放给字节?这不可能),也不像 Google 本身就是一个小商业生态系统,用户能在里面满足一部分需求(现在已经打通了 Google 酒旅和 YouTube)。
腾讯也掌握了微信这个数据富矿,可惜微信里大部分都是聊天这种垃圾数据。企业微信和腾讯文档本身产品力不行,远远不如飞书好用。我甚至怀疑他们底层的数据架构也不如飞书开放灵活,想要打通、整合,可能还需要付出一点代价。
阿里有钉钉,但是我不清楚钉钉文档有多少人在用。在我的印象里,钉钉文档应该远不如飞书那么好用。而且钉钉文档的底层数据架构应该也不如飞书。现在钉钉文档 AI 也不能全量获取用户数据,还需要用户手动导入知识库,支持的格式也有限。
学习就是拼图。常规路径是从一个起点开始,一块连着一块,慢慢把图拼完。
但是在绝大多数时候,情况没有这么理想。很多突如其来的问题和已知部分的拼图没有关联,但是你又需要将他放到合适的位置。
这个时候,你只能不断尝试,将他和其他拼图连起来,寻找它和已有部分的联系。譬如问人,问搜索引擎。但是因为它和你已知部分没有关联,所以你问的问题可能非常荒谬、可笑、没有意义。
如果对方水平比较高,能从你的提问中猜到你想要什么,给你一个有用的答案,那是万幸。但这是小概率事件,大部分人的运气没有这么好。在大多数时候,即便你问对了人,他也不知道该怎么回答你,或者给出的答案对于你来说毫无意义。
甚至你可能连问题都问不出来,只能自己不断试错。
这个过程是盲目、困难和痛苦的。
我觉得 AI 的出现,能在很大程度上缓解这个问题。因为 AI 的知识面非常广,能从很多不同的角度理解、回答你的问题。它可能不能直接给你答案,但是能从你的提问进行推测和延伸,让你能沿着一个方向继续追问。
我觉得这一点,在和 AI 结对编程的时候体现得非常明显。因为一些库或者包的文档写得非常差,或者根本没有文档,你只能通过试错来使用它们。
这个时候,你把问题甩给 AI,它可能并没有学习过这个库,但是它能从已经学习过的代码中,推测出这个库的用法。毕竟大部分接口的设计都是类似的。
AI 在这里就像一个经验丰富的老师傅。毕竟人类的经验,也是一种大数据。
在国内最适合做 Ai Workspace 产品的,还得是微信,毕竟我们老中人最爱用微信办公了。微信沉淀的工作群聊记录和各种 word、ppt 文件才是最真实有价值的检索数据。
既然 VSCode 本质上就是个文本编辑器,那么我是不是可以把它当笔记软件?用它打开保存笔记的目录作为工作区,然后和 GitHub copilot 交互,只要 copilot 没有被限制只能回答和编程有关的问题,那 VSCode 也算半个 ai 笔记软件。
之所以是半个,不是完整的,我是基于两点原因做出的判断:
VSCode 本身的能力全部点在了文本编辑上,现代笔记软件的 canvas、Graph、bi-directional links 这些能力都不具备。我知道有一些可以用插件弥补,但是插件提供的能力本身比较有限,体验一般。而且目前我还没有找到能实现 obsidian 的 canvas 功能的插件。
VSCode 内置的 GitHub copilot 插件本身应该不具备 rag 的能力,可能需要动手 hack 一下。
Ai 要真正提升生产力,做出真正不一样的产品,还是需要和已有的数据整合起来。
从这一点来看谷歌的优势太大了。目前谷歌的 Ai Workspace 是整合最好的 Ai office 产品。微软的 copilot 365 输在了 office 三件套用户体验不行。notion ai 能整合的资源有限,价格没有竞争力。wps 的用户基本不上云,金山没有数据可用。国内最有希望的还是字节,飞书体验没有问题,就看字节能把豆包优化成什么样了。
Open Ai、anthropic 起了个大早,赶了个晚集。如果 chrome 真的能被剥离,这俩公司谁能买下来,谁就有一线生机。
是我小看 firebase studio 了,原来 nix 是可以选择版本的,直接 channel = “unstable” 就可以下载最新的包了。
{pkgs}: {
channel = "unstable";
packages = [
# 输入需要安装的包
];}
我的项目已经完整无碍的在 firebase studio 里运行起来了。firebase studio 的 Gemini 能读到更完整的项目信息,回答的可靠性再次提升,Google 🐮🍺
Google 有点东西 👍。
今天试用了一下 Google 久负盛名的 NotebookLM。我觉得这是到目前为止最接近 memex 的产品形态——把文本资料吃进去,通过高效的索引方式帮人类找信息。
NotebookLM 的实现路径是借助 ai 的能力做基于内容的分析概括,对生成的内容给出指向资料的索引。没有那种对 AI 能力过于自信的越俎代庖,还是将人类置于内容(笔记)生产的核心位置。这个路径也一定程度上避免了 AI 的幻觉(具体多大程度还得继续用)。
置于生成报告、音频、思维导图,我觉得这些都是属于锦上添花的功能,对于我来说用处不大,反正我目前找不到使用场景。
NotebookLM 现在最适用的场景,就是需要做大量 paper work 的人了。尤其是研究性的工作。也适合拿来读书。把那种不值得细读的书和文章扔进去,问几个问题就能把握整体思路。生成的素材就是读书笔记。NotebookLM 把笔记也纳入了 AI 的内容来源,方便日后检索。
今天还试了 Google 的 IDE—— Firebase Studio。不过它就属于一眼惊艳,然后一言难尽的产品了。
产品思路不错,借着 VSCode 的壳和生态,整合了 Google 自己的云服务,和 Gemini 的 AI 能力,能实现从开发到部署的一站式服务。
起初想尝试正是因为 Gemini 的代码能力和其他大模型相比,更值得信赖。可能是我的技术栈比较冷门吧,试了很多模型,只有 Gemini 每次的回答都相对靠谱。
我导入了我的 murmurs3 项目,IDE 能自己识别项目需要的插件和依赖,自动生成开发环境。
但是这个识别能力非常堪忧。我的项目技术栈是 bun+sveltekit+Tailwind CSS,但生成的开发环境是 node,插件倒是识别到了 svelte,但是自作主张的给我加了 vue,并且,项目里的其他依赖,对应的插件都没识别出来,最基础的 ESLint、prettier 这种前端必备插件都没识别出来。我只能一个个手动下载。对了,这个插件市场不是完全从 VSCode 搬过来的,部分插件还没有,例如 DaisyUI Snippet。
在我搞定了开发需要的依赖以后,尝试运行项目,发现怎么都运行不起来,好不容易成功运行了一次,点开链接直接报错。
目前不清楚具体原因,从输出的报错来看,应该是由于生成的 Nix 容器环境缺乏 rollup 运行的二进制依赖。但是我一直 bun add 添加依赖也不行。
另外就是 nix 的包管理器,支持的包版本太老了。bun 最高只支持 1.0.13。如果想下载最新版本,就会直接告诉你 AccessDenied。
整体用下来,我还需要观望,如果未来兼容性更好,我会毫不犹豫使用,甚至购买增值服务(看价格和服务内容)。
从写代码到部署不用来回切换,在一个界面里全部搞定,这个远景太诱人了。这种端到端全链条的能力,only Google can do 👍
文字使拥有知识的人和知识分离。与此相反,口语文化把知识纳人人生世界,把知识放进生仔竞争的环境。
按照这个方向继续,Ai 是更进一步的把人和知识隔离了。

你是我未曾拥有无法捕捉的亲昵
你是我朝夕相伴触手可及的虚拟
