· 大约2小时 ago
作者每月花费1万美元使用AI编程助手Codex,让它持续记录改进工作流程、进行大规模研究和数据分析。这种AI驱动的知识整合绕过了传统组织的协调开销,可能从根本上提升组织效率。
我用了数十亿个军团标记。这是我的设置和我学到的东西。
很多人严重低估了 Codex 的能力。即使是我的一些同事,也仍然没有充分利用 Codex,但一旦你展示了一些雄心勃勃的用例,他们就渴望尝试。因此,我想写下一些内容并更广泛地分享,希望能激励更多人。
在这篇文章中,我将分享我的简单配置,并讨论一些杀手级的使用场景,我经常分配数亿代币。整个月我花了 1 万美元购买 API 费用,这让我成为团队中最活跃的用户之一。绝对值得。
最后,我反思了我认为组织在不久的将来可能会显著提高效率。
我个人的配置非常简单:git 工作树,许多 shell 窗口,每个工作树有一个 VSCode 实例,方便浏览代码变更。你基本上可以在新的 Codex 应用里开箱即用。不要被过于复杂的工具诱导。
最大的突破是让 Codex 不断记录并改进自己的工作流程。这是我为个人设备完全整合起来的东西。Codex 在我用它做的任务上总是变得更好、更快,因为我有让它做笔记和改进的习惯。在工作时,Codex 会把笔记和助手提交到我 monorepo 的个人文件夹里。在与代码库新部分交互几次后,这些辅助工具通常会稳定下来。我其实从没真正读过这些笔记,它们对我来说的实用性纯粹是对 Codex 性能的影响。
现在我的设备能够跨会话叠加知识,我开始习惯扩展使用它们的任务规模。让我们来看看我最近花费数亿代币的两个任务。
研究进展迅速。实验成本高昂且容易配置错误,因此紧跟最新发现和陷阱至关重要。幸运的是,Codex 是一个非常棒的搜索引擎。
当我想快速在不熟悉的代码库部分实现一次性实验时,我会让 Codex 做大量尽职调查。Codex 会探索相关的 Slack 频道,阅读相关讨论,从这些讨论中提取实验分支,并为我的实验挑选有用的改动。所有这些内容都汇集成了大量笔记,并附有链接指向每条信息的来源。利用这些笔记,Codex 为实验串联起来,做出了许多超参数决策,而这些决策是我不可能在没有更多努力的情况下做出的。
寻求第二意见大大提升了我对发货产品的信心。在错误代价高昂的环境中,你需要一个极其勤勉、高召回率的搜索代理。Codex 经常满足我这个渴望。
编码代理也擅长数据分析,使得快速从数据中获得洞察变得非常容易。目前,真正的瓶颈是弄清楚 分析什么。
最近,我积极地用 Codex 扩展了我们的一些模型行为工作。我意识到我们的内部空间充满了讨论、报告和数据,这些都涉及不同类型的模型行为,我们可能需要更严格地测试这些行为。我用 Codex 查找并广泛爬取了相应的通道,并生成了可检验假设的描述。除了阅读 Slack,它还查看了人们分享的截图,拉取了与模型行为相关的文档,并浏览了电子表格。经过数小时的努力,这促成了 700 多个新假设,目前正在提升我们对模型行为和用户偏好的理解。
大部分工作是用 GPT-5.2 完成的,但我已经测试了新的 GPT-5.3-codex 模型几天了。我每天使用的代币数量在增加,我觉得这大致与我的生产力相关。
我发现 GPT-5.3-codex 特别擅长同时管理多个子代理。此外,最近对兵团堆栈的加速让整个子特工体验更加流畅。
我目前的工作流程正逐渐转向只和一个代理沟通,而这个代理又会协调一大批代理,负责 Slack 研究、代码研究、代码编写和数据科学。这大大减少了我需要通过代理进行上下文切换的次数。然而,当我需要完成关键任务时,我仍然选择直接与那个特定的分代理沟通。
这些工作流程揭示了组织运作方式的根本性。在我的两个用例中,我都实现了全面的跨组织知识转移,无需人工协调。没有会议,没有邮件,没有打听周围的事。我只是把 #Codex 指向问题所在,它汇集了数十人的信息,他们甚至不知道自己在为我的事业做出贡献。
我忍不住想知道这会如何影响社会。传统上,组织会缴纳一定的人员税:增加人力,总产出增加,但每增加一个人的贡献就会减少,因为协调开销会增加。这是一个大问题。现代组织使用非结构化沟通渠道(Slack、Teams)、共享代码库和集中文档等工具来缓解这个问题,但仍然存在巨大的摩擦。为任何决策揭示合适的背景仍然需要大量人力努力。
凭借现有技术,我们现在可以穿越组织的整个信息环境,按需综合相关上下文。我们可以真正解决全球每个组织都面临的低效问题。
作者 Karel
来源 https://x.com/KarelDoostrlnck/status/2019477361557926281
与您的关注者分享。
回复