张一鸣与字节跳动如何把推荐算法和内容物流结合,将抖音/TikTok扩展为一个全球性的注意力引擎。

张一鸣(1983年生)更为人所知的是字节跳动的创始人,但他的故事少关于创业名声,多关乎一种具体的产品信念。
在南开大学学习时(从微电子转向软件),他先后在暴露于搜索、信息流和消费互联网规模问题的岗位上工作:在旅游搜索创业公司酷讯构建产品、在微软中国短暂任职,然后创办了早期房地产产品 99房。
张的核心问题很简单:如何快速把合适的信息推给合适的人,而不需要用户做大量工作?
早期互联网产品假设用户会搜索或关注门户与分类。但随着内容激增,瓶颈从“信息不足”变成“信息过载”。他的产品论点是,软件应该承担更多过滤工作——并且持续地做——这样每次交互都会提升体验。
从一开始,字节跳动就把个性化视为一等的产品原语,而不是事后添加的功能。这一心态体现在三个反复出现的选择上:
这是一篇机制拆解,而非神话:推荐算法、产品设计和“内容物流”如何协同工作——以及这对于创作者、广告主和全球化安全意味着什么。
字节跳动并不是从短视频起家。它起始于一个更简单的问题:当信息太多时,如何帮助人们找到有用、有趣的内容?
张一鸣的早期产品是新闻和信息类应用,旨在学习每个用户关心什么并相应地重排信息流。
突围的早期产品是今日头条(一个“头条”类应用)。它没有让用户去关注出版社或朋友,而是把内容当作库存,把信息流当作个性化的店面。
这种框架重要在于,它迫使公司及早构建核心机械:对内容打标签、对内容排序,并实时衡量满意度。
当时多数消费类应用依赖社交图谱——你认识谁决定你看到什么。字节跳动押注兴趣图谱——你看什么、跳过什么、阅读什么、分享什么、搜索什么决定你接下来看到什么。
这一选择让产品在上线时对网络效应的依赖更小,而更依赖于尽快把推荐做“够好”。
从一开始,字节跳动就把产品决策当作假设。功能、布局和排序微调被持续测试,胜出版本快速上线。
这不仅仅是把 A/B 测试当工具,而是一种奖励学习速度的管理体系。
当推荐引擎对文章有效后,进入更丰富的格式是自然的下一步。视频提供了更清晰的反馈信号(观看时长、重播、完播)、更快的内容消费,并且如果信息流能保持持续相关性,回报更高——为抖音与后来的 TikTok 奠定了基础。
大半媒体史上,问题是稀缺:没有足够的频道、出版者或创作者填满每个利基。分发很简单——开电视、看报、访问少数网站——“最好”的内容是通过有限门槛的那些。
现在瓶颈翻转了。内容比任何人能评估的都多,即便只在一个类别内也是如此。这意味着“内容过多”不再是创作问题,而是分发问题:价值从发布更多帖子转向帮助合适的观众快速找到合适的内容。
按时间排序的信息流假设你已经知道该关注谁。它们在跟进朋友或一小撮创作者时很好,但在以下情况中会困难:
基于关注的发现也偏向既有者。早期几个账户占据注意力后,其他人增长更难——无论内容质量如何。
当内容充足时,平台需要区分“被看到”和“被喜欢”的信号。观看时长重要,但不是唯一线索。完播率、重看、暂停、分享以及“不感兴趣”动作帮助区分好奇与满意。
在广播模型里,规模意味着把一个爆款推给数百万。在个性化模型里,规模意味着把数百万个不同的“小爆款”送到合适的细分受众那里。
挑战不是覆盖面——而是以速度、反复地对每个人实现相关性。
字节跳动的信息流(抖音/TikTok)之所以看起来神奇,是因为它们学习得很快。但核心想法很直接:系统不断猜测你会喜欢什么,观察你接下来做了什么,然后更新下一次猜测。
把信息流想象成一个有数百万商品的商店。
候选生成是“短名单”步骤。从庞大目录中,系统拉出几百或几千个可能适合你的短视频。它使用宽泛线索:你的语言、位置、设备、关注账号、你互动过的话题,以及相似观众喜欢的内容。
排序是“最终排列”步骤。从短名单中,它预测你此刻最可能观看并享受的视频,并据此排序。这里的微小差异很重要:换两个视频的位置可能改变你下一步的观看,从而改变系统学到的东西。
算法不是读心术——它读行为。常见信号包括:
重要的是,它也学习“负面”偏好:你持续跳过、静音或标为不感兴趣的内容。
对于新用户,系统从安全、多样的推荐开始——你所在地区和语言的热门内容,加上一些类别的混合——以便快速检测偏好。
对于新视频,通常会做受控“试验”:把它推给小范围可能感兴趣的群体,如果参与度强就扩大分发。这就是没有现有受众的创作者也能突围的方式。
短视频在几分钟内产生大量反馈:大量观看、划动、完播等。密集的信号流帮助模型快速更新,缩短“测试”与“学习”之间的循环。
字节跳动可以对不同用户组展示略有不同的排序规则(例如,把分享的权重提高),如果某个版本改善了有意义的结果——例如满意度和高质量使用时间——它就会成为新的默认,循环继续。
字节跳动的信息流常被描述为“上瘾”,但真正发生的是一个复合的反馈系统。每一次划动既是选择,也是测量。
当你观看、跳过、点赞、评论、重看或分享时,你在产生信号,帮助系统决定下一次展示什么。
单次观看信息量有限。但数以百万计的微小动作——尤其是重复模式——会勾勒出哪些内容更能抓住你的注意力。平台利用这些信号来:
这就是飞轮:参与 → 更好匹配 → 更多参与。匹配越好,用户停留越久;额外的时长产生更多数据;数据再次提升匹配。
如果系统只追逐“过去有效的更多内容”,你的信息流会很快变得重复。因此多数推荐系统会刻意包含探索——展示新颖、相邻或不确定的内容。
探索可以表现为:
做好后,它保持信息流新鲜,并帮助用户发现他们不知道要搜索的东西。
飞轮也可能朝错误的方向旋转。如果赢得注意力最简单的方式是耸人听闻、煽动或极端内容,系统可能过度奖励这些内容。个性化过窄时会形成过滤气泡。
平台通常用多样性规则、内容质量阈值和安全政策(稍后会讲)来平衡满意度与新颖性,并用节奏控制避免“高唤醒”内容占据每次会话。
当人们谈论字节跳动时,通常指出推荐算法。但还有一个更安静却同样重要的系统:内容物流——把视频从创作者手机快速、安全、反复地送到合适观众屏幕的端到端流程。
把它想成注意力的供应链。不是仓库和卡车,而是管理:
任何一步如果慢或不可靠,算法可用的内容就少——创作者的动力也会下降。
高绩效的信息流需要稳定的“新鲜库存”。字节跳动式产品通过降低制作成本来帮助创作者更频繁产出:应用内模板、特效、音乐片段、编辑快捷方式和创作提示。
这些不仅是好玩的功能。它们标准化了格式(时长、纵横比、节奏)并让视频更容易完成,从而提高发布频率并使得表现更易比较。
上传后,视频必须被处理为多种分辨率和格式,以便在不同设备和网络条件下顺畅播放。
快速处理很重要,因为:
可靠性也保护“会话”。如果播放卡顿,用户停止滑动,反馈回路就会变弱。
在大规模下,审核不是单次决策——而是工作流。多数平台使用分层步骤:自动检测(垃圾信息、裸露、暴力、侵权音频)、风险打分,以及对边缘案例和申诉的人工复审。
规则只有在被一致执行时才有效:清晰的政策、审核员培训、审计轨迹、升级路径和度量(误判率、周转时间、重复违规者)。
换言之,执行是一个必须随着内容速度演进的运营系统。
字节跳动的优势不只是“算法”。更在于产品如何被构建以生成信息流所需的正确信号——并保持这些信号不断流动。
优秀的推荐系统需要稳定的供应。TikTok/抖音通过随手可用的相机、简单的剪辑、模板、滤镜和庞大的音库来降低创作摩擦。
两个设计细节很重要:
更多创作者更频繁发帖意味着信息流有更多变体可供测试——也有更多机会找到匹配。
全屏播放器移除了竞争性的 UI 元素,鼓励一个明确动作:划动。默认开声增加情绪冲击并让趋势可移植(一个音频成为共享参考)。
这种设计也提高了数据质量。当每次划动都是明确的是/否信号时,系统比在注意力被分散的界面中学得更快。
重混形式把“创作”变成“回应”。这很重要,因为回应继承了上下文:
实际上,重混是内置的分发——无需粉丝也能传播。
通知可以重新打开循环(新评论、创作者更新、直播事件)。连玩机制和相似机制能提升留存,但也可能推动人们成瘾性检查。
有用的产品教训:偏好有意义的提示(你请求的回复、关注),而非施压提示(害怕失去连击)。
小的选择——即时播放、最小加载、单一主手势——让推荐信息流成为探索的默认方式。
产品不仅在展示内容;它在训练一种重复行为:打开应用 → 观看 → 划动 → 微调。
字节跳动不是“翻译一个应用”然后叫它国际化。它把全球化当作产品问题和操作系统问题同时处理:人们喜欢的东西高度本地化,但交付这些内容的机械必须一致。
本地化从语言开始,但很快延伸到语境——迷因、音乐、幽默以及什么节奏算“好”的视频。
本地创作者社区在这很重要:早期增长常依赖一小批本地创作者设定的基调,被其他人复制。
团队通常会本地化:
随着使用增长,信息流变成物流操作。区域团队处理合作伙伴关系(唱片、体育联盟、媒体)、创作者项目和反映当地法律的政策执行。
审核以分层方式扩展:主动过滤、用户举报与人工复审。目标是速度与一致性——快速移除明显违规,同时用本地专业知识处理边缘案例。
走向全球意味着要适应应用商店规则和设备约束。更新可能被审核流程延迟,功能按地区不同,低端手机迫使在视频质量、缓存和流量使用上做艰难取舍。
分发不是市场营销的注脚;它塑造了产品能可靠做到的事。
趋势能在几天内出现或消失,而政策编写和审核培训需要数周。团队通过为新兴格式制定“临时规则”、快速执行指导并在动荡时紧密监控来弥合这一差距——随后把有效做法转化为持久政策与工具。
更多关于信息流背后支持系统的内容,请见 /blog/content-logistics-hidden-system-behind-the-feed。
字节跳动的信息流常被称为“算法”,但它更像是一个市场。观众带来需求(注意力)。创作者提供库存(视频)。广告主通过付费获得可预测且安全地接触这些注意力,从而为系统提供资金。
创作者不仅是上传内容;他们生产推荐系统可以测试、分发与学习的原材料。
持续的新帖流给平台更多“实验”机会:不同主题、开场、格式与受众。
作为回报,平台提供塑造行为的激励:
品牌通常更关心可重复的结果而非病毒式运气:
推荐允许小众社区蓬勃发展而不需要巨大的粉丝数。同时,当大量观众产生相似反应时,它能迅速聚集注意力形成大众趋势。
这一动力为创作者带来战略性张力:小众内容能建立忠诚,跟风参与能迅速提升触达。
因为分发基于表现,创作者会为系统能快速读懂的信号做优化:吸睛开头、清晰格式、系列化行为和稳定发帖。
它也奖励“易读”的内容——明确主题、可识别音频、可重复模板——因为这些更容易在规模上匹配到合适观众。
字节跳动的超能力——为参与度优化信息流——创造了一个内在张力。同样告诉系统“人们无法停止观看”的信号,不会自动告诉它“这对他们有益”。在小规模时这看起来像是 UX 问题;在抖音/TikTok 规模时,它变成了信任问题。
推荐系统从用户的行为中学习,而非他们事后希望自己做的事情。快速重播、长时间观看和深夜滑动易于测量。后悔、焦虑和强迫性使用难以量化。
如果信息流仅为可测量的参与度调整,它可能过度奖励引发愤怒、恐惧或强迫的内容。
跨市场会出现一些可预测的风险:
这些并不需要公司内部的“坏人”;它们可以从平常的优化中自然涌现。
人们常问一个简单问题:“我为什么会看到这个?”实际上,排序混合了数千个特征(观看时长、跳过、新鲜度、设备上下文、创作者历史)以及实时实验。
即便平台列出因素清单,也很难为某一次具体展示给出单一、可读的人类理由。
安全不仅是事后审核。它可以被内置到产品与运营中:对敏感主题增加摩擦、对未成年人更强限制、多样化以减少重复暴露、对夜间推荐的限制,以及清晰的重置或调节信息流的工具。
在运营层面,这意味着训练有素的审核团队、升级路径和可衡量的安全 KPI——而不仅仅是增长 KPI。
关于允许什么、申诉如何处理以及执行如何审计的政策直接影响信任。如果用户和监管者认为系统不透明或不一致,增长会变得脆弱。
可持续的注意力不仅需要让人继续观看,更要获得被持续出现在用户生活中的许可。
字节跳动的成功让“推荐 + 快速发布”看起来像简单配方。可复制的不是某个模型,而是围绕发现构建的操作系统:紧密的反馈回路、清晰的衡量与对供给端管道的重大投入。
快速迭代在配合可测目标和短学习周期时有效。把每次改动当作假设,少量发布,每日而非季度读取结果。
把关注点指标放在用户价值上,而非只是停留时长。例如:“以关注结束的会话”、“被保存/分享的内容”、“调查满意度”或“创作者留存”。这些比纯观看时长更难,但能引导更好的权衡。
没有护栏的参与度优化。如果“更多分钟”是唯一记分牌,最终会奖励低质量、极化或重复的内容,因为它们粘性高。
也别相信算法能取代编辑判断的神话。发现系统总会编码选择:提升什么、限制什么、如何处理边缘案例。
从约束开始,而非口号:
推荐依赖内容物流:工具、工作流和质量控制。早期就要投入于:
如果你在做预算,把整套系统——模型、审核与支持——的成本都算进去,再考虑扩展(/pricing)。
对构建软件产品的团队来说:许多“系统”投资(仪表盘、内部工具、工作流应用)如果能缩短构建-衡量-学习环路,其实很容易快速原型。像 Koder.ai 这样的平台能通过聊天界面让团队“vibe-code”网络应用,然后导出源码或部署——适合快速搭建实验仪表盘、审核队列原型或创作者运营工具,而无需长期等待传统构建流程。
更多这类产品思考,请见 /blog。
字节跳动的核心产品论点可以用一个简单方程概括:
推荐算法 + 内容物流 + 产品设计 = 可扩展的注意力引擎。
算法将人和可能感兴趣的视频匹配。物流系统确保总有可看的内容(供给、审核、标签、分发、创作者工具)。产品设计——全屏播放、快速反馈信号、低摩擦创作——把每一次观看变成改善下一次观看的数据。
一些重要细节在没有内部访问的情况下仍不清楚或难以验证:
与其猜测,不如把公司、批评者或评论员的公开说法当作假设,去寻找披露、研究与可观察产品行为之间的持续证据。
如果想更深入但不想过于技术化,可关注这些主题:
如果你常备这些问题,就能更清晰地分析 TikTok、抖音以及任何未来的信息流产品。
张一鸣的产品论点是,软件应该通过行为信号持续地为你过滤信息,使得每一次交互都会提升体验。在内容爆炸的世界里,产品的任务从“帮我去找信息”变成了“在当下决定什么最相关”。
社交图谱的信息流由你关注谁驱动;兴趣图谱的信息流由你的行为驱动(观看、跳过、重看、分享、搜索)。兴趣图谱的方法在你刚开始关注很少人的时候也能工作,但它高度依赖于早期把推荐做“够好”并且能快速从反馈中学习。
大多数信息流做两件事:
候选生成找到“可能合适”的项;排序决定最终顺序,微小的调整会改变你下一步的观看行为。
最强的信号通常来自可观测的行为,尤其是:
点赞和评论有用,但观看行为往往更可靠,因为大规模下更难伪造。
对于新用户,平台用多样且“安全”的热门内容(按语言/地区)来快速探测偏好。对于新视频,通常进行小范围的试验性分发:先把视频推给可能感兴趣的小群体,若互动强则扩大分发。实际上,这让没有大粉丝的创作者在早期表现优秀时也能被推爆。
探索能防止信息流变得单调,它会有意测试相近或不确定的内容。常见做法包括:
没有探索,系统会过拟合并产生狭窄循环,让体验变旧或极化。
“失控的优化”指的是当赢得注意力的最简单方式是耸人或极端的内容,算法无意中会奖励这类内容。平台通常通过多样性规则、质量底线和安全策略来对抗,同时用节奏控制避免高唤醒内容占据每一次会话。
“内容物流”是将创作者手机里的内容端到端送到观众屏幕上的管道:
如果这条管道缓慢或不可靠,推荐就缺少高质量库存和强反馈循环,算法效果也会受影响。
低门槛创作工具(模板、特效、音库、简易剪辑)提高发布频率并标准化格式,使内容更容易被测试和比较。重混机制(合拍/拼接)则把新内容锚定到已有片段——这既是传播手段,也让系统更快理解兴趣图谱。
A/B测试把产品决策变成可衡量的假设。团队小步迭代(界面、排序权重、通知等),衡量结果并快速推行胜出方案。为了保持负责,指标应超越纯粹的观看时长,例如满意度、保存/分享、“不感兴趣”率、投诉率等,这样增长不会以牺牲用户福祉为代价。