句子互动情报站 AI 最前沿 AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆

AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆

广告位

前言    

「如果将艺术和科学融合在一起,伟大的事情就会发生。」—— Runway CEO Cris Valenzuela

无论是抖音、Tiktok 在海内外的风靡,还是2023年底开始短剧出海的火热,无不透露出一个事实——几乎所有形式的内容都在走向「视频化」。视频已成为互联网上最重要的媒介,据 Cisco 的一份报告显示:视频内容已占据超过 80% 的互联网流量。

相较于文本、代码和图片,视频生成一直被认为是生成式 AI 的一大「高地」,因为计算量更大、高质量数据集更短缺、可控性和稳定性更低等。但在刚刚过去的2023年,无论是 HeyGen 在社交媒体的爆火,还是 Runway 、Pika 引发的全网惊叹;无论是开源视频模型 Stable Video Diffusion 的发布,还是大厂如 Google、Meta 等不断迭代的更高质量视频生成模型…… 这些似乎都在预示着:AI 视频生成领域即将迎来重大转折。

2023年12月12日,著名华人、全球 AI 领袖李飞飞院士及她所带领的斯坦福 AI 研究团队联合 Google 发布基于 Transformer 的 Diffusion 模型 W.A.L.T,生成效果再次惊艳 AI 界。英伟达高级科学家 Jim Fan 转发并评论道:2022年是图像之年,2023年是声波之年,而2024年将是视频之年!还有12月27号马斯克对一位网友用 Midjourney+Pika 生成的高质量迷你剧发表评论说:2024将是「AI电影」元年。

另外根据 eMarketer 的一份报告显示:2023年全球电商市场的销售规模接近6万亿美金,并将在未来几年持续呈现增长态势。而电商行业占比最大的支出,往往就是营销和销售。

所以,一边是技术驱动变革且即将迎来爆发的 AI 视频生成,另一边是拥有庞大市场规模前景广阔的全球电商营销,如果将两者结合,会迸发出怎样的火花和机遇呢?

本期我们非常荣幸,邀请到全球化 AI 视频生成 SaaS 企业、AI 内容营销创作平台 —— Boolv 布尔向量的 CEO KenWang 王庆,和我们一起聊聊 AI 视频生成+电商营销相关话题。

*本文是「出海相对论」第十三期文字版,略有删改,搭配音频食用效果更佳。文章较长,超22000字,有 AI 视频生成+电商营销在跨境电商和全球市场的最佳实践与一线洞察,可在微信读书模式,结合大纲阅读。

大纲 & 话题
1. 为什么要将 AI 技术、艺术审美和商业融合起来?有什么最佳实践?
2. 创业公司相比大厂在模型、算法、数据等方面有何不同?如何打造出差异化优势?
3. 如何保证品牌调性和信息颗粒度,生成高质量的客户满意的视频内容?
4. 为什么要做全链路营销 SaaS,而不只是内容生成?背后有什么思考?
5. 海外 SMB 市场如何完成冷启动?如何找到 PMF?
6. 结合服务跨境电商独角兽的最佳实践,AI 时代早期企业服务的商业模式应该如何?怎么做好 Enterprise/KA 服务?
7. 怎么组建一支完备的全球化团队,并在创业过程中一起成长?
8. 是否考虑类似 HeyGen 的方向和策略?以及对爆发式增长有怎样的期待和计划?
9. AI 视频生成领域何时会迎来 GPT 时刻,如何去描述这样的一个时刻?
10. AI 视频生成领域进一步发展会如何影响电商营销格局?品牌方和服务商需要做哪些准备?

AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第1张

Jay:欢迎来到全新对话类出海中文播客——出海相对论。大家好,我是 Jay。
佳芮:大家好,我是佳芮。
Jay:本期我们的话题是 AI 视频+电商营销,或者说是 AI 视频生成在电商营销领域应用的话题。
无论是抖音、Tiktok 在海内外的风靡,还是2023年底短剧出海的火热,都透露出一个事实——那就是几乎所有形式的内容都在走向「视频化」。视频已经成为互联网上最重要的媒介,Cisco 的一份报告显示,视频内容已占据超过 80% 的互联网流量。
报告地址:
https://www.cisco.com/c/dam/m/en_us/solutions/service-provider/vni-forecast-highlights/pdf/Global_Device_Growth_Traffic_Profiles.pdf
从历史来看,视频的发展呈现出两个明显的趋势:一是视频信息密度的不断提升,二是视频生产及分发不断的降本增效。人们对视觉信息的无止境追求是推动其发展的底层原因,而每次真正让视频产业走向突破和繁荣的决定性力量,归根结底还是技术。
胶片技术催生了好莱坞与迪士尼的黄金时代;数字影像技术铺平了如 YouTube 等中长视频平台的兴起之路;移动和算法时代以 TikTok 为代表的短视频平台强势崛起;AI 时代的到来,让视频创作迎来空前的民主化,势必将造就更具想象力的商业和社会前景。
相较于文本、代码和图片,视频生成一直被认为是生成式 AI 的一大「高地」,因为计算量更大、高质量数据集更短缺、可控性和稳定性更低等等。但在刚刚过去的2023年,无论是 HeyGen 在社交媒体的爆火,还是 Runway 、Pika 引发的全网惊叹,无论是开源视频模型 Stable Video Diffusion 的发布还是大厂如 Google、Meta 等不断迭代的更高质量视频生成模型…… 这些似乎都在激情地预示着:AI 视频生成领域即将迎来重大转折。
2023年12月12日,著名华人、全球 AI 领袖李飞飞院士及她所带领的斯坦福 AI 研究团队联合 Google 发布基于 Transformer 的 Diffusion 模型 W.A.L.T ,生成效果再次惊艳 AI 界。英伟达高级科学家 Jim Fan 甚至转发并评论说:2022年是图像之年,2023年是声波之年,而2024年将是视频之年!
W.A.L.T 发布链接:
https://twitter.com/drfeifei/status/1734266529431044152?s=12&t=0hi_zov6zXj3Ap9cGzwJ3w
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第2张
还有12月27号马斯克对一位网友用 Midjourney +Pika 生成的高质量迷你剧发表评论道:2024将是「AI电影」元年。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第3张
另外根据 eMarketer 的一份报告显示:2023年全球电商市场的销售规模接近6万亿美金,并将在未来几年持续呈现增长态势。而电商行业占比最大的支出,往往就是营销和销售。
eMarketer 报告地址: 
https://www.insiderintelligence.com/chart/263530/retAIl-ecommerce-sales-worldwide-2021-2027-trillions-change-of-total-retAIl-sales
所以,一边是技术驱动变革且即将迎来爆发的 AI 视频生成,另一边是拥有庞大市场规模前景广阔的全球电商营销,如果将两者结合,会迸发出怎样的火花和机遇呢?
铺垫到这也差不多该介绍我们本期的嘉宾了,他就是——全球化 AI 视频生成 SaaS 企业、AI 内容营销创作平台 —— Boolv 布尔向量的 CEO KenWang 王庆。
Boolv 布尔向量官网:https://boolv.tech/
布尔向量成立于2021年底,总部位于香港,成立不久便连续获得两轮近千万美金融资,投资方包括线性资本、火山石投资、德迅投资、 UpHonest Capital 等。在布尔向量服务的客户中,不乏国内知名的跨境出海独角兽品牌,可以说布尔向量是Day 1开始就同时深耕 AI 视频生成和电商营销领域的典型企业。
按照惯例,我们先请王庆总简单介绍一下自己和布尔向量这家公司及产品。
王庆:大家好,我是布尔向量创始人王庆。布尔向量是一家用 AI 帮助跨境电商的商家和全球的电商商家快速制作营销短视频的一家技术公司。我们提供比如图转视频、混剪视频、长视频剪短视频等一系列的功能,主要是帮助商家制作短视频并用于各种社媒的投放,比如 Facebook、Instagram、 Tiktok 等平台,以及商家在各个广告渠道的投放视频,包括 Amazon 的广告系统,包括 Meta 的广告系统,以及 Google 的广告版位等。因为就现在来讲,大量的投放其实都是基于视频去做的。
我们主要服务两类客户:一类就是跨境电商的商家,我们在国内也服务了很多的跨境电商独角兽商家,他们主要是用我们的 API,我们会部署SaaS,同时也做一些交付的服务。
另外海外的话我们其实也在不断研发基于 PLG 的 SaaS。我们在海外为用户提供 API,为用户提供订阅制的 SaaS 服务。现在在线上可以看到主要是图转视频和混剪视频这类功能模块。我们还有很多功能在迭代过程中,目前我们主要是这两块的内容和业务。
Jay:先问一个可能有点虚但我很感兴趣的话题。我发现你之前说过:对于电商营销领域,其实不单单是一个「平均智能」的概念,生成式 AI 很长一段时间的智商还是以人类平均线为目标的,而电商营销要做的好,其实需要很强的行业认知和对品牌,艺术,消费心理等方面的理解,这些 AI 技术目前还远远做不到。
你的合伙人加号之前也有类似表述,他说:将艺术、商业、AI 技术融合在一起,是一个很大的命题,也是你们在探索落地场景的方向。
更有趣的是我发现两家 AI 视频生成领域的明星公司 —— Runway 和 Pika 的创始人也都有过类似表述。Pika 的联合创始人、算法大神 Chenlin 说:如果训练数据集不够好看,模型学到的人物也不会好看,因此最终你需要一个具有艺术审美修养的人,来选择数据集,把控标注的质量,并及时提供反馈。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第4张
Runway 的 CEO Cris Valenzuela 在2023年8月份接受播客 Acquired(这也是芒格生前唯一参加过的一档播客) 的采访时,在最后提到 Runway Studios 的时候他说:这是我们的娱乐部门,是电影制作人、艺术家、音乐家的创意合作伙伴。可以把它想像成皮克斯,我们希望从创意的方面突破讲好故事的界限。我认为,如果你将艺术和科学融合在一起,伟大的事情就会发生。
Acquired 播客采访链接: 
https://www.acquired.fm/episodes/generative-AI-in-video-and-the-future-of-storytelling-with-runway-ceo-cristobal-valenzuela
我对各位某种程度上达成的共识一点都不怀疑,但是我比较好奇的是:审美是一个难以量化的指标,艺术的标准更是因人而异。所以也是想请教一下王庆总:

Q1:为什么要将 AI 技术、艺术审美和商业融合起来?有什么最佳实践?

王庆:这是一个很好的问题。我以电商为例,如果你是一个电商的商家,你其实是卖两个东西:第一个是自己的产品,就是你自己的这个产品怎么样,满足了用户什么样的功能需求;第二个其实在产品之上更多的是卖自己的品牌,不单单是传递单一的产品功能,更多的是传递一个品牌的理念、一个品牌的想法,甚至一个品牌的情感。
对用户来讲,如果载体是一个视频的话,你怎么样让用户在接触视频内容的第一时间,就能让他产生了解欲望、打开欲望和购买欲望,这个其实最重心的不单单是一个产品功能向,更多是你要传递你的理念,传递你的场景,传递你的情感的表达。而情感的表达往往跟艺术是最相关的。
功能上的表达其实可能用技术,用相关的文字转视频、图转视频等技术就可以达到。但是如果你要做场景化的表达,做情感的表达,其实核心点还是在于你需要有自己的审美。你的内容应该代表品牌,要有品牌的审美,然后要有品牌想要传递给用户的理念,然后把它们给结合起来。
刚开始我们也觉得电商营销视频生成可能是一个偏技术向的东西,把投放的数据好的视频做一些解构。但我们在服务过程中会发现不同品牌的理念是不一样的,所以说品牌会非常在乎审美,因为最终会体现在品牌投放视频的数据上。
电商有一个 ROI(投入产出比)的概念,就是投的 campAIgn 的视频素材成本,和用户购买的 GMV 之间的占比,我们发现审美好的视频会非常直接体现在 ROI 的提升上。
比如我们和广美有很多合作,其实跟他们合作去制作了大量的、针对各个场景的、充满理念化的、充满艺术气息和高审美的一些视频的 template,也就是视频的模板,我们发现在整个商业化环境里的表现是非常好的。
举个例子,比如你是一个服装企业,你把视频投放在某一个平台,比如说在 Facebook 平台上投广告,那这个时候你就要针对 Facebook 本身的广告受众人群,为他们定制各种各样的场景,同时要基于品牌产品的理念,给用户传递一个美的东西、高质量的东西、精细化的东西。然后把这些元素抽象出来,你可能需要制作大量的,比如几十上百个针对化的 template,可能非常短,15-30秒之间,但这样出来的 ROI 数据其实是完全不一样的。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第5张
所以营销视频生成不是一个完全技术驱动的东西,它是把商业、视觉上的审美、叠加 AI 自动化的技术,然后才能体现在最终好的数据效果上。
佳芮:我分享一个有意思的故事。因为我的公司句子互动也在做 AI Agent 平台,我们最近在为一个巨头做视频 Agent 应用,这个大厂自己有上千个视频来教自己的客户投广告,所以他们在这个场景下就有三个需求。
第一个他们想让没看过这个视频的人在看之前知道这个视频大概讲了什么,决定要不要学;然后第二他们还想知道这些视频所有的摘要是什么,那就需要比如说把视频分为三大块,知道每大块内容分别都是什么;第三个需求就是当客户有问题的时候,他们希望能直接去问这个 Agent,能帮客户定位到这个问题的答案在视频的哪个部分,比如说在视频的3分50秒,进而就能更好地掌握视频的内容。
所以我们就需要给这上千个视频做摘要、脑图,自动生成测试并给出答案。并且我们也要通过把视频转成文本以后做成知识库的方式,用户在提问的时候就会知道答案在几分几秒。
其实当时我们是对比了几家不同的厂商,包括布尔向量还有几个比较头部的大厂,他们各自语音转文字的能力,包括视频也是中英混合的。最后对比下来,确实发现布尔向量的效果是最好的。
而且除了效果好比如错别字非常少之外,布尔向量还有一个特别好的我亲身体验的功能,就是时间戳。其他大厂就是给出视频(语音)转文字,但我们其实是需要时间戳的,就是类似于字幕的这种时间戳,这样才能去定位答案在几分几秒。而我们测的这些厂商里边号称各种能力都有,但真的拿 API 的时候确实只有布尔向量给的出来,所以我们整个 Agent 后来在视频转文字的这个场景里面就选了布尔向量。
其实在 AI 大模型非常火热的今天,除了算法,很多工程化的细节都是非常重要的。我看到你在之前的公开访谈中说到:在技术方面,布尔向量不局限于某一类单一算法,而是不断探索跨领域、跨场景、跨模态的算法和模型。比如换装技术,换脸技术,视频动态化技术,甚至可以支持到商户从模特库选择虚拟模特,从而自动实现一些建模、换装、视频等效果。
你还说到:不同于一般的算法生成技术,布尔向量结合品牌市场营销,在使用 AI 技术的同时接入市场数据,算法通过大数据分析市场偏好和趋势,生产能够有效引起市场反馈的视频内容。
所以我其实也蛮好奇的,你们拥有自己的模型、算法能力和独特的数据,但毕竟创业公司的资源是远低于大厂的,你们能够在某方面领先一定是有些独到之处。所以延伸一下,能不能站在你们和整个创业公司的视角分别分享一下:

Q2:创业公司相比大厂在模型、算法、数据等方面有何不同?如何打造出差异化优势?

王庆:谢谢夸奖。首先我们公司本身是有模型训练能力的,所以我们其实也会承接一些像文本模型的训练,本身也是跟视频相关,跟视频相关的文本模型的训练、图片模型的训练,视频模型的训练,我们其实都会去做一些承接和合作,所以有相关的训练需求我们都可以多去讨论,然后看看有没有一些合作空间。
回到刚才您说的问题,就是创业公司和大厂的比较,其实我自己最深刻的感受是看起来大厂有很多优势,比如数据比较多,模型的话大厂现在都在自建模型,做得也非常通用化,用户也非常广。但我觉得反而这里面可能创业公司可以找出一些差异化优势。
为什么呢?因为首先大厂很多都是在做自己的底座模型,但底座模型其实不太好做。目前没有一个中国的大厂会说自己的模型已经超过了 GPT-4,是吧?但对创业公司来讲就是什么好用我就用什么嘛。在选择底座模型时,其实基于最好的模型去做反而是一个优势。你基于最好的模型去做,其实你整个的局限性是相对更小的,因为我们是在大模型和他们的数据基础之上去微调我们自己的模型的,这其实是更加高效和快捷的。
所以对创业公司来讲,我觉得最合理的方式就是你用最好的模型,基于你的需求,然后再做你自己的模型训练。
另外就是大公司肯定是瞄准巨大的市场,做通用化的事情。而比如说电商领域,包括刚才说的很细节的视频时间戳和文本的这种训练,大厂肯定不会做的。或者就算大厂做了,肯定做得也没有那么精细化。他们可能会包装有这些功能,但其实在每个功能上未必有创业公司专业。
因为创业公司的资源有限,所以还是要专注在自己的模块去做。而大厂本身研发能力强,然后人又多,肯定是瞄准很大的市场,所以自然而然会忽略一些相对比较细分的一些领域。另外比较细分的数据集,大厂可能也是没有的。
所以我觉得创业公司要打造自己的差异化优势的话,可能某种程度上也是大家达成的共识吧,就是首先你要看自己的优势是啥。应该基于我们自己的优势,去做更多更深入的研究和更多更深入的服务。而不是去拼,去拿大厂的客户,去做通用化的客户和通用化的场景,其实是没有自己太多的优势的。
所以结论就是我们要在一些比较细分的领域,做自己的数据,基于最好的模型去微调自己的模型,然后去深化,做自己最擅长的领域。这可能是我觉得在当前这个阶段,AI 创业公司为数不多能真正商业化和能推出有优势壁垒产品的场景。
我举个例子,之前在做图转视频的时候,其实这是个很小的功能,但我们调研了很多大厂,按理说这也是个相对通用化的功能,但在图转视频这一块,基本上全球范围以内其实是没有几个公司在做的,所以我们就可能在这块做得比较透彻一点。包括我们图转视频的 API,尤其在电商场景,我们做完之后发现有很多公司会找到我们问,你们有没有这个 API?你们可不可以做这一块?因为他们很多也是技术公司,他们其实也会去看市面上很多 API,发现在电商这个领域里没有这个 API,那这样的话我们就可以把 API 卖出去,自然而然就能够商业化。
我觉得因为 AI 本身来讲刚刚起步,如果真的要实现很落地的商业化的话,除了通用化,我们基于本身 SaaS 的订阅收费,然后做一些异业合作,或者是不同公司之间的一些联合,做自己擅长的这一块,你其实可以做出很多大厂现在还没有触达,或者是他们不屑于触达,或者是他们即使触达也要花很多人力物力才能做得好的一些领域,这个时候你的优势和差异化可能就出来了。
Jay:我可以补充一下,因为刚王总说图转视频 Image to video 没有人做,大家可能会有一点疑问,因为比如说 Runway,Pika 都是有 Image to video 的。但是布尔向量的图转视频其实不太一样,比如说我看到可以一键上传 Shopify 链接,然后就可以直接基于链接的商品图自动去生成不只是几秒钟的视频,而是十几秒的成品视频。而现在大厂生成的这些可能也就是两三秒,而且不光是要有图片,你还要去写 prompt,然后基于图片做非常微小的一些变形,而不会像布尔向量这样生成一个成品视频。
所以大家如果感兴趣可以去试一下,确实是和市面上不管是大厂还是其他的一些创业公司的产品是有非常大差异的。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第6张
‍我接着上一个问题继续追问一下,我们知道生成式 AI 为内容创作释放出巨大的生产力。但当我们将生成式 AI 工具运用到企业实际的工作流中会发现:生成的内容无论是个性化程度还是内容生成的稳定性往往都不尽如人意。因为大模型都是基于大量公共数据集进行训练的,而不同行业不同企业的需求和特点却是千差万别的,所以大模型大多数时候都无法做到足够懂得具体客户的特点和需求。
而在电商营销领域,因为品牌都是独特的,不然就难以做到差异化,所以品牌都会希望自己发布的内容有独特的调性,这样才能形成统一的品牌联想,营销也才能更有效率。所以如果能将 AI 快速生成的内容与品牌的风格结合在一起,定向产出具有品牌调性的内容,那对品牌来说将非常有价值。这是个性化或者说品牌调性的问题。
另一个问题是一致性和精细度。现在 AI 生成的视频大多还是能让人看出来的,也就是所谓「一眼 AI」,因为生成的质量和效果还不足够好且不可控。而品牌营销的视频内容即使不像以前都是 TVC、大制作,往往也都需要尽可能做到高质量,尤其是品牌向的内容。
当然,即使是最顶尖的大模型公司也面临这样的问题,因为基础大模型的能力尚且还有局限性。比如我看到去年底(2023年12月19日)Google 推出的视频生成 LLM —— VideoPoet 项目的研究主管蒋路也在采访中说过:大动作、一致性等问题是目前视频生成的难点。因为人对动作是很敏感的,所以视频里一点点奇怪的行为一下就能被发现。所以目前市场上大部分视频生成的公司基本上做的都是运镜非常小的动作,很少有大动作,这对于现有的 diffusion 来说非常吃力。运动建模属于很头部的问题,尤其是复杂动作的连贯性。
VideoPoet 地址:https://arxiv.org/abs/2312.14125
蒋路个人博客:http://www.lujiang.info/
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第7张
补充延伸一下,VideoPoet 不仅能从文本和图像生成视频,还具备风格迁移、视频生音频等功能。而且作为沿着 Transformer 架构而不是 Diffusion 开发的大语言模型,它在动作生成的丰富性和流畅度上都达到了很高的水准,所以被广泛认为是革命性的 zero-shot 视频生成工具,也证明了 Transformer 在视频生成任务上拥有非常大的潜力。
前面也说到布尔向量在某方面能力的表现甚至比大厂还好,不知道是在模型层面的某些能力确实能做到领先,还是说在比如产品层面有什么绝妙的设计,比如导入 Shopify 商品链接就能一键生成品牌视频。我看你们之前也对外宣称:「布尔向量BOOLV」为全球的创造者提供基于生成式 AI 的生产力工具,让创作者可以在终端一键生成可用品牌宣传的视频素材,且保证品牌调性与信息颗粒度。所以想继续请教下:

Q3:如何保证品牌调性和信息颗粒度,生成高质量的客户满意的视频内容?

王庆:我刚刚听你的分享,也觉得受益匪浅。我们先讨论一下刚才你说的视频不可控的问题。
我们现在的确看到很多生成式 AI 的视频,包括图的动态化,包括 Runway 等等产品,其实最大的问题是它们很酷炫,但是想一下却不知道用在哪。造成的结果就是整个用户的付费率可能就没有那么高,这其实是普遍现在市面上我理解很多 AI 产品都会遇到的问题:你说没有用吧其实很有用,你说很有用吧感觉又不可控,或者总觉得要调很久,可能才能有一个有用的东西出来。
所以我觉得对于创业公司来讲,其实很好的方法的确是基于他们整体的框架,基于他们的开源,然后加上自己的模型训练,其实会在某些场景上的确会做得更好一些。因为你创业公司肯定是基于某一个场景或某一个行业,基于你的理解能力,审美能力去做的,所以肯定会做得更好。
另外其实 AI 不可控这个问题也有一些解法。我们自己的解法是第一我们希望在生成 AI 的视频之后,用户可以做很好的二次编辑和调整。包括之前文生图有一段时间非常火,其实很多公司解决了这个能力,整个的转化率就会提升很多。就是说你必须让自己的 SaaS 产品,因为我们做的是应用化 SaaS,它具备可编辑能力和可以对 AI 生成的东西做一些调整。
第二就是刚才说的,我们应该让它基于某一个场景的效果变得更好。也就说你的模型调整能力和你基于模型的数据,然后自己去自训练的数据,去做一些细节的模型调优、 prompt 调优和数据调优,通过这样的能力来解决整体 AI 生成的不可控性。因为目前视频生成还是非常初期的阶段,你真正的要到达商业化的话,如果直接去使用大模型我觉得是无法完成的,就只有部分场景可以去使用。
然后如何保证品牌调性和信息颗粒度,生成比较高质量的视频内容,其实也是和刚说的是相关的。对于每个品牌来讲,本身品牌有自己的调性,有自己的要求,有自己的审美。有一个好的方面是我们可以在不同的品类做一些细分,比如说卖鞋的、卖衣服的,卖 3C 产品的,基于某一个更加细分的领域,我们可以抽象出一些通用化的品牌关键词,通用化的脚本能力,包括一些审美、视觉等等相关的能力。抽象出来之后的话就会变得更加可用,然后我们就可以往生成高质量的客户满意的视频内容去做。
那如何去做呢?其实如果要跟 AI 去结合的话,你会发现这不是一个百分百 AI 的事情。为什么?比如刚才有提到虚拟人可能一眼假,包括很多虚拟人在做直播的时候,的确你不仔细看可能看不出来,但你可能看个10分钟你就可以看出来了。或者是用户看虚拟人卖货的时候,整个的转化率就是没那么高,因为这需要一种情感的传递,而不单单是一个单纯的虚拟人的产品介绍。虚拟人可以起到部分作用,但不能起到替代的作用。
正好我们这两天发了基于刚才你说的那些各种能力,包括图的动态化,包括文生图,包括图转视频,还有针对各种图的编辑能力。我们也刚刚上线了一个基于大模型的工具,其实这些都是可以实现的,都是基于各个大模型去微调,然后再基于电商这个场景去调整出来,然后让用户去使用的。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第8张
所以我觉得要保证整个品牌调性和颗粒度,首先你对整个的行业要有足够的了解,其次尤其在短视频领域,其实是一种混合模式。举个例子,虚拟人虽然说直播场景可能效果没那么好,但是其实虚拟人在解决某一些问题,比如说我就需要一个15秒的投放视频,那我其中3秒或者其中5秒是虚拟人,这个时候就可以解决问题。因为3秒和5秒其实是起到了可能品牌所需要的比如说一个模特,或者需要讲某一种小语种的这个功能已经实现了,但又没有造成一些不好的后果,就是用户看不出来这个虚拟人是假的,因为可能就3-5秒。
接着可能就要结合一些我们自己的视频数据库去做混剪,然后再去结合比如说图片动态化,然后去做生成。这样整体混出来的一个15秒的视频其实是可以被商用的,不单单只是可能像 Runway 这种不断地拉长的15秒,就可能很假;也不单单是像 Synthesia(https://www.synthesia.io/)这种虚拟人,就是一路虚拟人,其实这可能是一个结合的过程,你才能真正地去生成品牌方满意的视频内容。
然后这里面其实会涉及到一些匹配算法的研究,结合你的生成算法,还要结合你的视频数据库,结合你的审美,再结合品牌本身,这个就相对比较难,但是整体来讲这样会让 AI 变得更加可控和更加具有实现性。
佳芮:对,因为我们都是在做 ToB 领域,那 ToB 和 ToC 我感觉还蛮不一样的。ToC 大家希望极具创造性,什么东西都无所谓,反正只要能聊就很好。但是真正到 ToB 场景的时候,客户需要的可控性特别强,所以真正落地的时候发现都是从生成,然后修改,然后再一点点过渡到后面可用这样一个过程。
包括我们自己做 Agent 应用的时候,就有三种模式去切换,分别是全自动模式、人机协作模式,还有机器推荐的模式。机器推荐就是只推荐,然后人去选;那人机协作就是让机器先回答,回答不了再给人,其实都是说人怎么去参与到真正的场景里面。只有很少的客户会使用全自动的模式,因为其实那个风险还是蛮高的。
然后你提到视频的可编辑和调整能力,我想起来之前我们彩云科技那一期,他们也是做文本的。我们当时就聊到图片生成如果生成之后可编辑和调整,他说如果 Midjourney 和 Adobe 的能力结合起来,当 Adobe 增加了生成的能力,那么它的影响力可能会高于 Midjourney,因为大家可能就是想来回调整。
Jay:下一个问题,我在布尔向量产品官网(https://boolv.video/)简单了解了一下你们的产品,发现了一个有趣的功能,就是可以追踪生成的品牌视频在各种社媒上的营销效果数据,比如 Tiktok、X、Youtube 等等。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第9张
我也注意到你之前公开表示过:从用户的角度来看,他们更关心你提供的结果,而不是具体的技术或前后端体验,最终他们最关心的是对销售的影响以及为其业务带来的价值。这些不仅仅是技术问题,而是更多以用户为中心的问题。作为一个一站式视频服务平台,布尔向量不仅能够为品牌方提供生产力工具,并且也具备视频投放的效果分析和营销管理等功能,将服务范围从设计延伸到了应用环节。通过对品牌方投放到市场的每个视频进行追踪并对视频的营销效果进行分析,实现场景化运营,从而帮助品牌方提升市场营销的效果。
目前来看,市面上电商营销场景的 AI 解决方案大体可以分成两种,一种是生成各种营销内容的,帮助企业降低人力成本;另一种是深入细分赛道,通过精准渠道、内容匹配完成营销效果,比如曝光、点击、互动甚至是直接销售等方面的提升。而现阶段的电商营销服务企业更多聚焦于解决第一个生产效率的问题,在营销效果提升方面能够提供完整解决方案的其实并不多,这也和大模型能力相关。但确实在流量成本普遍高昂且企业营销预算缩减的情况下,效果提升才是更多尤其是中小客户更青睐的方式。
我们在 XREAL 那期其实聊到过一个概念:产品不存在好坏,每个产品都是不同的 trade-off。布尔从成立开始就提到要做效果追踪,想请你分享下这段故事:

Q4:为什么做全链路营销 SaaS,而不只是内容生成?背后有什么思考?

王庆:这也是个非常值得探讨的话题,因为全链路这个事的确非常难。就像你说的,有些数据可能跑着跑着就跑走了。但我自己的观点是,第一是我觉得内容生成本身,如果你只是做单点的工具化(当然我们其实自己也有很多工具),你会发现一个问题,就是如果这个工具化本身特别大的模型壁垒的话,其实你很容易被别人抄走。
这其实也是 AI 产品现在面临的一个普遍问题,比如 Runway 出来之后 Pika 出来,之后有另外一家比如 Google 马上就推出。其实从内容生成端如果只是单点工具化来讲的话,壁垒其实也是高的,但是相对大厂来讲是很低的,大厂其实有能力把你可能几十个人研发一两年的东西,他们拉一个几十个人的团队出来可能很快就搞定了。
那创业公司其实刚才也说了,你的核心优势是你对细分领域和场景和商家足够的了解。那你怎么去体现你足够了解呢?就是商家肯定不是一个单点的行为,肯定是一套完整的动作,那这套完整的动作其实大厂就抄不了,同时大厂也大概率来讲不会去做比较细分的领域。所以其实全链路这个事情我觉得很多人都是想去做的,也一定是我们整体要去实现的方向性的东西。
但全链路比较难的点在于哪呢?就是每一个环节你都要做得非常好。万一有某一个环节有失误或者是做得不好的话,可能本来用户愿意为你两个功能买单,然后你给了五个功能,用户发现第四个功能做得不好,可能原本要买的前两个功能他也不买了,很有可能出现这种情况。
所以我们其实也是相对谨慎地往前在做这个功能,最好是我们真正能保证每一个链路上线之后都能做到真正地去产生价值。举个例子,比如说在视频生成的时候,加上刚才说的 Shopify 的 URL,或者是 Amazon 的 URL,其实是往链路上游前进了一小步,可能也仅仅是一小步。
往后的话其实是加上数据追踪,接 API 去做数据追踪。其实是很谨慎地在做,但我觉得如果我们想用 AI 去做创业,其实是不得不去做的,甚至是在你做完之后能很好地提升你整个的议价能力。就是我是为你的整个链路去买单的,真正去为某一批用户去着想。
但可能的损失就是没有在这个链路上的用户可能就不是你的用户了,所以这其实是一个谨慎抉择的过程。所以背后的思考的话可能更多去想它会造成什么样的好处,以及它会造成什么样的影响。尤其如果你本身做的是全球化的 PLG 的 SaaS 的话,其实是比较难的一个过程。包括我们做海外 SaaS 一年多,也是刚刚起步阶段,因为海外 SaaS 整个的周期基本上至少是四五年以上,才会有一些影响力。
但我们观察海外成功的 SaaS ,你会发现往往在前两年他们都在做单点,往往在后面会接上像 team 这类协作功能,包括像刚才说的全链路上下游的功能就会慢慢去接,但是前提条件是他们在前几年的时候其实都会专注一个单点去做。所以我们要非常好地认清楚,最终你会达到的形态肯定是一个全链路的形态,但也要非常清晰地认清楚这是个非常难的事情,它不是以月为维度,甚至是以年为维度,才能真正地去把它给打造出来。但是一旦打造出来的话,这件事整个的价值链路,包括用户的满意度、付费率,包括初创公司的核心壁垒其实都会建立得比较好。
我举另外一个例子,比如说我们现在更多是混剪视频,就是你上传一些短视频或者图片,就可以自动生成一些视频。但在电商的全链路来讲其实不单单是需要这样的功能,可能有直播视频的输入,可能有 URL 的输入,可能有甚至是 YouTube 的链接输入等等。整个来讲你要满足电商商家整体的需求的话,其实还有很多工作要做,我们也在不断地发布自己的产品,但这个过程其实比我们想的要更慢一些。
这也是很有趣的地方,我后来才真正理解为什么海外全球化的那些很厉害的 PLG SaaS 公司, AI 的也好,不 AI 的也好,其实他们的沉淀时间都会比较长,就 SaaS 本身就会时间比较长。不像 ToC 端的产品,可能几个月甚至一年就可以形成爆发性的增长。
Jay:对,下一个问题正好能接着您说的。因为你们在海外市场主要是面对 SMB 这种中小型客户的,Boolvideo(https://boolv.video/)首页显示已经生成大几十万条 AI 视频了,包括我看你们的定价也是海外市场比较成熟的分阶订阅模式,价格和 HeyGen 相比略便宜一点点。从网站的搭建到产品功能的选择,我理解你们已经做了很多次调整且有 PMF 的经验了。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第10张
我们在 MindOS 那期和 FlashIntel 那期其实都聊到过 AI 产品 PMF 的话题,这对于创业公司来说是极其关键的一个里程碑。我们知道从去年开始海外有各种应用开始爆发,AI 流量红利也在逐渐减小,而布尔一开始做的时候其实还没有 ChatGPT,所以那时候其实是没有什么大范围的 AI 流量红利的。
这里我想分享下 HeyGen 创始人徐卓在他们官网2023年4月发的那篇博客《0 - 1M ARR in 7 months(我们是如何7个月做到100万美金ARR的)》,据说 HeyGen 2023年底前已经做到1800万美金 ARR 了。
博客链接:https://www.heygen.com/article/0-1m-arr-in-7-months
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第11张
徐卓在开头就提到了 PMF ,他写到:
我在构建 AI 模型、hacking 和产品开发方面有很多经验。然而在你找到 PMF(产品市场匹配)之前,这些技术都无关紧要,这在如今这个 AI 时代尤其重要。我想谈谈另一个在我们内部使用的理念——AI 市场匹配(AIMF)。
面对新兴技术,要区分演示价值(demo values)和用户价值(user values)是非常有挑战的。许多技术 demo 看起来很酷炫,但长远来看其价值会迅速减弱,只有用户价值才能持久。
当我们在2020年12月创立公司时,生成式 AI 的概念还远未成为主流…… 经过一段时间的探索,考虑到技术可行性和 use case,我们将 spokesperson 发言人(我理解是口播视频素材,因为 HeyGen 一开始的主要产品就是 Avatar 数字人)这个场景作为目标市场。然而就遇到了一个关键问题:我们如何验证这是不是一个真的 AI 市场匹配(AIMF)呢?
答案就在 Fiverr 上(一个总部位于以色列的全球任务众包平台,也可以叫自由职业者市场,已上市,市值目前约10亿美金)。
当我们搜索「发言人」这个关键词时,Fiverr 上有1811个可用的服务。如果能将我们的创意 idea 变成出色的产品体验,那么就会有市场需求,人们愿意为我们的解决方案付费。
后来他们发布了第一项服务,提供多语言的发言人视频素材。那时他们的产品还是早期版本,虽然没那么完美,但足够用来测试市场需求。一开始他们也没有透露自己的视频完全是 AI 生成的,因为不是真人去拍的,所以成本很低,报价也只有同类产品平均价格的10%,且10分钟就能完成交付,而不是好几天。所以他们有了第一个付费客户,虽然只有5美金。
再后来他们更新了服务介绍,澄清他们的虚拟人/数字人是由 AI 创建的,但这并没有影响到他们的人气,反而迅速吸引了更多客户(30+)找过来,也帮助他们更好地了解了用例和价格预期。他们发现客户愿意为每分钟的发言人视频支付 3 美金的费用。所以可以说他们用极低的成本和不完美的产品快速找到了 PMF 。
这是一个非常精彩的找 PMF 或者说 AIMF 的例子。找到自己产品 demo 有能力解决的差异化问题,在合适的低成本的渠道(流量洼地)面向目标人群做精准触达,找到真正的用户价值,完成交易闭环。当然这是我的理解。
也想请王庆总结合自身经验分享一下:

Q5:海外 SMB 市场如何完成冷启动?如何找到 PMF?

王庆:我可以分享一些经验,但本身来讲我觉得找 PMF 是一个非常漫长的过程,我们其实也在这个过程中。
刚开始我们可能会找一些社区,现在大家也比较共识像 Product Hunt这种社区会给你带来第一波流量。然后因为现在大家都在出海,就会有很多社群,社群里的人都会给你去点赞,给你去带来第一波的流量,这是一个比较直接的方式。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第12张
我看 HeyGen 也好、ZMO.AI 也好,我们也好,其实都会发布到这些社区上。然后如果你本身产品就有独特性的话,可能你会得到一些流量,比如说你的日榜是第一,或者周榜是第一,你就会拿到一些免费的流量,这个也是比较大的一个共识。
这些流量我觉得更多的是帮助你去发现一些通用性的问题,因为这些社区带来的流量大部分都不是你的付费用户。这只是一个小的引擎和 trigger,让你发现一些 bug,然后发现一些通用用户对你的一些通用化的反馈,这是第一步。
第二步其实可以去找一些行业内的 KOL,包括我们会去找一些电商的 KOL。其实在跟他们沟通的过程中,你会发现本身产品的一些问题,因为他们也试用你的产品,他们可能是这个行业里面的专家,同时他们在 YouTube 上可能会推荐给自己的粉丝。然后你会发现有很多客户,真正的客户就会涌进来,去给你提出很多问题,然后你就会发现你的转化率问题,还有你的产品功能方向的问题。基于这个其实你可以慢慢去做一些调整,这个可以是你的第二波用户。
同时在使用你的产品的时候,很多用户其实是比较开放的,他们会给你不断地发 EmAIl 反馈问题。尤其有些用户开始退订的时候,就是要退款的时候,那他就会去做一些退款的操作,接着他会联系你。那联系的时候其实是一个获取真实反馈很好的机会,因为他订阅你肯定是你的目标用户,他放弃你一定是你哪方面做得不好,这个时候你就可以去做一些调整。
包括我们现在也在不断做调整,比如我们发现很多用户进到我们的页面会感到 confuse,感到非常疑惑,就是这个东西到底是为什么是这样的?然后我们在整个信息框架上都已经改了好几版了,慢慢地去看转化率的提升,然后基于数据去做优化,还有根据用户的反馈去做一些优化。然后在 Google 上就也可以搜到自己的产品了,然后就开始慢慢完成你说的冷启动。
但真正的找到大的 PMF 我觉得是一个奇点。我自己的想法是,首先把你自己想要的功能发布完毕。其次在用户的帮助下,你整个发布的产品转化率问题、付费率问题、留存问题等等被解决。当你真正地完成这些,你基本上就会有一个比较健康的模型,这个时候你才能去说找到了一个非常好的 PMF,我们也是在这个路上。
所以我觉得更多是冷启动方面,分享一些通用化的套路和招数,基本上都是往这个方向去走。因为海外其实是一个相对健康的生态,基本上有一些通用化的方式,你都会获得不错的用户反馈。
Jay:非常好,下一个问题其实也算是承接这个话题,但是角度不一样。前面我们提到过 Runway 的 CEO Cris 在2023年8月份参加的一次 Acquired 播客采访。他在被问到商业模式时表示:
对于人工智能未来的商业形态和模式,现在下定论还为时过早。但我认为有趣的观点是:定制很重要,可控很重要,微调对于大客户和大企业来说也很重要。
从 SaaS 的角度来说,我还挺赞同之前 FlashIntel 那期石一总提到的观点:在 SaaS 领域,只通过 PLG 做中小客户的天花板会远低于做大企业客户的天花板 。
但是在国内做 SaaS 服务 KA 大客户,事实上是很难做到像欧美那样标准化的,很多时候都不得不面临去做定制化。
布尔向量在海外可能主要是面向 SMB ,但也有很多国内的跨境电商品牌甚至有些独角兽都是你们的客户,所以你们也有服务 KA 客户的最佳实践。
在 AI 时代,就目前来看很多公司还是沿用 SaaS 的标准商业模式,但其实也有越来越多人意识到可能 AI 时代的产品和商业模式并不是完全和成熟市场的 SaaS 一样。事实上在任何新兴市场想要提供标准化的服务都是很难的。
包括咱们提到的 HeyGen ,他们主要也是面向全球市场做 SMB 的。但是在一篇近期福布斯对 HeyGen 的报道中也显示:2023年11月,HeyGen 开始招聘销售代表,并计划在未来一年内员工数量翻倍,重点是追求大型企业的业务合同。
报道链接:
https://www.forbes.com/sites/kenrickcAI/2023/11/29/AI-video-startup-heygen-launches-near-instant-avatar-generator-adds-56-million-in-funding/?sh=7cc3f5d36782
所以也想请你分享一下:

Q6:结合服务跨境电商独角兽的最佳实践,AI  时代早期企业服务的商业模式应该如何?怎么做好 Enterprise/KA 服务?

王庆:我们确实服务了一些跨境电商客户,我自己的感受是说,其实整体会分为两类用户。一类用户是研发能力很弱,相对比较传统,但他们业务体量可能很大;第二类客户的话相对比较年轻,然后他们有比较好的研发能力。这两类客户其实整个的商业模式是不太一样的。
针对第一类客户来说,他们更多是希望你能做交付。因为他们没有研发能力,那你能做部署化 SaaS 和交付就会比较好。就是要不你教我怎么用,要不就是我需要什么东西你能快速地给到我。当然我说的是国内的整个跨境电商市场。
第二类客户其实会更加希望跟你做共创。比如你能不能给 API,然后你能不能在他们本身业务流的某一个环节给到支撑。比如我们给他们素材的 API,能够不断地去生成素材,然后有客户就会结合在他们本身的广告系统里面去做。这两类客户是目前国内整个 Enterprise 和 KA 会比较典型的分类。
在国内的整个 KA 来讲,我觉得就是两点:第一是价格,第二是效率。如果你的价格足够低,然后你本身效率足够高,其实大概来讲客户都会留下来。因为我觉得国内的 KA 没有特别大的忠诚度,比较容易迁移。
比如说我们在 pitch 客户的时候,我们会问他:你现在在素材制造的时候成本是多少?一般的话肯定是用传统的agency,那传统 agency 本身的制作成本肯定是贵的。比如说一条非常短的,可以分发到 Tiktok 或者相关平台的视频,它的成本 in-house 做也好,或者给其他 agency 做也好,可能是会去到 200 块钱左右。
但我们告诉他我们就是30块钱一条,他可能就会觉得价格还挺便宜的。然后问效果怎么样?那我们就会给他一些 demo 去看效果,其实是不差于甚至是优于之前他做的一些视频,那价格上他肯定会觉得 OK。
其次在效率上来讲,因为电商客户如果体量大的话,可能需求量就大。那他们肯定之前更多受制于数量,比如说碰到节日,像美国的黑五,然后他需要1000条视频,那这个时候人力肯定是做不了的,那可能就需要 AI 去做。那这个时候你的效率,因为机器是没有工作日休息日之分的,所以可能一下子就能做几万条,那这时候的话客户又会觉得效率是有提升的。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第13张
那这样其实是解决了一个 pitch 客户的问题,然后接下来是怎么去服务好客户。你要有非常标准的 SOP,然后真正地让你的产品足够好,给客户创造价值。
这其实衍生出另外一个问题,就是 AI 在服务 KA 客户过程中,未来的确会部分替代某一些传统的 agency,这个我觉得是确定性的事情,因为它的确价格更低,效率更高。只不过可能目前会面临各种各样初期的一些问题,比如说可控性的问题,比如说虚拟人情感化的问题,比如说 AI 客服有一些小的 bug 等等?但整体来看的话,这些问题很快就会被修正,你通过模型的微调,很快其实也都会被修正。
所以我觉得还是要去了解客户,去抓住他们的痛点,去看你真正能为客户产生的价值。因为我觉得现在整个的经济环境其实相对比较 down,所以其实每个企业其实都有降本增效的诉求,我觉得这反而是给了 AI 早期的服务型公司非常好的机会,因为他们的确正好切中了这个点。不是像以前关系好,资源多,就可以搞定客户,那个时代其实本身来讲已经过去了。所以现在反而真的是一些创新的技术公司,能服务好客户的一个很好的契机。
佳芮:对,因为我们主要也做 KA,刚才你聊到 KA 的不忠诚度,我其实想做一个补充。你刚才讲到 KA 不忠诚,比如原来用 agency 可能很贵,今天有了新的技术,可能价格忽然降了1/6,那客户一定会换,或者是很大型的企业,哪怕成本降一半或者1/3也都一定会换。
因为我们做微信生态私域,我知道有一个例子,屈臣氏整个的微信生态原来是找某一家公司去做的整体的代运营,合作方式是分润的,并且每年他们在私域上面的销售量也非常大。后来第二年他们换成了另外一家公司做代运营,原因就是因为原来代运营的分润降了1/3,相当于同样的销售规模下成本增加了很多。所以在这种特别大的变化下,他们就会换一个 agency。
但如果对于 KA 支出的损失没有那么大的情况下,没有带来指数级的变化的时候,其实整个服务 KA 的时候,哪怕工具稍微有一些瑕疵,他们的其实忠诚度还是挺高的。
在这种场景下,我的观察是作为服务商一种方式就是你要砍自己的毛利,那另外一种其实可能就是用最先进的技术,技术代差带来成本的急速下降。这可能也是 AI 大家觉得特别大的一个机会点的原因,就是这种技术代差最后能够让成本急速下降。这个下降可能不是说10%、20%,因为我觉得10%、20%对于 KA 来讲无关痛痒。但是真的下降到1/3或者下降到1/6,这个时候 KA 会觉得那必须得换。
然后我们聊下一个话题。身为创业者,我现在越来越意识到一切的原点都是人和组织。我看公开资料你之前在大厂,拥有多年产品、运营及商业化相关经验。
核心成员大多来自腾讯、字节、特斯拉全球总部等大厂及海外头部机构。并且均来毕业于宾夕法尼亚大学、牛津大学、伯克利大学、香港大学等国际知名高校,分别带领过2B、 AI Lab 、核心数据算法团队,具备丰富的全球产品实战经验。
一方面能够组建一个强大的核心团队我认为是很难的,因为很多时候创始人就代表了公司的上限,所以作为创始人要能够吸引并留住一堆在某些方面可能都比自己强的人,这对认知和格局要求很高。
另一方面,你们也成立两年多了,我的公司句子也成立有一段时间了,这个过程中我发现最强的人可能也不是一个组织强大最关键的要素,把组织打造成一个有机体,大家一起共同成长,这样形成的无论是组织能力还是团队文化其实都可能会更强大。
所以也想请你在此分享一下:

Q7:怎么组建一支完备的全球化团队,并在创业过程中一起成长?

王庆:我觉得我会比较幸运一点,因为我本身之前在腾讯、字节,所以身边很多朋友基本上都是来自于常青藤大学,包括有很多都有大厂的经验。当有创业想法的时候,其实身边可能有很多志同道合的人就可以吸引在一起。但我觉得前提条件是在我们过往自己的工作也好,本身的社交圈也好,大家会比较合得来,并且会对你产生信任,然后觉得相对是比较靠谱的,那这样的话其实是会为未来打下一起共事的一些基础。
另外我们在创业过程中去找相关的人才,会发现其实还挺难的。我们会用猎头的渠道,然后用对外招聘的渠道,包括自己朋友介绍的一些渠道,但我发现很有意思的一个事情是,最终真正入职并且能留下来的,其实很多都是来自朋友介绍。这还挺有意思的,跟我之前的想法是不太一致的。按理说外面有大量的人才,简历看起来也都很不错,但最终发现其实还是基于本身的圈子里面可能入职的会多一些。
后来我自己也在反思,就是怎么样去组建一个比较好的团队,然后让他们在整个过程中一起成长。首先是组建团队,我觉得更多的是我们要花很多心思去看身边的一些朋友,建立一些连接,并且在身边整个圈层里面去挖掘相对比较志同道合的人。因为本身在我们自己的朋友圈里面,往往这个人的能力,他想做的事情,甚至他的性情,他整个的理念其实差异性都没有那么大,所以这本身就具备一定基础。
我举个例子,比如说我们 Global 硅谷那边的团队,那可能更多的就是利用硅谷那边朋友的一些人脉,去找一些志同道合的华人朋友,因为圈子可能都在那一边。
那这个过程中怎么去一起成长呢?我觉得因为现在整体创业的环境,大家会产生一些共识,我们也要给团队建立一些共识。比如说当前阶段的任务是什么,是商业化还是规模,是盈利还是产品的优化等等,我觉得更多的是在整个过程中要达成一致。因为大家能力可能在面试的过程中,或者在协作和交往的过程中,发现其实都不会特别的差。给团队足够的空间,让他们去做创新,然后在整个战略上和在整个协作过程中,大家一起不断去达成共识。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第14张
我觉得这可能是比较新型的,现在年轻化创业公司的一个共识,就是更多的不是一个上下级的关系,更多的是大家一起去做一个非常有意思的事情,并且把事情做好这样一个关系。但也会有各种冲突矛盾,包括不合适等等的情况,我觉得这个就是友好协商,然后一起去解决。
我觉得现在创业整个大家的认知,包括员工的认知、合伙人的认知、包括管理层的认知,其实都要拉齐在一条线上,之后协作起来才会顺畅一些。不像我们以前的这种中国老一辈公司那种非常严苛的大厂文化,现在其实对创业公司来讲,反而会比较偏追求那种像硅谷的那种精兵强将,小步快跑,一起共识,朋友创业的这种氛围,这其实是比较好的一种方式。
Jay:下一个问题比较偏向于我个人的好奇心。不知道为什么,我觉得布尔向量和 HeyGen 在某方面是相似的。可能都是大厂出来的团队;早期都是面向国内的跨境电商,比如服装和 DTC 品牌做 AI 图像和视频的生成;你们的成立时间比 HeyGen 晚一点,但早期获得的资本其实可能还略高于他们。
后来 HeyGen 创始团队直接杀到美国洛杉矶,相当于重新创业,7个月做到100万美金 ARR,成为当红炸子鸡。而且我不认为他们在社交媒体的病毒传播是完全靠运气的,当然有运气的成分,但多少肯定有他们的增长策略在背后做支撑。因为在单点能力上有技术代差,加上好的策略和执行,所以能够成为起码从目前看非常成功的全球化 AI 创业公司。
你们其实也是在 AI 爆发前入局的,有技术、有团队、有客户,所以也是非常好奇想打探一下布尔向量接下来的计划,想知道你们:

Q8:是否考虑类似 HeyGen 的方向和策略?对爆发式增长有怎样的期待和计划?

王庆:我觉得现在整个看创业团队来讲,其实类似的团队蛮多的,大家能力其实都不差,比如句子互动,我们或者 HeyGen 等等,我觉得能力都是在第一梯队的,但大家选的方向不一样,决定做的事情不一样,然后节奏和进展其实都会有一些差别。

我觉得如果大家都是在往全球化去做的话,肯定都是 focus 在用户价值。然后在这个过程中,大家有自己各自的一些挑战,也有各自的一些节奏。像我们其实更多会偏视频的自动化剪辑,生成剪辑这个方向,然后这一块其实需要很多底层能力,我们花了很长时间去搭建。
其实对于每一个创业公司来说都会面临的一个挑战同时也是机遇在于,我们其实都在追求自己的一个奇点。因为做全球化 SaaS 其实有一个奇点,这个奇点可能是100万美金的 ARR,也有可能是1000万美金的 ARR,这个奇点其实象征着你真正为用户产生了价值,你真正的把整个你想做的产品已经完全发布出去,并且基于用户的价值已经完全迭代完毕了我觉得这个奇点是蛮重要的,其实也是所有人都在努力达成的。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第15张
因为我们成立了两年,其实在这个过程中我们也在不断去优化相关的产品,但是我们本身来讲还有很多功能没有发布,所以我说对于每一个全球化的 SaaS 公司来讲,策略和方向一定是把自己的产品发布出去,同时深耕在全球的一个市场,我们自己在海外的团队也是会深耕海外的用户,同时深耕电商的场景。
所以我们对爆发性增长,我会把这个词换成某一个奇点的期待肯定是在2024年,其实跟 HeyGen 的节奏差不多,我们会在2024年把产品发布完、优化完之后,然后看整体的天花板和增长,这其实是一个比较重要的规划和期待。
然后 SaaS 我现在感觉起来,整个 SaaS 的周期基本上会在2.5-3年之间,会到迎来验证的周期。如果验证的周期本身能形成爆发性增长的话,那整个在市场和行业上就会占领比较好的优势地位,然后就可以进行下一个阶段的尝试和探索。然后是全球化 SaaS 来讲的话,我觉得基本上是在几百万到1000万美金 ARR 这个范畴,其实就代表着你找到了那个爆发性增长点。
佳芮:你刚才聊到奇点这个观点,我觉得还蛮有意思的,就像你说有些奇点可能是100-1000万美金的 ARR。根据你的说法,我们在录制前一天刚刚突破了我们另外的一个奇点,是一个我们内部系统的账号数量级。我们第一次完成这个奇点总共花了三年的时间,昨天我们把这个数量翻倍,翻倍的过程只花了4个月,所以就是第一个阶段是3年,而第二个阶段是4个月。所以确实像你说的,找到这个奇点的过程是相对比较漫长的,是需要耐心的。
包括 AI 之前特别火的 SaaS 公司比如 Figma、Notion、还有 AIrtable,大家觉得忽然都变成了百亿美金的估值,但实际上他们都已经成立了十几年,前几年他们都是有非常漫长的蛰伏的,他们是不被看到的,他们也是不被看好的,甚至一度是被资本放弃的。
所以其实找到奇点的过程,有些人可能快一些,有些人可能慢一些,但是整体我觉得作为 SaaS 从业者来讲,可能还是需要非常大的耐心,也需要一定的韧性在里边。
Jay:也非常期待布尔向量今年能够迎来你们计划中的奇点时刻。下个问题我们聊的稍微大一点。
我们都知道:2022年11月底 ChatGPT 的发布推动了这次生成式 AI 大浪潮,因为其智力包括推理等能力很多已经可以说达到了人类平均水平,且它还拥有跨领域的知识,可以24小时不间断工作,且还在持续更新迭代。另一方面,ChatGPT 的发布引发了商业和几乎全社会高度的关注,因此涌现出大量的商业创新和机会,进一步推动了行业成熟和社会发展。因此,我们暂且把 ChatGPT 发布的时刻定义为「GPT 时刻」。
但是 ChatGPT 其实最开始更多还是一个语言模型,可以生成文本、写代码,后续逐渐增加了多模态的比如图像和音频能力等,包括 Google 的 Gemini 号称是原生多模态,但其实也没真正超越 GPT-4,且目前来说 Ultra 也没有公开,也不知道生成视频的效果怎么样。最核心的问题是,哪怕是目前最强大的 AI 视频生成模型当前的能力也无法超越人类平均水平,且可控性不足。我们开头提到去年底出现了很多强大的视频生成模型,包括 Runway 和 Pika 也被寄予厚望,但显然这个领域目前还没有到真正的「GPT 时刻」。
关于 AI 视频生成领域的 GPT 时刻问题,其实有两个人已经回答过。第一个是 Pika 的创始人 Demi 郭文景,她在23年11月的一个采访中说道:
也许会在2024年迎来AI视频的「GPT时刻」。因为过去几个月,AI 视频生成已经取得了很大的进步。如果看2022年 AI 生成视频的效果,再看2023年3月份的,再看最近一两个月的,你会发现视频生成模型的发展非常快。可能在不久的未来,也许就是2024年,就能达到 AI 图片生成的效果。虽然现在视频模型没有那么完美,但图片模型在一年半前也不好,而现在已经非常好了。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第16张
还有前面说的 VideoPoet 的蒋路,他在采访中说:
视频生成的「ChatGPT 时刻」,我觉得大概是,哪怕模型生成的还是比较短的片段,比如2-5s,但这个生成是可控的,人类也很难分辨是 AI 生成还是人类制作。从用户角度,只需要几美分的代价,就能获得一个可以被送到好莱坞专业 studio 的样片。如果类比的话,可以类比到图像领域 stable diffusion 1.x 或 2.x 的版本,肯定还有再提升的空间,但已经到了能使用的程度,而且能激发很多应用。所以我的预测是:到 2024 年底或 2025 年初,我们可能会到这个时刻。
同为从业者,也想听听你的看法:

Q9:AI 视频生成领域何时会迎来 GPT 时刻,如何去描述这样的一个时刻?

王庆:我自己的看法可能相对悲观一点,因为我可能正好一直在做这个行业,或者如果是说从商业化角度来讲的话,我觉得这个时间还是比较长的。
我们可以类比一下,或者我们可以问自己一个问题,就是现在图片生成是不是已经迎来 GPT 时刻了?我觉得是没有的,我们并没有像使用 GPT-4 一样在大量使用类似于 Midjourney 这种图片生成软件,因为还是会面临不可控的问题。只是在部分领域,比如以电商领域为例,我们目前只是在做像 banner 背景的制作,可能部分可以用到类似 Midjourney 这种软件去做生产,并没有形成广泛的使用。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第17张
我现在是把 GPT-4 在 PC 端是固定在我的标签栏的,我可能随时都会做调用,但我并没有把 Midjourney 这类软件固定在我的标签栏,就是代表他们还没有完全渗入到我大部分的工作场景和行为中。
所以我自己是短期内悲观,长期乐观的。如果是视频生成的 GPT 时刻的话,我自己的判断是在2024年整体来讲会达到比如说5秒以内或者10秒以内的,确实是可以去做非常好的精细化,包括精度的提升,包括清晰度的提升,然后可以非常好地按照指令去完成对应的动作。
我觉得2024年视频生成就有点像2023年 Midjourney 的进程,就是可以达到2023年 Midjourney 这种程度,然后去完成部分工作。但可能还远远不能达到比如说帮我生成基于某个平台的什么样的视频,然后我做一个很详细的描述,发现生成的视频跟脑海中想的视频基本上是一致的,或者是差距不大,或者是直接可用的。我觉得离这个程度其实还差了挺长时间的。
后面的时间我们不可预测,但我自己觉得2024年应该视频生成领域能达到2023年图片生成的状态和层次。然后2024年整个文本领域应该会更加成熟,更进一步,会完全彻底地在每个领域都做到商业化。而视频和图片生成相比,视频是落后于图片一年左右的时间,如果整体要达到视频和图片的 GPT 时刻,我觉得还是有挺长一段路要走的,可能没个两三年很难有这种时刻的到来。
但是反过来讲的话,包括我们自己在做应用的时候,其实也会有很多的方式可以去商业化。比如说刚才我提到虚拟人生成视频,目前可能还不能长期地应用于24小时的直播,但有可能可以用于视频的某一段切片。比如刚才说的 Pika 生成的也好,其他软件也好,生成的图转动态的视频如果清晰度足够高的话,达到了甚至是好莱坞的标准的话,那其实是可以用于某一些商业场景的。比如说海报、前言介绍、序章等等,这种都是可以应用的,但可能还是只有1/10左右的场景。
另外的话视频生成其实可以结合大量的数据库,结合文本的能力去商业化。比如说我用文本生成能力写脚本,写完脚本之后来匹配画面,那匹配的画面是一段一段的,那也可以大量地进行商用。这种我觉得2024年肯定是完全可以成型和达到的,我们自己也有相关类似的一些功能,是完全可以去做商业化的。
但纯粹 generate 一个不说很远,比如说1分钟或者10分钟的视频,我觉得还是有比较漫长的路要走。
佳芮:确实从业者往往是更加理性的,局外人往往是比较盲目乐观的。包括刚才王总讲到的,我们聊 AI 视频的 GPT 时刻,不如先看看图片的 GPT 时刻什么时候来临。那其实我们可以看一个对比,GPT-1 发布的时间是在2018年的6月份,Midjourney 的第一个版本发布时间是在2022年的2月份,这中间其实相差了接近四年。
当然我不知道视频是四年还是多久,但确实我们需要对新技术在前期比较久的打磨,是需要给充足的时间的。不能因为一个爆款出来,我们就特别盲目乐观看 AI 所有的发展。但长期来讲我们知道视频生成终究会到来 GPT 时刻的。
因为我们公司句子互动也服务很多消费品牌客户,我们的客户其实经常会问一个问题,就是什么时候能做多模态,什么时候能把视频、图片、文本整个都集成起来?所以大家的期待还是非常高的。
但是我觉得如果真的落到 ToB 的场景,可能我们还是一方面要去把控好客户的预期,另一方面看当下的 AI 能做哪些事。在当下能做的地方一起和客户共创,与客户在一起,持续去打磨好更多标准化的产品和应用,让客户持续付费,当然这也需要时间。所以最后也想请你分享一下:

Q10:AI 视频生成领域进一步发展会如何影响电商营销格局?品牌方和服务商需要做哪些准备?

王庆:这个问题其实我反而是比较乐观的,就是对电商营销的影响。因为我们在服务于电商客户的过程中会发现,其实整个电商营销是一个不断拥抱 AI 的过程。如果从企业家或者是电商公司老板的角度来讲,比较直接的影响就是说以前可能一定要请一个人做的事情,现在可以不用请人了。
我有一个朋友做跨境电商,我发现他们员工人数非常非常少,因为大部分他们都用 AI 实现了。比如以前可能要请一个外模,那现在他可能不用频繁地去请外模了;以前他要请一个设计师,现在他有可能不用请设计师了,因为可以用 AI 辅助,其实也可以做得七七八八;以前他可能要请一个客服,现在其实有 AI 客服,也可以部分给替代掉了。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第18张
所以只要你具备一些理论知识和前期调教比较 OK 的情况下,对于小公司来讲其实现在是有非常大的利好,很多职位确实可以不用有了,很多成本都可以大幅缩减。以前可能一个初级的电商公司,按理说应该搭建在15-30人的规模,现在可能变成5个人就够了。这是现在来讲就比较直接的一个影响,所以进一步发展之后的话,其实对效率的提升和成本的优化会起到更好的作用。
那对于品牌方和服务商来讲的话,要做好哪些准备呢?我觉得也是比较明确的,前两天周鸿祎不是发表了一个观点不是说:可能所有的企业未来都要拥抱 AI。我前两天也遇到一个朋友,他是做传统的素材生成的,他们公司也做的比较大,也是全国排前列的。他们在整个传统的拍摄和素材生成过程中,其实现在也会慢慢地去用各种各样的 AI 技术,包括跟我们也有些合作。
所以就应该是不断地去拥抱AI,去做相应的准备,而不是等某一个比如刚才说的 GPT 时刻来临的时候再去拥抱,那可能已经晚了,很多公司已经跑先一步了。
我觉得 AI 替代人工或者 AI 大部分辅助人工是有一个过程的,这个过程从2023年开始算起,如果我们用一个词叫替代率的话,可能会经历一个10%-100%的过程。可能过几个月会往前再跑一点点,然后可能5年或者10年后就变成了90%,当然这个过程我们没办法去做非常详细的预测。
所以对于商家来讲,或者对于品牌方来讲,能做的就是积极地拥抱 AI,然后基于自己的公司的情况和本身的需求,不断地去尝试 AI,看哪些能降本增效,哪些能真正地去拿到自己想要的结果,或者是产生价值。这个可能对商家要求高了一些,但是可能真的就是你不做这个事,可能最后再去准备就晚了。
佳芮:确实是这样,我忽然想起来前两天看 Sam Altman 的一个访谈,聊到 AI 应用落地。首先大家对这件事肯定是说长久的各个行业的 GPT 时刻,包括 AGI 真正的时刻肯定是没有那么快的,在接下来落地的过程中其实是循序渐进的。包括在落地的过程中,可能我们作为从业者持续应该去思考社会的惯性、经济的惯性、人们生活方式惯性,这些惯性对落地的影响是挺大的。AI 会颠覆一些事,但不会以我们认为的方式来颠覆。企业或许应该学习如何帮助人类习惯 AGI,并与之共同成长。
Jay:OK,今天非常感谢王总分享了自己非常多的行业 know-how 还有 best practice,也希望大家如果觉得有收获的话分享给自己的1-2位朋友。如果有问题或者是想法,欢迎评论在小宇宙的评论区,我们都会认真地去看,并且逐个回应。
欢迎大家在苹果 Podcast、Spotify、小宇宙、喜马拉雅这些平台订阅和收听我们的播客,我们在今年也成立了自己的听友群,如果大家感兴趣,可以在小宇宙首页或者当期文字版里面找到入口。今天我们就大概聊到这里,感谢大家。
图片来源:布尔向量官网及网络
本期全部内容就到这里,如果你对出海与全球化感兴趣,希望聆听来自行业一线的真实声音和最佳实践,欢迎你在苹果Podcast、Spotify、小宇宙、喜马拉雅等平台订阅收听我们的节目,也推荐你在其他泛用型播客客户端订阅收听。

句子互动成立于 2019 年,致力于打造由大模型驱动的下一代对话式营销云。通过 AI+RPA 技术,句子互动可以基于企业微信、飞书、5G 消息、WhatsApp 等不同的 IM 提供智能高效对话服务。句子互动可以利用企业私有数据为企业训练专属领域的知识库,并对接到不同 IM 里,是国内第一家将大模型落地于营销场景的公司。
句子互动聚焦解决营销场景上的问题,如售前转化、IP 塑造、销售转化、售后转化、提高客服效率等,高效触达并深度连接千万级客户。产品和服务已经在多个行业得到应用,覆盖消费品、金融、泛互联网、政企等领域,包括宝洁、海底捞、国家电网、中国人民保险、字节跳动、腾讯广告等。团队累计融资近亿元,获得中美顶尖投资机构投资。团队既是硅谷著名孵化器 YCombinator 国内首批入围团队,也是 Facebook 中国大陆首期加速器、百度 AI 加速器首期成员企业。
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第19张
邀请大家加入句子AI前沿观察社
让我们一起在AI的世界中
借助技术的力量实现业务收入的持续增长
扫描下方图片二维码快速进群
AI视频+电商营销,创业公司如何角逐万亿细分市场?对话布尔向量CEO王庆 第20张
广告位
特别申明:本站的主旨在于收集互联网运营相关的干货知识,给运营小伙伴提供便利。网站所收集到的公开内容均来自于互联网或用户投稿,并不代表本站认同其观点,也不对网站内容的真实性负责,如有侵权,请联系删除。https://juzibot.com/blog/14366/
上一篇
下一篇
联系我们

联系我们

邮箱: sales@juzi.bot

工作时间:周一至周五,9:30-18:30
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部