【本期课题】
文本数据化的迭代历程与互联网行业的发展。
【栏目介绍】
在《产业观察》这档专栏里,我们会为你厘清不同产业的历史沿革,希望能够从中找到一些底层的规律。虽然当下变化迭起,但是所有新风口都有迹可循,不同产业的发展其实也有很多相似之处。
【免责声明】
本节目的所有内容并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或者法律上的建议。
【内容索引】
00:45 作为技术外行,聊聊为什么是今天、为什么发生了,以及按照同一条路线来看,往后还会发生什么
02:11 过去三十年互联网最大的贡献之一,是把海量的文本信息变成了文本数据,顺着这条线索我们能够看到很多科技巨头的名字
03:01 第一个把文本数据化的普及型工具是鼠标和键盘,紧接着是Windows的图形界面操作系统
04:54 在有了足够多文本数据的基础上,第一个帮助用户连接和找到这些信息的商业模式是门户网站
06:51 在文本数据化的迭代过程中,上层是数据,中间层是算法,底层是算力
08:29 搜索框和搜索算法是谷歌在文本数据化发展历程中的两个重要贡献
13:05 在算法跃迁的过程当中,ChatGPT有没有引入新的认知逻辑使AI能够做出近似推理的抽象思考?
16:58 AIGC无论输出的是图片还是视频,都仍然是基于文本形式做的标注,还无法做到真正的多模态
18:27 我的整个职业生涯一直受到文本数据化的冲击,一边是内容生产,一边是内容分发
22:03 搜索引擎用机器来识别需求,之后按照需求匹配供给、完成分发的这件事,无论是百度还是谷歌,都是先通过给企业提供服务来矫正算法
24:57 英文的单词与单词之间有空格,但是中文需要切词,因为一句话的每个字都是连在一起的,所以做词库曾经也是一条切入搜索引擎的路径
28:14 保罗·克鲁格曼之前就说,互联网最大的功能就是供人们在网上喋喋不休地发表自己的言论,所以它一定是泡沫,因为很快人们就会发现自己其实没有那么多话要说
28:47 语言是一种抽象的表达,相比之下视觉信息更加具体且丰富,但计算机还很难像人类一样做到把注意力分配在不同的位置观察同一张图片
32:14 物理意义上的文本信息匹配效率是比较低的,但是一旦数据化了之后,数据流动几乎没有任何成本且流传效率无穷高
33:43 智能手机带来的变化不仅仅是让电脑去掉了键盘和鼠标,而且还把诸如声音、视觉、定位等各种信息用不同的芯片完成了数据化,自此移动互联网浪潮的序幕正式拉开
42:16 我为什么在10年之前投资B站?
48:42 我为什么在11年之前投资数字货币?
54:03 当时为了解释虚拟货币的商业应用,我举的最多的例子是p2p下载,一旦全部进入了数据化,交易体系和权益确认体系将会全部发生变化
57:54 ChatGPT会创造出新一代的平台和前所未有的商业模式吗?
01:01:35 垂直领域的公司,可以通过接入通用语言模型平台获益吗?
01:03:11 今天还有机会做出一个中国的OpenAI吗?
01:06:28 2016年前后也有过一波AI创业热,那一轮有哪些积累了好资产的明星公司留下来吗?
【相关文章】
文字版内容,可在峰瑞资本公众号查看。
李翔x李丰:为什么今天出现了ChatGPT?往后还会发生什么? | 李丰专栏
【制作团队】
主理人:李翔 、李丰
制作及统筹:张英海 (13514156656)、峰小瑞(pr@freesvc.com)
如果你喜欢我们的节目,欢迎你分享到更多的地方,也欢迎你在我们的评论区留言交流。