在不同平台上的数据孤岛间这个趋势会如何进一步落地?
作者:Chen Li,Jims Young,,Li Gong,Ivo Entchev,Youbi Capital
封面:Photo by Dynamic Wang on Unsplash
本文由 Youbi Capital 的 Chen Li, Jims Young, Li Gong 和 Ivo Entchev 共同撰写
1)Web2 的困局
我们每天生活在各种 APP 中:在微信上和朋友闲聊,用点评软件选要去的餐厅,在小红书上探索生活的多样,用支付宝付日常的开销……我们生活的痕迹被形形色色的 APP 捕获,沉淀在各自的数据库内。
同时,随着对工作与生活要求的增多,我们有了越来越细分的 APP 们:从单纯视频到长视频,短视频,中视频的划分,从博客到微博,长文章,图文信息流等不同呈现方式,越来越精细化的用户需求创造了更加细分的 APP 分类,同时也导致了数据的更加分散。
这种 APP 间的分散与数据不互通形成了一个个 “数据孤岛”。我们在不同的 APP 之间重复着注册账号,撰写内容,并需要在各个平台中一次又一次地发布达到 “全平台同步”。
而试想一下,如果我们在抖音上的一个视频,可以无感地被同步到小红书。同样的,一个我们发在 B 站某视频的弹幕,也可以被同步到其他平台。APP 之间能够共享该用户的数据,数据便从此不再存在于孤岛,用户也能借助更自由的平台互操作实现更多有创造力的内容输出。这也是不断被提及的 Web3 终局体验——能够互操作的应用矩阵。
而面对基于融合数据中台的应用矩阵的大趋势, 在不同平台上的数据孤岛间这个趋势会如何进一步落地? 而 Web3 技术如何服务于这个大趋势? 这是我们要讨论的问题。
2)为什么是 Web3
Web3 的含义包括区块链, 密码学, 去中心化经济模型等概念。代表性的产品有跨主权货币比特币, 基于智能合约的去中心化金融, 以及去中心化的计算, 存储网络等。
以去中心化金融为例, Web3 应用的主要特征是去信任资产管理和交易 (签名), 用户数据存在一个公共的数据库里, 也就是公链上。应用和应用之间不存在数据隔离, 甚至在大部分链上, 应用之间的数据有完全无许可的互操作性, 这种远超 Web2 平台的自由度, 导致了去中心化金融应用的大爆发, EVM 体系内的应用数量在 2020-2022 年之间增长了 1000 倍。
然而在消费者应用方面, Web3 遇到了明显的瓶颈。公链的数据存储能力非常有限, 而且价格极高 (以太坊的存储成本是 AWS 的 1 百万倍), 仅能够支持去中心化金融类型的应用产生的数据量, 无法承载内容和用户行为跟踪等这类其他 C 端应用需要的大规模数据。Web3 的解决方案是把这类存储需求在链下满足, 并通过密码学的方式把资源组织和抽象出来提供给开发者。具体实现我们在后面讨论。
这种链下的存储方案, 例如 Filecoin, Arweave, 是把数据以分割, 加密的方式分布地存储在他们网络里各个服务器上, 成本低于中心化的存储。和公链上的完全开放的数据不一样, 这些数据需要用户的授权, 才能进行调用。
这里要提到 Web3 应用概念提出早期的一个主要理念, 突破应用平台发展天花板的模式必须是用户拥有数据而不是平台, 同时用户也应该拥有应用平台的一部分, 这样平台才能在最大限度地挖掘数据的价值的同时, 将利益与用户共享。
当用户拥有数据, 应用和应用之间的数据隔离就可以通过用户授权打通, 所以 Web3 的数据中台必然是以用户为核心的。接下来我们要讨论的是如何把 Web3 技术层, 账户管理, 存储, 执行等组合成一个以用户为核心, 而且最方便开发者使用的技术栈。
3)Web3 的技术栈 – 从 Defi 谈起
Defi 应用相对于传统 C 端应用来说反应很慢, 一个交易完成通常要等几秒到几十秒甚至更长。而基于 IPFS 的应用会需要至少一分钟, 有时长达几小时才能同步一个内容的更新。这些应用的速度都是由他们后端的数据库更新的速度决定的。
Defi 的速度基于公链的共识, 受网络去中心化程度的限制;而对于非金融应用,内容一般只会存在一个或几个节点上, IPFS 同步的是寻址信息, 因为节点的去中心化程度更高, 同步时间也更长。
为了解决这个问题, 不同的区块链都开发了自己的 Layer2, 用来存储和更新需要快速处理的数据, 然后每隔一段时间再转移到链上。而 IPFS 上也发生了了类似的事情, 这就是 Ceramic 做的事情。Ceramic 的节点可以用来像中心化的云一样, 记录某个应用上发生的事件, 然后过一段时间再把结果更新到 IPFS 上, 所以可以把它看成是 IPFS 的二层。
有了这个二层, dapp 的体验就可以和 app 非常接近了。除了动态存储, Ceramics 还提出了数据模型的概念, 在应用和应用之间建立数据标准, 使跨应用的数据互操作变成可能。
Dataverse-OS 在 Ceramic 的基础上做了进一步的资源抽象和隔离, 打造了一个能够管理存储资源和身份的 Kernel, 类似一个操作系统的内核, 让应用和用户通过他们的公钥来进行身份验证, 获取资源, 而又互不侵犯。这样做的好处是所有应用都可以跑在同一个 Kernel 里面, 而不是独立的系统。应用和应用之间不需要两两之间打通, 就可以通过 Kernel 申请, 和用户私钥的授权, 获取任何一个数据表的权限。
从数据互操作的角度, Dataverse-OS 起到了一个云端操作系统的作用, 能够让应用之间实现大规模的数据互操作, 是未来 Web3 数据中台的一个雏形或者 MVP。这个领域还有几个项目有类似的愿景, 这里就不一一列举了。
4)展望和挑战
在 Web3 诞生以来,让数据在应用之间自由的流动一直是我们的一大愿景。随着众多技术栈的不断成熟,这一次我们终于 almost there。
对于用户来说,这是第一次在 Web3 应用之间可以全品类地实现数据互操作。我们可以在各个视频平台之间共享弹幕,和全世界各地的网友讨论同一个话题而不受平台限制;个人的资产可以在各个平台之间完成支付,个人的社交积分与声誉也会被所有 APP 广为认可;我们甚至可以自由地管理自己的数据,让它在应用间,用户间自由地流动,完成更多的可组合性上的突破。
而对于开发者来说,流量的门槛第一次如此之低,以至于可以轻易地获取用户开放出来的信息并加以使用。数据从此不再是应用之间竞争的门槛,好的产品才是。同时,开发的门槛也得到进一步降低,随着无代码工具的不断普及,前端的门槛得到不断降低,只需要与 Web3 的后端接入,一个应用便能就此诞生,而这一切都近在咫尺。
在 Web2.0 中, 云化的操作系统正在成为现在粘性最强的用户入口, 越来越多的功能被整合进云操作系统中, 越来越多的用户体验也随之被迁移到云端, 这是一个不可阻挡的趋势. 而以用户为中心的云服务,必然要和中心化平台竞争开发者和用户, 我们认为在内容和社交应用方面, 以用户为中心的云服务平台有不可忽视的优越性。
Dataverse-OS 的设计简洁而强大, 赋予了开发者实现数据互操作的所有核心功能。他们的 SDK 被我们迫不及待的推荐给所有的 dapp 开发者。但我们碰到一个问题是用户是平台吸引开发者的主要因素, 如何通过共赢的方式吸引早期开发者是数据中台最大的挑战。这里我们的答案是一个做公共数据中台的项目 Glitter, 关于这个项目我们会在下一篇里详细介绍, “Web3 流量的火车头 Glitter”。