当前位置: 首页 > news >正文

读AI赋能06多模态

读AI赋能06多模态

1. 照片

1.1. 2000年,全世界共拍摄了800亿张照片

  • 1.1.1. 这一数据源于当时仅有的3家生产胶卷的公司

  • 1.1.2. 每张照片的成本约为50美分

1.2. 到2015年,全球拍摄的照片数量约为1.6万亿张

  • 1.2.1. 现在,每张照片的成本几乎为零

1.3. 不仅将人们过去需要付费的成本降低到几乎为零,更具深远意义的是,这些新技术让我们能够做全新的事情,比如用照片做笔记

1.4. 新的能力所带来的价值不仅仅是让摄影师每次拍照节省50美分

  • 1.4.1. 现在数十亿人的手机里都有数码相机,拍摄照片的成本几乎为零,所以我们每年会拍摄数万亿张照片

  • 1.4.2. 私人公地也免费提供存储和分发服务

1.5. YouTube开始成为一个以视觉驱动的、实用的维基百科

2. 更公平的知识

2.1. 知识的获取也可能带来风险

  • 2.1.1. 回音室效应、信息过滤气泡和算法极端化

  • 2.1.2. 将易受影响的年轻游戏玩家引向越来越极端和具有破坏性的方向,这类叙事已经得到大量的媒体报道

2.2. 算法助推

  • 2.2.1. 当YouTube的推荐算法引导用户走上自我教育、自我提升和职业发展的螺旋式进步之路时,这就是算法助推

2.3. 私人公地通过让知识和机会更公平地被获取,增强了个体能动性、教育机会公平性、社会流动性,并最终促进了职业成长

2.4. 数字公地的运作方式与受到限制的传统公地(如共享牧场和其他自然资源)的运作方式截然不同

  • 2.4.1. 牧场或渔场等资源,其共享的结果往往会受到“公地悲剧”的影响

  • 2.4.2. 对数字资源来说,情况并非如此,无论悲观论者多么喜欢将大型科技平台的运作方式称为“掠夺性操作”​

3. 价值双赢

3.1. 《公地悲剧》

  • 3.1.1. 生态学家加勒特·哈丁(Garrett Hardin)

  • 3.1.2. 极为悲观的预言:世界上资源有限,人口过剩的问题无法用技术手段解决

  • 3.1.3. 个人在利用公共资源时总是试图最大化自己的利益,这就是公地的“悲剧”​

3.2. 在早期,互联网本身就是一种新型的公共池资源

  • 3.2.1. 随着这些新的闯入者的介入,人们对数字公地,即那些明确抗拒商业利益和政府监管的在线空间的需求变得更加迫切

  • 3.2.2. 开源软件运动因此获得了动力,并变得空前重要

  • 3.2.3. 一个名为“创作共享”(Creative Commons)的非营利性组织开发了一套授权机制,为内容创作者提供了比传统版权许可更灵活的分享方式

3.3. 在数字平台上,即使你广泛使用它们,也不会降低他人的使用能力

3.4. 数字公地的运作方式与传统的物理公地截然不同

  • 3.4.1. 对数字公地而言,一个显而易见的策略不是像对木材或三文鱼等稀缺且难以替代的资源那样小心翼翼地控制访问,而是将其价值根源—数据,视为共享的非竞争性资源,积极培育并广泛使用

3.5. 如今,推动大部分私人公地运作的基本契约,是用户获得免费服务,作为交换,平台运营商获得对用户生成数据的访问权限

  • 3.5.1. 双赢模式给Meta提供了充足的资源来维持其提供的服务,大力投资开发新服务(包括许多向世界免费开放的开源AI模型)​,也为其股东创造了不菲的回报

3.6. 并非所有用户为平台创造的价值都完全相同

  • 3.6.1. 高度活跃的用户可能比不太活跃的用户创建更多的帖子、点赞、评论、评分和其他类型的数据

  • 3.6.2. 一些用户创建博客文章、视频和其他类型的内容,从而吸引其他用户的高频互动

3.7. 并非所有数据都具有同等价值,用户在生成数据时投入的时间和精力也不相同

  • 3.7.1. 当用户登录、在网站上停留一定时间并进行各种活动时被动生成的数据,可能不需要他们付出太多精力

  • 3.7.2. 回复他人的帖子时留下的评论可能需要更多的时间和思考,但仍然无法与制作一个精心设计的YouTube视频所需的15小时相比

3.8. 情境因素也很重要

  • 3.8.1. 用户的地理位置数据单独来看可能价值不大,但当与数百万其他用户的数据聚合在一起时,它可能对城市规划或定向广告来说就变得非常有价值

  • 3.8.2. 在一个实质性数据形式(如歌曲或故事片)日益丰富的世界里,消费者最终愿意为之付费的往往不是数据本身,而是能让数据易于被发现和批量访问的机制

  • 3.8.3. 随着技术的发展和新用途的发现,数据的价值也可能发生巨大变化

3.9. 强调数据隐私对于保护个人权利固然至关重要,各种数据也首先是一种私有财产,并因此具备内在价值

  • 3.9.1. 将数据视为一种准公共物品,积极地共享、聚合并以创新的方式应用,有可能创造出用户从中获得的价值远远超过平台运营商自身获取的价值的服务

4. 多模态AI

4.1. 当人们试图限制创造、共享数据的数量及数据共享的范围时,悲剧才会发生

  • 4.1.1. 数据是非竞争性的,并且会不断增长

4.2. AI能够从我们目前生成的海量数据中进行分析、评估、检索、总结和整合,从而使私人公地的价值不断提升

  • 4.2.1. 如果我们采用开放和协作的数据共享方式,同时开发强大的隐私保护和合乎伦理的数据使用框架,其价值可能会呈指数级增加

4.3. 与即使精心管理也会随着时间推移而枯竭的物理公地不同,数字公地往往会变得越来越好,甚至好得多

4.4. 传统搜索引擎并不擅长揣测用户的需求

4.5. AI很快将成为你与几乎所有服务之间的智能界面层

  • 4.5.1. 它将提升你从许多私人公共平台和服务中获得的价值,这些平台和服务都是你已经在使用且珍视的

4.6. 一个完全多模态的模型可以处理文本、音频、图像和视频的任何组合

  • 4.6.1. 多模态模型也能以文本、音频和图像的任意组合生成回复

4.7. 新的感知能力让AI模型从云端的无形实体转变为与你共享空间和体验的现场实体

4.8. 手机

  • 4.8.1. 手机才是你真正希望用作通往私人公地的门户的工具,而不是你的台式机或笔记本电脑

  • 4.8.2. 手机是许多人每天早上最先拿起、晚上最后放下的东西

  • 4.8.3. 智能手机的移动性、连接性和多功能性使其成为我们自身的延伸,它随时准备捕捉美好瞬间、回答问题,或让我们连接到我们的社交与职业网络

  • 4.8.4. 与台式机或笔记本电脑不同,智能手机与我们形影不离,非常适合用于与AI进行自发互动、捕获现实世界的数据,并随时提供即时帮助

4.9. 先进的AI助手还能以无缝的方式整合利用多个私人公地资源,为用户提供个性化服务和增值体验

  • 4.9.1. 这种变化不仅仅是带来方便,而且是对人们分配注意力和精力的方式,以及获得支持和专业知识方式的一次系统性革新

4.10. AI开发者在使用大量数据训练新模型时,并不是在提取或消耗稀缺资源

  • 4.10.1. 他们从事的是一种数字农业,甚至是数字炼金术

  • 4.10.2. 如果我们能够有效管理这个过程,将使个体能动性和社会普遍繁荣程度达到前所未有的水平

4.11. 即使今天的大语言模型不再有任何进步,当下20岁的普通年轻人在一生中从这些大语言模型中获得的消费者盈余,可能仍将达到数百万美元

  • 4.11.1. 这正是私人公地在AI时代所能产生的巨大价值
http://www.hskmm.com/?act=detail&tid=36268

相关文章:

  • 2025年流量控制设备厂家推荐排行榜:流量计,流量控制器,流量调节阀,流量控制阀,比例调节阀专业选购指南
  • 2025年吹塑机厂家推荐排行榜,挤出吹塑机,注射吹塑机,拉伸吹塑机,发泡吹塑机,物理发泡吹塑机,mucell发泡吹塑机,工具箱吹塑机,瓶子吹塑机,半导体清洗液瓶子吹塑机公司推荐
  • CLIPSeg 使用文本和图像提示进行图像分割 - MKT
  • 要把人看做动物
  • 通用矩阵向量乘法(GEMV)优化实现与性能分析
  • 我国互联网公司最新市值排名!
  • 语言+目标检测+粗略分割模型 联合+ sag精细化分割 = 快速精细带类别的分割 - MKT
  • 理解`super()`
  • 在 Python 中,为什么说“一切皆对象”?
  • 分割模型 语言转分割CLIPSeg - MKT
  • C# Avalonia 16- Animation- SampleViewer - FollowExample
  • 五节课掌握 Python 面向对象(以“人狗大战”为例)
  • 联邦学习与AI公平性研究新进展
  • ESP32 Arduino核心框架:全面支持多款ESP32芯片的开发平台
  • 图像分割 3D-Box-Segment-Anything(5)如何加速 - MKT
  • 静态方法(`@staticmethod`)和类方法(`@classmethod`)的应用场景及选择原则
  • 数据集 - MKT
  • 专门针对无人机分割的预训练模型​ - MKT
  • 为什么一般教材在讲解python的多态概念时,不用抽象基类及其相关内容讲解呢?
  • [Bash] bash scripting common pitfalls
  • [Bash]让人头晕的if条件
  • 鸭子类型(Duck Typing)中的“类型”,指的是什么的类型?为什么很多人认为“Python 没有真正实现多态”?多态的核心目的是什么?鸭子类型如何实现多态?
  • tryhackme-预安全-windows基础-windows 基础知识1-16
  • YOLO11深度学习的遥感视角地面房屋建筑检测分割与分析系统 - MKT
  • 鸭子类型(Duck Typing)中的“类型”,指的是什么的类型?为什么很多人认为“Python 没有真正实现多态”
  • OAK-D-SR近红外相机 - MKT
  • 图像分割 Segment Anything(1-2)第二代 - MKT
  • 对比c++中的多态和python的多态
  • 结对项目-自动生成小学四则运算题目命令行程序
  • tryhackme-预安全-linux 基础-Linux 基础知识(第二部分)-14