发布日期:2024-05-11 08:50 点击次数:180
作家: 后歆桐
在2000年最蓬勃技术,相片桶(Photobucket)是巨匠顶级的图像托管网站,一度领有7000万用户,占据了好意思国在线像片商场的近一半商场。
凭证分析跟踪机构Similarweb的数据,如今只消约200万东谈主仍在使用Photobucket。但该公司首席实践官(CEO)伦纳德(Ted Leonard)涌现,现在正在与多家科技公司进行谈判,以授权其130亿张像片和视频,让科技公司用于测验生成式东谈主工智能(AI)大模子,使得这些模子有时反馈文本教导,生成新执行。现在谈判的每张像片的价钱在5好意思分~1好意思元之间,每条视频的价钱齐提升1好意思元,各个买家所需图像、视频的类型齐存在各别。
“好多科技企业告诉咱们,他们需要更多AI测验数据。一位潜在买家思要提升10亿个视频,比咱们平台领有的还多。倏得之间,咱们不再挂念没生意可作念,而是要握耳挠腮地思,咱们去那处弄那么多数据?”他示意。
伦纳德以营业奥密为由拒却涌现潜在买家的身份,但凭证其涌现的数据推算,其领有的数据执行将价值数十亿好意思元。Photobucket的境遇可谓该行业的缩影。除了对东谈主才的竞争外,科技巨头新一轮竞赛还转向了对AI测验数据。生成式AI翻新可能会给这类企业赋予重生命。但同期,这一竞赛背后的数据仍存在一些风险。
领先,谷歌、Meta和OpenAI等科技巨头使用互联网上免费的广漠数据来测验生成式AI模子。这些科技公司示意,这么作念既正当,也适应谈德。况兼,要是弗成使用广漠免费握取的、在他们看来“公开可用”的网页数据,举例非渔利机构Common Crawl提供的数据,测验AI模子的资本将难以承受。
但跟着生成式AI领域的激越和竞争加重,他们开动靠近一系列来自版权持有东谈主的诉讼和监管热情,同期也促使部安分容发布者取舍门径阻隔科技公司的数据握取。科技公司还开动需要评释若何得到并使用广漠数据来测验他们的模子。
也因此,在链接为我方的行径议论的同期,科技巨头们也开动偷偷针对一些付费执行进行谈判,触及的执行从聊天记载到那些依然式微的应答媒体诓骗枢纽所领有的、被渐忘已久的个东谈主像片和视频等,使得干系隐性来回迟缓火热起来。
举例,据媒体征引知情东谈主士音书,在ChatGPT于2022年底推出后的数月内,Meta、谷歌、亚马逊和苹果等科技巨头齐与图片平台Shutterstock订立契约,以使用其数亿张图片、视频和音乐文献进行AI模子测验。Shutterstock的首席财务官亚哈斯(Jarrod Yahes)涌现,与大型科技公司的领先来回额在2500万~5000万好意思元,大多数来回范围自后均有所扩大。一些较小的科技公司也加入了这一“淘数据热”,在当年两个月中加入谈判。
Shutterstock的竞争敌手Freepik也涌现,已与两家大型科技公司扫尾契约,授权领有的2亿张图片档案中的大部分,每张图片的价钱在2~4好意思分。公司CEO阿布拉(Joaquin Cuenca Abela)示意,现在还有五笔访佛来回正在谈判中,但他不肯涌现买家身份。
当作Shutterstock早期客户的OpenAI,还与包括好意思联社、Axel Springer和汤森路透(Thomson Reuters)等至少四家新闻机构签署了数据授权契约,以匡助测验其AI大谈话模子,但未露馅具体细节。
Klaris law讼师事务所的克拉里斯(Edward Klaris)称:“现在,科技公司正竞相争取那些领有私东谈主数据版权的持有者,这些私东谈主数据无法通过网罗免费握取。”他补充称,该事务所也正在为私东谈主数据持有者提供盘问劳动,触及价值数千万好意思元的来回,通过来回,这些数据持有者会将像片、电影和竹帛档案授权给科技公司,用于AI测验。
关于上述情况,谷歌、Meta、微软、苹果、亚马逊和OpenAI均拒却置评,不外微软和谷歌提供了包含数据阴私要求的供应商行径准则。谷歌并示意,要是发现数据供应商非法,将立即取舍行径,包括拒绝与其互助契约。
好多主要的商场相干机构示意,他们尚未开动评估这个不透明的、隐形的AI数据来回商场的范围,因为在这个商场中,公司频频不会公开契约执行。少数正在试图对该商场进行评估的相干机构,比如Business Research Insights,揣度该商场现在价值约25亿好意思元,展望在改日十年内可能增长至近300亿好意思元范围。
股市回暖,抄底炒股先开户!智能定投、条件单、个股雷达……送给你>> 海量资讯、精确解读,尽在新浪财经APP职守裁剪:王许宁