图片:Google
全球超过一半的首席执行官正在尝试使用人工智能生成文本、图像和其他形式的数据,最近《财富》杂志和德勤共同进行的一项调查发现。与此同时,根据麦肯锡的一份报告,三分之一的组织在至少一个业务功能中“定期”使用生成式人工智能。
考虑到庞大(显然还在增长)的可寻址市场,谷歌云正在极力努力保持领先地位,这一点毫不奇怪。
在其年度Cloud Next大会上,谷歌宣布了Vertex AI的更新,这是其基于云的平台,为构建、训练和部署机器学习模型提供了工作流。Vertex AI现在提供了更新后的文本、图像和代码生成AI模型,还增加了来自初创公司Anthropic和Meta等的新的第三方模型,以及允许开发人员整合公司数据并代表用户采取行动的扩展功能。
谷歌云人工智能和行业解决方案副总裁杨洁在一次新闻发布会上表示:“[通过Vertex,]我们采取了非常开放的生态系统方法,与广泛的生态系统合作伙伴合作,为客户提供选择和灵活性。我们以企业的准备就绪为核心构建了生成式人工智能方法,强调数据治理、负责任的人工智能安全等方面。”
在模型方面,谷歌声称已经“显著”升级了其Codey代码生成模型,在“主要支持的语言”中提供了25%的质量改进。(不幸的是,在我获得的材料中,谷歌没有详细说明这一模糊指标。)它还更新了Imagen,其图像生成模型,以改进生成图像的质量,并支持样式调整,允许客户只需10张参考图像就能创建“符合其品牌”的图像。
此外,谷歌的PaLM 2语言模型可以理解新的语言(38种在普遍可用,100种在预览中),并且具有扩展到32,000标记上下文窗口的能力。上下文窗口,以标记(即原始文本位)衡量,是指模型在生成任何附加文本之前考虑的文本范围(32,000标记相当于大约25,000个词,或约80页双倍行间距的文本)。
PaLM 2的上下文窗口并不是最大的。这一荣誉属于Anthropic的Claude 2,它有一个100,000标记的上下文窗口——比原始PaLM 2和GPT-4的窗口大三倍多。但Vertex AI的产品负责人Nenshad Bardoliwalla表示,选择32,000标记是考虑到“灵活性”和“成本”。
Bardoliwalla在发布会上表示:“我们的客户正在努力平衡他们能够使用大型模型进行建模和他们可以生成的场景之间的灵活性,以及推理的成本,以及微调的能力。每一个这些都有一定的计算成本,以及根据您投入多少投资的人力成本。因此,我们认为在这个时候,考虑到市场的发展,32,000标记的结果在我们进行的评估中相当令人印象深刻。我们认为这在新功能和在市场上提供具有竞争力的性价比之间取得了适当的平衡。”
并不是每个客户都会同意这个看法。但为了两全其美,谷歌在Vertex AI的模型库中添加了第三方模型,包括Claude 2,这是一系列可预先构建的模型和工具,可以根据企业的需求进行定制。加入模型库的其他模型包括Meta最近发布的Llama 2和技术创新研究所的开源Falcon LLM。
这些新模型的添加是对亚马逊Bedrock的挑战,Bedrock是亚马逊最近推出的AWS产品,可以通过初创公司的预训练模型构建生成式人工智能应用程序,其中包括AI21 Labs、Anthropic和Stability AI。鉴于Bedrock的不稳定推出,谷歌或许看到了在新兴的托管模型服务市场中建立立足点的机会。
为此,谷歌还为Vertex AI引入了扩展和数据连接器,这实际上是对OpenAI和微软的人工智能模型插件的自家版本。
扩展是一组工具,允许开发人员将模型库中的模型与实时数据、专有数据或第三方应用程序连接,例如客户关系管理系统或电子邮件账户(如Datastax、MongoDB或Redis),甚至可以代表用户采取行动。数据连接器可以从各种平台摄取企业和第三方数据,例如Salesforce、Confluence和Jira,以只读方式访问。
在某种程度上相关的是,Vertex AI现在支持Ray,这是用于扩展用Python编写的人工智能和工作负载的开源计算框架。它加入了Vertex AI已经支持的框架,包括谷歌自己的TensorFlow。
我注意到谷歌再次避免了许多与各种形式的生成式人工智能相关的伦理和法律挑战,也许其中主要是版权问题。像PaLM 2和Imagen这样的人工智能模型通过“训练”现有数据来“学习”生成文本和图像,这些数据往往来自于在网络上搜索公开、受版权保护的源获得的数据集。
Bardoliwalla此前告诉TechCrunch,谷歌会进行广泛的“数据治理审查”,以“查看模型内的源数据”,以确保其“不受版权要求的影响”。但是,即使慷慨地假设谷歌所有的人工智能训练数据都不涉及受版权保护的材料,与许多竞争对手一样,谷歌并没有提供退出机制,允许除了Vertex AI客户之外的任何数据所有者排除其数据被用于模型训练。
更大的未解决问题是,Vertex AI的客户是否真正拥有他们使用人工智能生成的内容。至少在美国,AI生成的艺术是否具有版权并不清楚。
谷歌对这个问题没有答案——至少在我所获取的材料中没有准备好的答案。
Vertex AI搜索和对话 抓住了AI驱动的聊天机器人和搜索的受欢迎程度,谷歌在Vertex中提供了两款产品,旨在摒弃创建生成式搜索和聊天应用程序的复杂性:Vertex AI搜索(以前称为企业搜索的生成式AI应用程序构建器)和Vertex AI对话(以前称为生成式AI应用程序构建器上的对话AI)。
从今天开始,两者都是通用的。
借助Vertex AI搜索和Vertex AI对话,开发人员可以摄取数据并添加定制,构建可以与客户互动并回答基于公司数据的问题的搜索引擎、聊天机器人或“语音机器人”。谷歌设想这些工具可用于构建食品订购、银行协助和半自动客户服务等用例的应用程序。
随着从GA跳转到多轮搜索,Vertex AI搜索和Vertex AI对话新增了多轮搜索功能,可以在不从头开始的情况下提问后续问题。还新增了对话和搜索摘要,可以对搜索结果和聊天对话进行预测性摘要。
在即将推出预览版的Vertex AI对话中,Playbook允许用户以自然语言定义他们希望语音和聊天机器人执行的回应和交易,类似于人类处理任务的方式。他们可以添加角色(“您是一个知识渊博友好的自行车专家,为电子商务网站提供支持”)、目标(“帮助客户完成支付”)、步骤(“要求信用卡号码,然后是送货地址”)和示范,展示了如何以理想方式完成目标。
Vertex AI模型扩展和数据连接器可以与Vertex AI搜索和Vertex AI对话一起使用。还可以使用Vertex中的另一个新功能,即接地功能,该功能可以将模型的输出与公司的数据相联系,例如,通过要求模型明确引用其对问题的回答。
谷歌表示,Vertex AI搜索很快将支持企业访问控制,以“确保信息仅对适当的用户显示”,并提供相关性评分,以“增加对结果的信心”并使其“更有用”。
考虑到生成式AI模型编造事实的倾向,我对此持怀疑态度。恶意行为者总是试图通过注入指令攻击来让模型偏离正轨。在这种情况下,无论是文本生成还是图像生成的模型,都可能会产生有害内容——这是由于用于训练它们的数据中的偏见所导致的。
Bardoliwalla声称,即使接地工具不能从根本上解决生成模型的幻觉和有害问题,它们也是朝着正确方向迈出的一步。
他说:“我们认为,全面的基于权威源的接地功能是我们提供一种控制幻觉问题并使其更值得信赖的方式之一。”
在以前的一次采访中,Bardoliwalla声称,对Vertex托管的生成模型的每个API调用都会进行“安全属性”评估,包括毒性、暴力和淫秽。对这些属性进行评分,并针对某些类别,阻止响应或让客户选择如何继续。
随着生成式AI模型变得越来越复杂和难以解释,我想知道这是否是可持续的。我们——以及谷歌云的客户们——将拭目以待。