通答AI为您带来上周AI看点(8月21-8月27日):
? 重磅更新!GPT3.5支持微调
? Hugging Face从科技巨头获得2.35亿美元融资
? OpenAI与Scale AI合作进行微调
? Nvidia股价继续创纪录的上涨
? Meta推出面向编码人员的新AI工具
? MidJourney迎来强劲对手Ideogram
? Runway迎来最强竞争对手Morph
? 继承stable diffusion 和 Midjourney优点,Fooocus重磅开源
? 亚马逊为TNF广播引入AI技术
? 阿里巴巴开源大规模视觉语言模型Qwen-VL
? 国内首款AI搜索产品“天工AI搜索”上线
? 好未来千亿级数学大模型 MathGPT 开启公测
? 7个新的AI产品
OpenAI在8月22日发布了博客文章,宣布开发者可以通过GPT-3.5 Turbo模型进行微调,而GPT-4的微调计划将在今年秋季推出。微调GPT-3.5 Turbo模型在改进可操控性、保持可靠的输出格式和定制语气方面表现优异,通过API进行微调的数据不会被用于训练其他模型。尽管微调提供了性能提升,但一些情况下通过提示词工程技术可能更为有效,避免微调的复杂性和成本。
? Hugging Face从科技巨头获得2.35亿美元融资AI明星企业Hugging Face周四宣布完成了2.35亿美元的D轮融资,由谷歌、亚马逊、英伟达、Salesforce和IBM等科技巨头领投。该平台提供了分享和运行开源AI的工具,以及用于定制系统的库和其他工具,目前托管了50万个不同的模型和25万个数据集。此轮融资使公司迄今为止的总融资额达到3.952亿美元,使这家初创公司的估值高达45亿美元。首席执行官Clem Delangue表示,AI“是构建所有软件的新方式”,并希望在未来五年内有1亿AI构建者依赖Hugging Face。这轮超级融资凸显了AI开发的飞速需求。随着定制模型的不断增长,Hugging Face的平台已成为开源领域中的主导力量。OpenAI将数据标注初创公司Scale AI称为其微调GPT-3.5的“首选合作伙伴”,让该公司应用其专业知识为客户定制模型。这一宣布是在最近的试点项目之后进行的,试点项目表明,微调后的GPT-3.5在质量上与GPT-4相当,成本更低。Meta在周四宣布发布了一款名为“Code Llama”的新工具,可以通过文本提示生成和讨论代码。这个开源的LLM支持流行的语言,如Python和JavaScript。在上周三下午,Nvidia继续在华尔街上表现出色。随着他们的收益报告成为焦点,该公司的股票达到了前所未有的高度,反映了对AI芯片持续强劲的需求。Nvidia上个季度的收入翻了一倍,因数据中心需求飙升,同比增长了100%以上,超过了已经很高的市场预期。生产限制导致了对有限芯片的激烈争夺,据传甚至有一些初创公司将稀缺的GPU作为贷款的抵押品。首席执行官Jensen Huang(据报道本周其净资产增加了40亿美元)表示,“一个新的计算时代已经开始”。作为AI芯片巨头,Nvidia目前掌握着大权——每个主要参与者都必须通过他们获得推动军备竞赛的珍贵GPU。英伟达的火热,再次说明,在淘金热中,卖铁锹的永远是最赚钱的业务之一。? MidJourney迎来强劲对手IdeogramIdeogram AI是一家总部位于多伦多的初创公司,是AI艺术生成领域现任领导者MidJourney的强有力竞争对手。该公司的显著特点是在图像中生成精确的排版字体,这一特点在Nvidia研究员范麟熙的作品中得到了展示。该公司由四名前谷歌研究员创立,他们曾在Imagen项目上工作。Ideogram的图像生成能力与MidJourney和Stable Diffusion相当,而且它对提示中的空间关系的理解比Imagen更强,这得益于它使用了谷歌的T5语言编码模型。目前,该公司的重点是英文文本,但未来有扩展到其他语言的潜力。该公司已经获得了1650万美元的种子轮融资,投资人包括Andreessen Horowitz和Index Ventures。AI作画和图片生成技术正在突飞猛进,而AI视频生成也是一个新兴领域。Morph Studio是一家AI视频生成公司,他们的工具只需要几个提示词或一段语句就可以生成高质量的视频内容。该工具正在开放免费测试。Morph Studio的视频生成模型基于扩散模型训练,能很好地保证画面的一致性和准确性。该公司计划面向消费级社区开发一款产品,并通过网络社区寻找用户喜欢的主题和社区文化,最终打造自己的视频社区。? 继承stable diffusion 和 Midjourney优点,Fooocus重磅开源Controlnet的作者lllyasviel在Github上发布了一款全新的开源AI绘画工具Fooocus,可以和Stable diffusion WebUI一样部署到本地免费使用,同时具备midjourney一样便捷的操作界面。Fooocus使用的是最新推出的SDXL 1.0模型,对stable diffusion和Midjourney做了结合升级。Fooocus程序默认用到了3个SDXL的模型,一个base,一个Refiner,和一个LoRA。如果单独安装,需要下载三个模型。如果你部署了SD包,也可以共用模型(大模型和LoRA)。Fooocus已自动执行最佳配置,因此用户可以专注于提示和生成,而忽略这些参数。然而,那些对默认设置不满意的高级用户,可以用一些高级功能进行设置。本赛季,亚马逊将为其周四晚间足球比赛广播引入新的AI工具。一个新的次要“Prime Stream”将包括AI增强功能,包括突袭防守者的亮点、建议比赛呼叫、计算情境统计数据等等。这些AI增强功能是为了让数据驱动的球迷更加投入。阿里云开源了一款名为Qwen-VL的大规模视觉语言模型,该模型基于通义千问-7B打造,支持多种输入,包括图像、文本和检测框等。Qwen-VL是首个支持中文开放域定位的通用模型,能够通过中文开放域语言表达进行检测框标注。该模型在四大类多模态任务的标准英文测评中取得了SOTA。Qwen-VL可以用于知识问答、图像问答、文档问答、细粒度视觉定位等场景。模型的训练过程分为预训练、多任务预训练和微调三个步骤。近期,随着AI大模型的出现,搜索市场又变得热闹起来了。谷歌推出Bard,并在传统搜索上实验AI增强;微软必应悄悄增加GPT-4启用开关;创业公司Perplexity.ai也出了新版本。在国内,大模型黑马玩家昆仑万维推出了首款AI搜索产品“天工AI搜索”,这是国内首款正式落地并投入应用的独立AI搜索产品。天工AI搜索的体验和传统搜索大不一样,就像雇了一个助理在帮你资料,找完还给出总结汇报。天工AI搜索的首页看起来和普通搜索引擎似乎没什么不同,但是当你搜索问题时,就能感受到不同之处。搜索结果只展示对回答这个问题有参考价值的筛选后结果,屏蔽了广告和低质量内容。占页面正中C位的是“回答”,也就是AI大模型根据问题和参考生成的内容,经过AI整合提炼,避免了冗余无效信息,更高效和精准。这部分也借鉴了AI聊天机器人应用,有反馈的点赞点踩按钮,一键复制,以及不满意可以重答。再往下,大家熟悉的分页组件也不需要了。取而代之的是“追问”,也就是AI预测接下来你还可能想问什么,点一下就可以继续延续上文聊下去。将搜索引擎与大模型结合起来,有很多好处,比如按整句分析用户的真实意图,无法直接搜索到的内容也可以在理解的基础上作答。大模型还可以对搜索到的信息重新组织、整理、再按指定方式输出。此外,大模型的多轮对话能力为搜索增加了新的玩法。最后,AI搜索还可以从聊天机器人借鉴保存和分享对话记录,在自己的搜索历史中再次搜索,可以解决“我上次搜出来一个什么但是忘记是怎么搜的了”这个问题。? 好未来千亿级数学大模型 MathGPT 开启公测好未来自研的数学领域千亿级大模型 MathGPT 开启公测。用户可通过官网申请注册账号免费试用体验。MathGPT 是国内首个专为数学打造的大模型,支持中文、英文版本的 PC 端和移动端体验。用户可上传数学题,即可得到对话式的解答反馈,也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。MathGPT 在解题准确率、稳定性及用户体验方面均有明显的优势。? Bruinen- 将终端用户的数据和操作集成到您的LLM中
? IndieZebra- 在Product Hunt上进行A/B测试
? Code Llama- Meta的开源编码LLM
https://ai.meta.com/blog/code-llama-large-language-model-coding/
? Vimcal- 日历应用程序,功能强大。帮助用户高效地安排和组织事件
? HoppyCoppy- 使用人工智能在几秒钟内生成更好的电子邮件和通讯
https://www.hoppycopy.co/
? Longshot- 企业级的ChatGPT。上传您的文档,查证事实,确保零幻觉,并集成到任何地方
✏️ Yaara- 使用人工智能编写经过验证的高转化文案