38va.com 快科技资讯2023年06月28日Blog版

发布日期：2024-10-08 20:47 点击次数：101

身穿皮夹克的黄仁勋38va.com，站在蓝色冲浪板上，摆了几个冲浪的姿势。

这不是好意思国「网红节」VidCon，而是好意思国知名数据平台 Snowflake 的开发者大会上的一景。

当地时候 6 月 26 日，英伟达首创人黄仁勋和 Snowflake 公司 CEO Frank Slootman 就「如何把生成式 AI 带给企业用户」张开探讨。主拿人则是前 Greylock 的 GP，咫尺是投资机构 Conviction 的首创人。

在会上，相较于「人」Frank 奇迹司理人式的大器晚成，「皮衣教父」一如既往地语出惊人，不仅称两边的调解是「要相爱，不要搏斗」（We are Lovers，not Fighters），更开打趣说，为 Snowflake 提供的经过磨练的模子，相称于给客户「打了 1 折」。

本日，英伟达与 Snowflake 又共同放出大招：天下第一芯片公司与风头最劲的云数据平台调解，推出共同调解。Snowflake 的用户不错在数据不离开平台的前提下，奏凯欺诈英伟达的预磨练 AI 模子，在云平台上对我方公司的数据进行分析，开发针对我方数据的「AI 应用」。

「咫尺的紧要变革来自数据+AI 算法+计议引擎。通过咱们的调解，咱们的能够将这三点带到沿途。」黄仁勋讲谈。

Talking Points：

大言语模子+企业专属数据库=针对特定问题的 AI 应用；

以前是 Data going to Work，咫尺是 Work going to Data，让计议去到数据所在之地，幸免数据孤岛；

英伟达提供的预磨练模子，依然是耗尽数千万好意思元、在英伟达 AI 工场中磨练出来的，是以在 Snowflake 上调用计议引擎依然「打了 0.5 折」；

软件 3.0 时间，基于模子、数据库，企业能够在几天内搭建我方的专属应用；改日企业能够坐褥许多智能代理，并运行它们；

对于企业来说，果真的难题是羼杂结构的、非结构化的数据，如何被退换。这粗略能够带来营业模式的更新。

以下为两边对话主要内容，经整理剪辑：

谈调解：把最佳的计议引擎，带给最有价值的数据

Frank：

NIVIDA 咫尺在历史上发达着迫切的作用。对于咱们来说，能够带来数据和大型企业的考虑。咱们需要启用这项时间，以及让统统这个词工作堆栈来有用地使用它。我不想使用「成仁之好意思」来描摹，但是对于一个外行人，是一个很好的契机，进入到这扇契机的大门里。

黄仁勋：

咱们是 lovers，而不是敌手。咱们要把天下上最佳的计议引擎带到天下上最有价值的数据。回顾畴前，我依然责任了很永劫候，但是还莫得那么老。Frank，你更老一些（笑）。

最近，由于大家皆知的原因，数据是纷乱的，数据是精致的。它必须是安全的。出动数据很艰难，数据的引力真实存在。因此，对咱们来说，把咱们的计议引擎带到 Snowflake 上要容易得多。咱们的伙伴考虑是加快 Snowflake，但它亦然对于将人工智能带到 Snowflake。

最中枢的是，数据+人工智能算法+计议引擎的组合，咱们的伙伴考虑将统统这三件事兼并在沿途。令人难以置信的有价值的数据，令人难以置信的伟大的人工智能，令人难以置信的伟大的计议引擎。

咱们不错沿途作念的事情，是匡助客户使用他们的罕见数据，并用它来编写 AI 应用顺序。你知谈，这里的紧要破损是，你第一次不错开发一个大型言语模子。你把它放在你的数据前边，然后你与你的数据交谈，就像你与一个人交谈相通，而这些数据将被增强到一个大型言语模子中。

大型言语模子加常识库的组合等于一个人工智能应用。这少许很简便，一个大型的言语模子将任何数据常识库变成一个应用顺序。

想想人们所写的一切惊人的应用顺序。它的中枢恒久是一些有价值的数据。咫尺你有一个查询引擎通用查询引擎在前边，它超等智能，你不错让它报酬你，但你也不错把它兼并到一个代理，这是 Langchain 和向量数据库带来的破损。将数据和大言语模子类似的破损性的东西正在到处发生，每个人齐想作念。而 Frank 和我将匡助大众作念到这少许。

软件 3.0：建立 AI 应用，照应一个特定问题

主拿人：

当作投资者来看这种变化，软件 1.0 口舌常细办法代码，由工程师按照功能写出来；软件 2.0 是用仔细辘集的标志的磨练数据优化一个神经辘集。

你们在匡助人们撬动软件 3.0，这套基础模子自己有令人难以置信的智力，但它们仍然需要与企业数据和自界说数据辘集作。只是针对它们去开发那些应用顺序要低廉得多。

对于那些深入暖和这个规模的人来说有一个问题，基础模子口舌常泛化，它不错作念统统事情吗？为什么咱们需要自界说模子和企业数据呢？

Frank：

巨屌x

是以咱们有至极泛化的模子，不错作念诗，处理《了不得的盖茨比》的作念选录，作念数学问题。

但是在营业中，咱们不需要这些，咱们需要的是一个 Copilot，在一个至极窄小，但口舌常复杂的数据集上取得超卓的洞见。

咱们需要了解营业模式和营业动态。这么的计议上不需要那么腾贵，因为一个模子并不需要在一百万件事情上秉承磨练，只需要知谈至极少的、但很深入的主题。

举个例子。我是 Instacart 的董事会成员，咱们一个大客户，像 DoorDash 和统统其他企业常濒临的问题是，他们握住加多营销用度，来了一个客户，客户下了一个订单，客户要么不回顾，要么 90 天后回顾，这至极不褂讪。他们把这称为流失客户。

这是复杂问题的分析，因为客户不回顾的原因可能有好多。人们想找到这些问题的谜底，它在数据中，不在一般的互联网中，而况不错通过人工智能找出来。这便是可能产生纷乱价值的例子。

主拿人：

这些模子应该如何与企业数据互动？

黄仁勋：

咱们的策略和产物是各式尺寸、起始进的预磨练模子，未必你需要创建一个至极大的预磨练模子，以便它不错产生 prompt，来教更小的模子。

而较小的模子险些不错在职何开拓运行，也许蔓延至极低。然则它的泛化智力并不高，zero shot（零样本学习）智力可能更有限。

因此，你可能有几种不同类型不同大小的模子，但在每一种情况下，你必须作念监督的微调，你必须作念 RLHF（人类反映的强化学习），以便它与你的方针和原则保抓一致，你需要用矢量数据库之类的东西来增强它，是以统统这些齐汇集在一个平台上。咱们有妙技、常识和基本平台，匡助他们创建我方的人工智能，然后将其与 Snowflake 中的数据兼并起来。

咫尺，每个企业客户的方针不应该是想考我如何建立一个大型的言语模子，他们的方针应该是，我如何建立一个人工智能应用顺序来照应特定的问题？阿谁应用可能需要 17 个问题来作念 prompt，最终得出正确的谜底。

然后你可能会说，我想写一个顺序，它可能是一个 SQL 顺序，可能是一个 Python 顺序，这么我就不错在改日自动作念这个。

你如故要诱骗这个人工智能，让他最终能给你正确的谜底。但在那之后，你不错创建一个应用顺序，不错当作一个代理（Agent）24/7 不阻隔地运行，寻找关联情况，并提前向你陈诉。是以咱们的责任便是匡助客户建立这些人工智能的应用，这些应用是有安全护栏的、具体的、定制的。

最终，咱们在改日齐将成为智能制造商，固然雇用职工，但咱们将创建一大堆代理，它们不错用 Lang Chain 类似的东西来创建，兼并模子、常识库、其他 API，在云中部署，并将其兼并到统统的 Snowflake 数据。

你不错规模化地操作这些 AI，并握住地完善这些 AI。因此，咱们每个人齐将制造 AI、运行 AI 工场。咱们将把基础设施放在 Snowflake 的数据库，客户不错在那处使用他们的数据，磨练和开发他们的模子，操作他们的 AI，因此，Snowflake 将是你的数据存储库和银行。

有了我方的数据金矿，统统人齐将在 Snowflake 上运行 AI 工场。这是方针。

「核弹」虽贵，奏凯用模子相称于「打 1 折」

黄仁勋：

咱们在 NIVIDA 建立了有五个 AI 工场，其中四个是天下前 500 名的超等计议机，另一个正在上线。咱们使用这些超等计议机来作念预磨练模子。

因此，当你在 Snowflake 中使用咱们的 Nemo AI 基础工作时，你将得到一个起始进的预磨练模子，依然有几千万好意思元的用度参加其中，更无须说研发参加了。是以它是事先磨练好的。

然后有一大堆其他的模子围绕着它，这些模子用于微调、RLHF。统统这些模子的磨练资本齐要高得多。

因此，咫尺你依然将预磨练模子合适于你的功能，合适于你的护栏，优化你但愿它具有的妙技或功能类型，用你的数据增强。因此，这将是一个更具资本效益的顺序。

更迫切的是，在几天内，而不是几个月。你不错在 Snowflake 开发与你的数据兼并的人工智能应用顺序。

你应该能够在改日快速建立人工智能应用顺序。

因为咱们咫尺看到它正在及时发生。依然有一些应用能够让你和数据聊天，比如 ChatPDF。

主拿人：

是的，在软件 3.0 时间，95% 的培训用度已历程他人承担了。

黄仁勋：

（笑）是的，95％的扣头，我无法联想一个更好的交游。

主拿人：

这是果真的能源，当作投资人，我看到在分析、自动化、法律等规模的至极年青的公司，他们的应用依然在六个月或更短的时候内完结了果真的营业价值。其中一部分原因是他们从这些事先磨练好的模子启动，这对企业来说是一个纷乱的契机。

黄仁勋：

每家公司齐会少见百个，以致 1000 个人工智能应用顺序，只是与你公司的各式数据贯串。是以，咱们统统人齐必须善于构建这些东西。

蓝本是数据找业务，咫尺是业务找数据

主拿人：

我一直从大企业参与者听到的一个问题是，咱们必须去投资人工智能，咱们需要一个新的堆栈（Stack）吗？应该如何探讨与咱们现存的数据堆栈贯串？

Frank：

我认为它在握住发展。模子们正逐步变得更简略、安全、更好地被照应。是以，咱们莫得一个果真明确的不雅点，这便是每个人齐会使用的参考架构？有些人将有一些中央工作果真立。微软有 Azure 中的人工智能版块，它们的好多客户正在与 Azure 进行互动。

但咱们不澄清什么模子将主导，咱们认为商场将在使用难易、资本这些事上进行自我排序。咫尺只是是启动，不是最终的气象。

安全部门也会参与进来，对于版权的问题会被改良。咫尺咱们对时间很陶醉，现实中的问题也会被同期处理。

黄仁勋：

咱们咫尺慎重验 60 年来第一次根人性的计议平台变革。要是你刚刚读了 IBM System 360 的新闻稿，你会听到对于中央处理单位、IO 子系统、DMA 扫尾器、假造内存、多任务、可扩张计议上前和向后端兼容，而这些见地，履行齐是 1964 年的东西，而这些见地匡助咱们在畴前六十年来，握住进行 CPU 扩张。

这么的扩张依然进行了 60 年了，但这依然走到了尽头。咫尺大众齐流露，咱们无法再扩张 CPU 了，倏得之间，软件变化了。软件的编写样式，软件的操作样式，以及软件能作念的事情齐与以前有很大的不同。咱们称之前的软件为软件 2.0。咫尺是软件 3.0。

事实便是，计议依然从根柢上转变了。咱们看到两个基本的能源在同期发生，这亦然为什么咫尺事情正在发生剧烈触动。

一方面，你不可再握住地购买 CPU。要是你来岁再买一大堆 CPU，你的计议蒙胧量将不会加多。因为 CPU 扩张的止境依然到来了。你会多花一大堆钱，你不会得到更多的蒙胧量。

因此，谜底是你必须去加快（英伟达加快计议平台）。图灵奖取得者谈到了加快，英伟达始创了加快，加快计议咫尺依然到来。

另一方面是，计议机的统统这个词操作系统发生了深切的转变。咱们有一个叫 NIVIDA AI Enterprise 的层，而其中的数据处理、磨练、推理部署，统统这个词咫尺依然整合到或正在整合到 Snowflake 中，因此，从启动数据处理，一直到终末的大模子部署，统统这个词背后的计议引擎齐被加快了。咱们将赋能 Snowflake，在这里你将能够作念得更多，而况你将能够用更少的资源作念到更多。

要是你去任何一个云，你会看到 NVIDIA GPU 是其中最腾贵的计议实体。但是，要是你把一个责任负载放在上头，你会发现咱们作念得至极快。就好像你得到了一个 95% 的扣头。咱们是最腾贵的计议实体，但咱们是最具资本效益的 TCO。

是以，要是你的责任是运行责任负载，可能是磨练大型言语模子，可能是微调大型言语模子，要是你想这么作念，一定要进行加快。

加快每一个责任负载，这便是统统这个词栈的重塑。处理器因此发生变化，操作系统因此不同，大的言语模子是不同的，你写 AI 应用顺序的样式是不同的。

改日，咱们齐要写应用。咱们齐要把咱们的 prompt 和咱们的险阻文，和少数几个 Python 呐喊兼并起来，兼并到大言语模子和我方的数据库或者公司的数据库中，开发我方的应用顺序。每个人齐将成为一个应用顺序的开发者。

主拿人：

但不变的是，它仍然是你的数据。你仍然需要对它进行微调。

Frank：

蓝本咱们齐合计更快的老是更贵的。履行上倏得之间，更快的是更低廉的，这是一种反直观的东西。因此，未必人们想减少供应，以为这么更低廉，成果却更贵。

另一个与之前矛盾的是，蓝本齐是数据去找业务（data going to work)，而咫尺，业务去找数据 (work going to data)。畴前的六十年，或者更多年，咱们一直在让数据去找业务，这导致了大规模的信息孤岛。而要是你想领有一个 AI 工场，用之前的作念法将口舌常艰难的。咱们必须把计议带到数据所在的场所。我认为咱们咫尺正在作念的便是正确的样式。

企业如何取得最快和最大的价值

Frank：

最快和取得最大价值其实是两个很不相通的问题。

最快的话，你很快能够看到，数据库各处齐上线了人工智能增强的搜索样式，因为这是最容易加多的功能。

咫尺，以致一个文盲齐能从数据中获取有价值的信息，这真至极不可想议，这是终极的交互民主化。搜索功能极大增强，你就向主界面提一个问题，它们不错把这些问题带到数据我方进行查询。这是挂在低处的果实，最容易的，咱们认为这是阶段一。

接下来，咱们就启动果真暖和果真的难题，便是罕见的企业数据，羼杂结构化的、非结构化的，统统这些，咱们如何退换这些数据？

我前边依然提到了 to C 企业濒临的流失率问题，供应链照应方面的问题。当供应链特别复杂的时候，要是有一个事件发生了，咱们如何再行诊治一个供应链，使其运转？我咫尺该怎么作念？供应链是由好多不同的实体构成的，不是单一的企业。

历史上，这是一个从未被计议照应过的问题。供应链照应从来莫得酿成过一个平台，它险些是一个电子邮件，电子表格酿成的体系，除了一些小的例外。因此，这是极其令人兴隆的。

或者咱们不错再行计议大型的呼唤中心的投资，优化零卖的订价，像我说的，这是一个大企业的 CEO 们一直期待的再行界说营业模式，是果真的后劲。

主拿人：对企业的建议：

黄仁勋：

我会问我方，第一，什么是我独一最有价值的数据库？第二件事，我会问我方，要是我有一个超等、超等、超等智谋的人，而企业的一切数据齐经过阿谁超等智能，我会问阿谁人什么？

证据每个人的公司，这是不同的。Frank 的公司客户数据库至极迫切，因为他有好多客户。而我我方的公司，莫得那么多客户，但对我的公司而言，我的供应链超等复杂，而况我的打算数据库也超等复杂。

对 NIVIDA 来说，莫得人工智能咱们依然无法建造出GPU。因为咱们的工程师齐不可能像AI那样，为咱们进行多数的迭代和探索。因此，当咱们忽视人工智能的时候，第一个应用在咱们我方的公司。而况，是以 Hopper（英伟达超算产物）不可能莫得人工智能的打算。

咱们也会将咱们我方的 AI 应用于咱们我方的数据中。咱们的异常数据库便是一个好意思满的应用场景。要是你看一下 NIVIDA AI 的代码量，咱们有几百个软件包，兼并在沿途，维持一个应用顺序能够跑起来。

咱们咫尺正在接力的一些事情，便是如何使用 AI 去弄澄清如何给它打安全补丁，如何最佳地瞻仰它，这么咱们就不错不必滋扰统统这个词表层应用层的同期，能够向后端兼容。

这齐是 AI 能够为你提供谜底的。咱们不错用一个大言语模子去回答这些问题，为咱们找到谜底，或者向咱们揭示一些问题，然后工程师就不错再将其修好。

或者 AI 不错保举一个建设顺序，人类工程师再去证明这是不是一个好的建设顺序。

我合计不是统统人齐意识到了他们每天齐在处理的数据内部，其实蕴含着些许智能、洞见和影响力莫得被发掘。这便是为什么咱们统统人齐要参与进来，匡助带来这么的改日。

咫尺，你储存在数据仓库的数据，第一次不错被兼并进人工智能工场。你将能够坐褥信息谍报，这是天下上最有价值的商品。你坐在一个当然资源的金矿上——你公司的罕见数据，而咱们咫尺把它兼并到一个人工智能引擎上，另一端每天奏凯产生信息谍报，以难以置信的谍报量从另一端涌出，以致在你睡眠时也在源源连接地产出。这是有史以来最佳的事情。

黄仁勋：NVIDIA的AI产物依然给客户打1折了 38va.com

上一篇：38va.com 【南天名苑】2024官方网站
下一篇：没有了

38va.com 快科技资讯2023年06月28日Blog版

热点资讯

相关资讯