爱看书吧

爱看书吧 > 其他小说 > 学霸的模拟器系统 > 正文 第363章 穿皮衣的男人(求订阅求月票)

正文 第363章 穿皮衣的男人(求订阅求月票)(第4页/共5页)

本站最新域名:m.ikbook8.com
老域名即将停用!

内存,走一个漫长的''u''型弯。”

    林允宁从桌上的便签盒里抽出一张白纸,拔开签字笔的笔盖。

    他在纸上画了两个方块,代表gpu,中间画了一个圆圈,代表cpu。

    “这就像是两个坐在隔壁办公室的邻居,想说句话,却必须先把信寄到邮局,盖个戳,经由邮递员分拣,再送回来。

    “无论你的gpu核心频率多高,无论你有多少个流处理器。只要这个通讯机制不改,它们就是一群被堵在高速公路入口的法拉利。

    “只能怠速烧油,没法全速冲刺。”

    黄仁勋盯着那张图,手里的核桃被他捏得咔咔作响。

    他是懂技术的,他当然知道这个痛点。但他现在的处境,让他很难在这个时候去动底层架构。

    “林,你知道改变总线协议意味着什么吗?”

    黄仁勋把核桃扔回盘子里,声音低沉,“这意味着我们要去跟英特尔和pu的物理接口。

    “现在的英伟达,正在为了活下去而跟全世界打官司。你让我现在去搞这种‘基建工程''?”

    “不是现在。”

    林允宁看着黄仁勋的眼睛,语气平静,“我知道你现在很难。所以我给你带来了一个不用动硬件,就能立刻提升效率的‘止痛药’。”

    他示意克莱尔切换窗口。

    屏幕上出现了一行行枯燥的代码日志,那是针对矩阵运算的性能测试。

    “这是我们内部开发的一个并行计算加速库。

    林允宁指着屏幕,“我们针对cud做了一些深度的指令集优化。主要是针对矩阵乘法和卷积运算。

    “我们发现,如果不依赖通用的线性代数库,而是针对gpu的缓存特性手动管理显存切片,可以让浮点运算效率提升120。”

    黄仁勋的眼睛瞬间亮了。

    现在的cud生态还很荒凉,大多数科研人员还在用着效率低下的通用库。能提升120效率?这意味着英伟达的显卡在科学计算领域瞬间就能在性价比上碾压英特尔的cpu。

    这对现在的英伟达来说,是急需的强心针。

    “你想要什么?”黄仁勋身体前倾,商人本能让他立刻意识到这是笔交易。

    “我把这套库的源代码授权给你,你可以把它集成进下一代的cud版本里——也许可以叫它cudnn的雏形。”

    林允宁提出了他的条件,“作为交换,我需要你们下一代架构——代号feri——的底层驱动权限,我要能直接操作寄存器的那种。

    "b......"

    林允宁拿起笔,在那张白纸上那两个代表gpu的方块之间,画了一条粗粗的直线,直接绕过了中间的cpu。

    “在未来的硬件设计路线图上,认真考虑一下这个‘桥’。

    “如果我们在硬件层面上,给gpu开一个专用的高速互联接口。让它们可以直接访问对方的显存。

    “那它们就不再是插在主板上的外设卡,而是一个巨大的、分布式的超算单元。

    "jensen,游戏显卡可能会受经济周期影响,但科学计算的需求是无底洞。只要你把这条路修通了,以后全世界的科学家都会给你打工。

    会议室里安静
\/阅|读|模|式|内|容|加|载|不|完|整|,退出可阅读完整内容|点|击|屏|幕|中|间可|退|出|阅-读|模|式|.
『加入书签,方便阅读』
-->> 本章未完,点击下一页继续阅读(第4页/共5页)