虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

您现在的位置是:首页 > 技术阅读 >  AI初创公司 SiMa.ai推出用于边缘计算的「专用」AI芯片

AI初创公司 SiMa.ai推出用于边缘计算的「专用」AI芯片

时间:2024-02-06

图示:其封装中所示的MLSoC是第一款专用芯片,不仅可以处理嵌入式用例中AI的矩阵乘法运算,还可以处理需要在同一应用程序中运行的计算机视觉的传统功能。(来源:SiMa)

在人工智能计算机芯片的广阔前景中,服务于「边缘」市场的产品,包括无人机、物联网设备、电话和低功耗服务器环境,为供应商提供了肥沃的土壤,成为少有的市场之一。与数据中心技术相比,市场上的发达地区。

正如媒体早些时候报道的那样,数十家初创公司已经获得了数千万美元的风险投资,用于制造用于移动和其他嵌入式计算用途的人工智能芯片。由于边缘市场不太稳定,供应商有很多不同的方法来解决这个问题。

2022年8月30日,人工智能芯片初创公司SiMadotai正式推出了其所谓的MLSoC,这是一种用于以更低功耗加速神经网络的片上系统。该公司表示,已开始向客户发货的新芯片是唯一「专门构建」的部件,用于处理高度重视计算机视觉任务的任务,例如检测场景中是否存在物体。

「每个人都在构建机器学习加速器,仅此而已。」SiMa.ai的联合创始人兼首席执行官KrishnaRangasayee在接受采访时说。

Rangasayee表示,「嵌入式边缘市场与云计算的不同之处在于,人们正在寻找端到端的应用程序问题解决者」,而不仅仅是用于机器学习功能的芯片。

「他们正在寻找可以在芯片上运行整个应用程序的片上系统体验。」

Rangasayee认为,竞争对手只能通过执行机器学习的神经网络功能来「处理一小部分问题」。

「每个人都需要机器学习,但这是整个问题的一部分,而不是整个问题。」Rangasayee表示。

SiMa.ai芯片采用台积电的16纳米制造工艺制造,将多个部件制成单个芯片。这些部件包括一个机器学习加速器和代号为「Mosaic」的专用于作为神经网络处理基础的矩阵乘法。

板载还有一个ARMA65处理器内核,通常在汽车中找到,以及各种功能单元以帮助视觉应用的特定任务,包括一个独立的计算机视觉处理器、一个视频编码器和一个解码器、4兆字节的片上内存,以及大量的通信和内存访问芯片,包括一个与32位LPDDR4内存电路的接口。

芯片硬件附带SiMa.ai软件,可以更轻松地调整性能并处理众多工作负载。

SiMa.ai的产品针对各种市场,包括机器人、无人机、自动驾驶汽车、工业自动化以及医疗保健和政府的应用。

「这是一个价值数万亿美元的市场,仍在使用几十年前的技术。」Rangasayee观察到各种民用和政府应用。

Rangasayee说,当今许多用于自主飞行器和其他应用的计算机视觉系统都使用「传统的负载存储架构、冯诺依曼架构」,他指的是市场上大多数计算机芯片的基本设计。

他说,用于机器学习和计算机的芯片在处理计算带宽和数据相互结合的方式方面并没有进步。

「我们拥有独特的MLSoC,这是第一个包含ML的片上系统,因此人们可以在一个单一架构中进行经典的计算机视觉,并解决除ML之外的遗留问题。」Rangasayee说。

「sima」这个词是梵文「edge」的音译。

EdgeAI一词已成为一个笼统的术语,指的是不在数据中心内的所有事物,尽管它可能包括位于数据中心边缘的服务器。它的范围从智能手机到使用谷歌移动人工智能的TinyML框架消耗微瓦功率的嵌入式设备。

SiMa.ai与众多移动和嵌入式竞争对手抗衡。在边缘市场,竞争对手包括AMD、ARM、高通、英特尔和英伟达。然而,这些公司传统上一直专注于以更大功率运行的更大芯片,大约几十瓦。

SiMa.ai芯片拥有其创造者所说的在市场上完成典型任务的最低功耗预算之一,例如ResNet-50,这是处理ImageNet标记图片任务的最常见的神经网络。

图示:SiMa在评估板上提供MLSoC,用于应用测试。(来源:SiMa)

该公司表示,该部件每秒可以执行50万亿次运算,或「teraoperations」,每瓦每秒10teraoperations。这意味着该部件在执行神经网络任务时将消耗5瓦,尽管在使用其他功能时它可能会更高。

以几瓦特运行的这类芯片使SiMa.ai成为许多初创公司的公司,包括HailoTechnologies、Mythic、AlphaICs、Recogni、EdgeCortix、FlexLogix、Roviero、BrainChip、Syntiant、UntetherAI、Expedera、DeepAI、Andes和Plumerai等。

Rangasayee说,「在我们的视线范围内」的唯一公司是Hailo和Mythic。但是,「我们最大的区别在于他们只构建ML加速器。我们正在构建完整的MLSoC。」

得益于SiMai.ai在ARM内核和专用图像电路以及Mosaic神经网络代码中的构建,客户将能够在添加来自PyTorch和TensorFlow等流行ML框架的代码的同时运行现有程序的能力更强。

Rangasayee告诉媒体:「对我来说有趣的是,对支持传统的专用平台的被压抑的需求非常高。」「他们几乎可以从第一天开始运行他们的应用程序——这是我们拥有的巨大优势。」

「我们是第一家破解解决任何计算机视觉问题的代码的公司,因为我们不关心代码库,它可以是C++、Python或任何ML框架。」Rangasayee解释说。

他认为,对项目的广泛支持使公司倾向于将自己视为芯片的「埃利斯岛」。「把你的穷人给我们,把你累的给我们……我们会把他们都拿走!」

Rangasayee断言,这种广泛的支持意味着该公司拥有更多的客户群,而不仅仅是一个利基市场。

根据Rangasayee的说法,该芯片的另一个优势是它的性能是任何可比部件的十倍。

Rangasayee说,「我们的客户关心的是每瓦每秒的帧数」,即每瓦功率的图像帧数。「我们至少是任何人的10[倍]。我们日复一日地向每一位客户展示这一点。」

该公司尚未根据广泛引用的MLPerf基准分数提供基准规格,但Rangasayee表示,该公司打算在未来进一步这样做。

「现在,首要任务是赚钱。」Rangasayee说,「我们是一家非常小的公司」,拥有120名员工。「我们不能让一个团队单独做MLPerf。」

「你可以围绕基准做很多调整,但人们关心的是端到端性能,而不仅仅是MLPerf基准。」

「是的,我们有数字,是的,我们比任何人都做得更好,但与此同时,我们不想把时间花在建立基准上。我们只想解决客户问题。」

尽管8月30日的公告是关于芯片的,但SiMa.ai特别强调其软件能力,包括它所谓的「新型编译器优化技术」。该软件可以支持「广泛的框架」,包括TensorFlow、PyTorch和ONNX,机器学习用于开发和训练神经网络的主要编程库。

该公司表示,其软件允许用户「运行任何计算机视觉应用程序、任何网络、任何模型、任何框架、任何传感器、任何分辨率」。

Rangasayee说:「你可以在一个应用程序上花费大量时间,但如何让成千上万的客户通过终点线?这确实是一个更难的问题。」

Rangasayee说,为了实现这一目标,公司的软件工作包括两件事:「前端」的编译器创新和「后端」的自动化。

该编译器将支持「120多种交互」,这提供了「灵活性和可扩展性」,可以将比通常情况下更多种类的应用程序引入芯片。

该软件的后端部分使用自动化来允许更多应用程序「映射到您的性能」,而不是「等待数月才能得到结果」。

Rangasayee说:「大多数公司都在让人参与以获得正确的性能。」

「我们知道我们必须以一种巧妙的方式实现自动化,以便在几分钟内获得更好的体验。」

他说,这项软件创新旨在利用MLSoC「按钮」,因为「每个人都想要ML;没有人想要学习曲线。」这也是Rangasayee的前雇主Xilinx也采用的一种方法,试图使其嵌入式AI芯片更加用户友好。

「我在以前的公司了解到软件的重要性。这真的取决于我们软件的实力。」Rangasayee说,「是的,我们的硅非常棒,我们为此感到非常自豪,没有硅,你就不是一家公司。」

「但对我来说,这是必要的功能,而不是足够的功能;足够的功能是提供轻松的ML体验。」

相关报道:

https://www.zdnet.com/article/ai-startup-sima-debuts-purpose-built-ai-chip-for-edge-computing/

文章来源:ScienceAI

IEEE Spectrum

《科技纵览》

官方微信公众平台






往期推荐
探索金属世界
电子墨水的绚丽时刻
苏姿丰打破半导体天花板