原文:AI落地之难:大多数机器学习模型没有投入生产|QCon

人工智能是一项伟大的技术,但这项伟大的技术,就像人类的大脑一样开发程度不足 5%,它只能被称为弱人工智能。

不过,哪怕只是弱人工智能,它已经让我们的生产生活发生了巨大的变化,如果把人工智能当成虚拟员工,这位员工已经深入到了企业的各个职能线中,从决策到产研,承担着重要的辅助角色,从而帮助企业降本增效来推动形成商业价值。

人工智能采用率的提高同样会对计算资源和基础设施提出新的要求。

第一个,数据问题。人工智能需要大量的数据用以训练模型,如果上层的数据体系没有建设好,人工智能还能做得好就是怪事了。

第二个,算力问题。近年来,人工智能的进步,一方面得益于平台的崛起,另一方面归功于硬件的进步,使得算力被进一步释放。如何进一步释放 CPU/GPU 算力,以满足机器学习的性能和速度对于计算的要求。

第三个,存储问题。机器学习时代,需要什么样的数据库?AI 数据库或许是一个好的选择,它不仅能满足机器学习对于高质量数据的要求,也能满足特征工程以及机器学习模型的上线需求以及在离线性能要求,且具备灵活性和可扩展性。

第四个,网络问题。为最大限度地交付结果,人工智能需要高带宽、低延迟的网络。AI 中的数据流动性比传统数据更自由、更实时,因此,仅靠高带宽并不一定能提高 AI 的性能,或许还需要一些新的网络结构。

第五个,工程问题,这是 AI 落地的最大问题,夸张一点说,当前的 AI 工程还处于蛮荒时代,手动交付比比皆是。大家都希望以更简化、更具流程性的方式构建和部署人工智能应用,MLOps 的诞生就是为了解决这个问题,它旨在以稳定,可扩展和可靠的方式将机器学习算法投入生产所需的技术堆栈。

从算法到应用,从模型训练到生产部署,人工智能工作流程的每个阶段都值得被重视。但当前的事实就是,IT、数据科学、工程各个环节都是脱节自顾自工作,大多数的机器学习模型并没有投入生产,如果一项技术长期无法转化为商业价值,那么它终将被资本抛弃,就如几年前,AI 泡沫散去,浮尸遍野。

Last modification:July 7th, 2022 at 02:43 pm