墨芯@WAIC 2024:遇见智能客服的“超级大脑”, 体验“硬核四芯”的算力震撼
2024年7月5日,国家级AI顶级盛会——2024世界人工智能大会(简称“WAIC 2024”)现场,墨芯人工智能展出的最新智能客服系统和高性能计算卡S40,为参会观众呈现了一场科技饕餮盛宴。






640.jpg

墨芯人工智能展台


01

墨芯智能客服系统

        “懂你所说” 才能顺畅沟通

在WAIC 2024现场,「墨芯智能客服系统」以其“聪明听得懂人话”的体质,吸引了众多观众粉。这款AI客服不简单:在录入基础知识库的前提下,既能够有针对性地迅速回答相关问题,还能通过实时人工审核与干预,提供更加精准和人性化的回复。


640 (1).jpg

墨芯智能客服系统


在AI客服日益普及的今天,各行业的智能客服通过自然语言处理和语音识别技术,有效提升了服务效率。然而,当遇到行业专业性极强的问题时,传统AI客服的“智能”有时显得力不从心,甚至出现答非所问、胡编乱造事实、模板化明显等“智障”的窘境。为解决这一痛点,墨芯智能客服系统通过自研AI计算卡S30、开源模型Llama3-70B,以及自研的开发框架AgenDA,为智能客服注入了“超级大脑”——通过优化智能客服系统的算法,显著提升其对用户需求的理解能力。


AgenDA 是墨芯自研的大型语言模型应用程序开发框架,可作为市面上其它同类产品的超集(如:LangChain)。AgenDA 原生支持 RAG(Retrieval-Augmented Generation,检索增强生成)技术,内置多种不同功能的 Function, 每个 Function 都具备独特的逻辑处理能力(如:索引、排序、多轮对话等),做到开箱即用,并采用链式调用机制共同构建起一个功能完备的大模型应用。


墨芯基于该框架进行抛砖引玉,以业内常见的客服场景为例,这种设计让AI客服 “大脑” 的运行过程更加透明,可直观清晰地查看每一步的计算细节,便于及时纠错和优化,确保客服大模型生成过程可见可控、有迹可循,不再是“开盲盒”。


值得一提的是,「墨芯智能客服系统」的“超级大脑”——内置基础知识库不仅能自我学习和完善专业场景的知识内容,还能在人工审核辅助下,从对话的开始到大模型知识库搜索、再到大模型对答案排序的每一个环节,都能够进行精确调整和优化。这种及时调优和持续学习,让AI客服的“大脑”越用越“聪明”,从而更好地理解和满足用户的个性化需求。


通过这种技术的应用, AI客服在应对高度专业化的咨询时(如:医学、健康、金融等领域),能够提供更加精准可靠的解答。此外,在有效解决大模型幻觉问题的基础上,增强了结果的可控性。


02

墨芯S40计算卡

        四芯联动,算力爆表

除智能客服系统之外,墨芯还展出了另一款“硬核担当”——S40计算卡。这款专注于数据中心AI推理应用的“超能战士”,为处理大模型高吞吐量敏感场景而生,集成了四颗墨芯Antoum®芯片,以其单卡强劲算力和高密度设计,为数据中心带来了前所未有的处理效率。

640 (2).jpg

墨芯S40计算卡


除了前述这两大亮点外,墨芯还带来了一系列备受瞩目的展品,包括:荣获MLPerf国际基准测试冠军的S30计算卡,这款产品以其卓越的性能在业界引起了广泛关注。同时,墨芯还展出了创新的AI集成架构方案,这些方案以其高效和灵活性,为解决实际问题提供了全新的视角。


640 (3).jpg

墨芯展台产品展示


在WAIC 2024上,墨芯不仅展示了其技术实力,更以用户为中心,深度聚焦大模型落地中实际遇到的困境,通过将稀疏算法与硬件紧密结合,提供了切实可行的行业解决方案,全面释放了稀疏计算在大模型上的应用潜力,为行业交出了一份满意的答卷。