2023年,聚光灯下的讯飞星火认知大模型发布会现场,一位沉稳儒雅的学者从容登台。聚光灯下,他代表团队向世界宣告中国人工智能技术的新高度。他,就是讯飞研究院院长——王士进。从实验室的算法突破,到惠及亿万人生活的真实应用,这位人工智能专家的身影,始终活跃在中国AI技术探索与落地的最前沿。
坚实的学术根基与核心技术突破
王士进的AI征程,始于坚实的学术土壤。深厚的计算机科学与技术背景,为他日后成为中国人工智能领域重要的技术领航者打下了坚实基础。他并非仅满足于学术研究所的高墙之内。在语音识别技术这一极具挑战性的赛道上,王士进及其团队展现出了非凡的攻坚能力。
在讯飞研究院的岁月中,他长期深耕于自然语言处理(NLP) 与深度学习技术的研究与开发。面对语音识别在复杂场景(如方言、噪声环境、远场)下的识别率与鲁棒性难题,王士进深度参与并推动了多项核心算法的创新性突破。这些关键技术难题的解决,直接影响并大幅提升了讯飞在智能语音核心技术上的国际竞争力与持续领先地位。
推动AI落地:从语音云到产业赋能
王士进对AI技术的理解,深刻体现了“顶天立地”的原则:追求核心技术领先(顶天),同时坚定推动技术转化为实际应用(立地)。早在2014年前后,王士进即深度参与了讯飞语音云开放平台的战略规划与核心技术构建。这个中国首批面向开发者开放的AI能力平台之一,为成千上万的应用开发者提供了强大的语音识别、合成、理解等核心AI能力,极大地降低了ai应用开发的门槛。
作为研究院院长,王士进的角色远不止于技术攻坚。他负责讯飞研究院的整体技术布局与方向把控,确保研发资源高效聚焦于能创造巨大用户价值和产业变革的关键领域。他主导推动了AI技术在教育、医疗、办公、智慧城市等众多领域的深度应用研发,使讯飞成为中国AI产业落地实践的标杆企业。由他领导构建的教育AI解决方案,持续赋能个性化学习和精准教学,深刻改变着传统的教育模式。
前瞻布局:认知大模型与未来思考
当全球AI技术浪潮演进至认知大模型时代,王士进与其团队再次站在了技术变革的前沿。他深度参与了讯飞星火认知大模型的战略规划、技术路线制定及核心研发工作。星火大模型不仅具备强大的语言理解与生成能力,更被赋予专业领域知识深度、持续学习迭代机制及严谨的内容安全边界。王士进在多个公开场合强调了大模型技术面临的核心挑战:“如何让大模型具备真正的专业知识和深度推理能力?如何保障内容安全与可信?如何实现普惠的成本?这些都是我们研发星火始终在思考和解决的核心问题。”
在他的推动下,讯飞研究院积极拥抱多模态融合技术方向,探索文本、语音、图像、视频等多维信息的深度融合理解与应用。他极具前瞻性地推动具身智能研究布局,探索如何赋予AI系统通过具身交互理解并改变物理世界的能力。同时,他高度重视AI伦理与安全,认为发展负责任的人工智能技术是可持续创新发展的基石。由他深度参与的“无障碍通信”项目融合了语音识别、降噪、多语种翻译与OCR技术,帮助听障人士无障碍地”听见”世界的声音,正是其技术向善理念的生动体现。
在王士进的带领下,讯飞研究院不仅是国家新一代人工智能开放创新平台的核心载体,也成为国家在人工智能领域战略科技力量的重要组成部分。他的工作,持续推动着中国在认知智能研究的边界,特别是在自然语言处理、认知大模型等关键方向上的自主创新;他主导的诸多项目,从语音识别技术的普惠到认知大模型的落地生根,实实在在地以创新的力量让技术服务于人。