5月26日至27日,嘉定二中一年一度的社团文化节盛大开启。在这两天里,校园里热闹非凡,近40个学生社团使出浑身解数展示自身的成果,引得师生们驻足欣赏。在此期间,编程社“搞了个大动作”,他们在报告厅举行AI大模型应用产品发布会,“重磅”发布了属于嘉定二中学生自己的AI助手——DeepMoe(深萌引擎)。
发布会结束后,嘉二记者团采访了编程社社长,来自高一2班的杨义明同学。以下是采访实录:
Q:为什么会想到要做这件事情?
A:年初DeepSeek的发布吸引了我,出于好奇便尝试使用,问一些不同方面的问题,发现大模型在推理过程中似乎具备思维能力,进而勾起了我想要进一步了解相关技术的欲望。从网上搜索有关AI应用相关的技术文章,也利用DeepSeek大模型进行技术方面的咨询请教,再看一些技术问题的帖子和技术大咖的解答等等,渐渐地我发现AI应用的实现并非是遥不可及的,我们为何不把它当成我们社团的学习项目来试一下呢?如果实现了将来可以作为校园AI助手供大家使用,如果不成功权当是自学一门开发技术了。于是就有了做这件事情的念头。
Q:介绍一下你的团队及分工情况吧。
A:我们开发核心团队有5个人:邢梦茹、许杰、朱文韬、黄子骞和我。我主要负责应用服务开发,许杰同学负责服务器搭建和应用环境安装调试,朱文韬同学负责大模型运行工具的调试和安装,黄子骞同学负责网络服务代理的申请、调试以及集成测试等,邢梦茹同学负责AI大模型训练和测试等。当然我们编程社其他成员也都有参与到整个项目中来协助调试、分析问题或寻找资源等等。我还要特别感谢学校的二次元社团为我们设计了DeepMoe的形象,一个超萌的猫娘。她有着俏皮的绿色眼睛,可爱的粉色猫耳和毛茸茸的尾巴。她穿着可爱的校服,上面印有Hello world编程社的标志。她总是带着一抹温柔的微笑,仿佛随时准备提供帮助和陪伴。这样的形象不仅充满活力和趣味,还具有亲和力,能够拉近与用户的距离。
Q:在开发过程中,你们遇到过什么困难和挑战?是如何克服的?
A:可以说在整个项目的开发过程中,我们一起踩过大大小小很多的坑,我们整个团队也成长很多。一是应用服务不支持并发访问的问题。可以说这个问题困扰我们最久,我们尝试过环境参数的调整,应用程序的优化,一直无法解决问题。进行了多轮调试,甚至推倒重建,新的大模型服务终于支持并发访问了。二是在服务器试运行期间,我们遭遇到真实的网络攻击,导致应用服务无法正常访问,在指导老师姚老师的指导下,经过一系列的应急处理,大约6小时后我们的应用服务恢复正常。三是服务响应性能的瓶颈。起初我们的服务器算力调配GPU占比始终在10%以下的低位徘徊,通过一系列的环境参数改变或者大模型运行参数的调整也很难突破这个瓶颈。我们从网上查阅相关文档,也从硬件厂商的官网上查阅硬件参数信息,结合一些热心网友的分享,最终寻找到匹配我们应用环境的参数信息,再经过硬件的更新适配,算力GPU占比一举达到100%,应用前端响应速度提升非常明显。
Q:DeepMoe与其他的大模型应用相比,有什么独到之处?
A:首先,DeepMoe的定位是高中生的好朋友,那么沟通的话语需要具有鲜明的花季少男少女风,我们给她的训练也是基于青春、阳光、活泼开朗的人设。这就使得我们这一款大模型应用对话沟通起来更具亲和力,加上丰富的颜文字元素和二次元风格更易于被高中生朋友接纳。其次,我们这款大模型应用融合了qwen2.5和deepseek-r1大模型,qwen2.5大模型对话聊天体验非常好,deepseek-r1大模型是推理大模型可以用来解决一些复杂问题,我们把这两者融合在一款应用当中,用户可以按需自由切换,省去了在不同应用APP之间切换的烦恼。再次,我们的应用植根于二中校园,内嵌二中官网访问入口只算是标配,我们还可以对学校的其他第三方应用完全开放API接口。
Q:回顾整个开发过程,你最大的收获是什么?
A:项目开发到今天,我感受最大的就是坚持做下去比什么都强。比如我们在解决应用不支持并发访问的问题过程中,曾有诸多的吐槽和抱怨,总觉得网上很多技术文章写得不清不楚,官方文档也没有详细案例可以引用,就是哪哪都不好。我们知道网上也有商家售卖现成的大模型服务接口,如果我们购买接口服务就会非常省心。但是值得骄傲的是我们最终选择了更困难的路而且也一直坚持了下来并战胜了困难。在解决困难的过程中我们每一个人都得到了锻炼,这算是对我们最好的褒奖。
随后,记者们也采访了编程社的指导老师姚静珠,以下是她对社团同学们的评价:
看到社团的学生能开发AI大模型,我感到非常欣慰,也充分感受到他们身上洋溢的自豪感和成就感。他们能够凭借自身能力,通过文献查阅和实验完成了模型架构设计,这种主动学习的态度正是从事科学研究必备的素养。半年前,他们还在学习Python基础知识,今天便给我们呈现了一场非常精彩令人振奋的产品发布会。他们能运用所学的Python知识、Flask框架、数据处理、模型训练等,说明他们已超越基础编程,掌握了前沿技术。他们将课本上的Python知识延伸到AI大模型开发,实现了从“写代码”到“解决复杂问题”的跨越,这种技术迁移能力令人惊喜。大模型开发需要数据组、算法组、工程组协同,这也考验了学生们的分工效率和沟通能力。在用户界面的开发上,他们能跟学校的二次元社团合作,一改沉闷的用户界面,引入二次元元素,给年轻用户带来很好的体验感,这种创新精神和合作能力,值得敬佩。
虽然基于合规性、安全性和稳定性等因素的考虑,该模型还处于内部体验阶段,同时受限于硬件设备的性能,该大模型目前没有部署在性能更好的服务器上,进而导致访问量过多会造成体验感的下降,所以这个模型性能不算完美。但正如发布会现场一位同学所说:“这是中国AI大模型发展的一小步,却是编程社同学们的一大步。”比产品发布更加可贵的是他们在开发过程中体验到的迎难而上、团结协作所带来的力量。希望在今后的成长道路上,他们能继续为了自己的爱好和理想而全力以赴!