活动时间、地点:1月14日(本周三)下午两点半 计算中心二楼会议室
主持人:石京燕老师
报告内容如下:
1. 基于FPGA的ParticleNet-S模型量化与端到端部署技术研究
报告人:周睿哲
本研究面向高能物理实验中ParticleNet网络模型计算复杂度高、难以在边缘端部署的难题,分析了原模型的动态图计算瓶颈,提出了ParticleNet-S(Static Graph)静态图网络模型,并在FPGA上完成了首次实现与验证。报告主要涵盖三项核心工作:① 模型优化与静态化:针对KNN动态计算消耗资源大的问题,构建ParticleNet-S模型,在训练阶段固定图结构,显著降低硬件实现的逻辑复杂度;② 多策略训练后量化(PTQ):基于PPQ量化工具链,对比了Min-max、MSE、KL散度及分位数四种校准算法,实现了高精度的INT8模型量化,并完成了从ONNX到硬件权重的自动化提取;③ 软硬协同设计与验证:构建了基于Vitis HLS的加速内核,通过ONNXRuntime与HLS C-Sim的对齐测试保证了推理正确性,并最终在PYNQ平台上完成了端到端的板级部署与性能测试。本研究打通了从算法优化、模型量化到FPGA硬件落地的全链路,为复杂图神经网络在物理实验中的实时
应用提供了可行的技术范式。
2. 异构专家模型--以BESIII Agent应用场景为例
报告人:何明峰
本研究聚焦大语言模型在垂直领域的深度赋能,针对通用大模型在专业任务中表现不足的问题,提出了一套兼顾领域专精与通用能力保持的模型策略。以BESIII Agent中的Host智能体为典型案例:一方面通过引入领域知识语料与任务导向的指令微调,显著提升模型在BESIII Agent特定任务中的理解与推理能力;另一方面设计结合通用模型设计了一个异构专家模型,使得其通用能力进行了保留。报告将系统阐述如何高效实现领域快速适配,为亟需模型兼具强大专业能力与稳健通用能力的应用场景提供一种可行且可扩展的解决方案。
附件下载:
