- 王洪江;张一夫;伦昊;
元认知能力是自主在线学习的核心要素,其有效培育是在线教育领域的重要议题。现有干预方法多侧重于学业表现诊断,缺乏针对内在素养的靶向策略,且未形成多模态数据支持的系统性框架,制约了干预的准确性与全面性。为此,该研究构建生成式人工智能驱动的在线学习元认知能力多模态评估与干预系统。该系统采用自注意力Bi-LSTM、VGG-16、Wav2vec 2.0+BERT及BP神经网络模型对文本、图像、音频及行为数据进行元认知维度评估,通过决策级多模态融合的个体化权重计算,进而由生成式人工智能输出个性化干预方案。该系统在华南师范大学多门在线课程中的应用表明,多模态模型实现了精准评估,并显著提升了学习者的元认知能力。
2026年01期 v.58 1-12页 [查看摘要][在线阅读][下载 8837K] - 陈晓峰;万贤贤;
大语言模型(LLM)在中文出版物文本校对任务中的性能受采样温度(T_s)影响。针对这一问题,本研究系统评估了采样温度对21个大语言模型校对能力的影响。实验选取低(0.3)、中(0.7)和高(1.0)三档温度,对330条包含字词、语法、逻辑、知识等8类常见出版文本错误的中文句子进行自动校对。采用AI评审标签体系(完全正确、部分正确、未发现错误、引入新错误、误报)对模型输出进行一致性评价,并通过Cochran's Q检验和McNemar检验比较不同采样温度下校对结果的差异。结果表明:不同模型在三档温度下的校对准确率存在差异,部分模型差异显著,多数模型差异不显著;采样温度影响错误检出率与误报率的权衡,低温下模型较为保守,漏检率略高但新错少,高温下错误检出率提升,部分模型完全正确率达约68%,但误报和过度修改增加;不同模型最佳温度各异,约8个模型在低温0.3表现最佳,6个在高温1.0表现最佳,其余在中温0.7表现较好,表明无统一最佳温度;分类分析显示,采样温度对不同错误类型影响存在差异,数字、符号和逻辑错误在高温下纠正率略增,敏感内容和知识性错误在低温下误判较少。最后,讨论了温度的调节对大语言模型校对性能的工程意义,指出低温有助于保持保守性减少新错,适度升温可提升召回但需权衡误报风险。建议出版自动校对默认采用中温设置,并可根据需求调整,同时探索多次采样投票等方法缓解过度校正问题。研究为大语言模型参数调优提供了实证依据。
2026年01期 v.58 13-22页 [查看摘要][在线阅读][下载 1146K] - 薛增灿;熊芳庆;郑佳佳;王均毅;林桐;穆肃;
为提升专递课堂教学质量评估的客观性与准确性,提出基于多模态特征融合网络的教师教学行为识别模型(MFFN)。针对专递课堂中教学行为隐性化、类间区分度低的问题,MFFN融合文本、语音与图像三模态信息,构建了隐性特征自适应网络(IFANet)以挖掘文本中的隐性行为线索,设计多维语音信息聚合模块(MVIA)以增强相似行为的声学区分能力,并采用改进的YOLOv11网络提取细粒度视觉特征。该研究构建了专递课堂教师教学行为数据集,并进行对比实验和消融实验。结果表明:MFFN模型的性能优越,在精确率、召回率、F1分数等关键指标上均优于现有基准模型。尤其在精确率、召回率与mAP@0.5三项指标上,MFFN相对最新基准模型分别提升4.8%、2.1%和2.5%,且较YOLOv11模型在mAP@0.5∶0.95上取得24.3%的显著性能提升。这为后续的专递课堂教师教学能力评价、教师专业素养提升等教育应用奠定了坚实基础。
2026年01期 v.58 23-34页 [查看摘要][在线阅读][下载 3182K] - 任光杰;代毅;杨博勋;汤化涛;邵文豪;王冬青;
在教育评价改革深入推进的背景下,如何借助人工智能(AI)实现在线学习过程的智能识别与精准反馈,成为推动教学质量提升的关键命题。为此,该文设计了一种融合学习行为轨迹与学习结果数据的智能评价模型,用以支持学生学习状态的识别与分层诊断。模型以动态时间规整(DTW)算法为核心,用于度量学习行为的时序相似性,结合K-Means与K-Medoids聚类结果实现双向融合建模。基于595名大学生的在线学习平台日志与成绩数据,构建学习过程与结果双维度评价体系,识别出5类典型学习者画像,并基于滞后序列分析挖掘其代表性行为路径。研究发现,学习过程深度与学习结果层次呈显著正相关关系,模型具有较强的识别能力与诊断功能,可为个性化教学干预与分层指导提供支持。研究不仅验证了人工智能方法在过程性评价中的应用价值,也为教育强国背景下的教学质量提升与评价体系创新提供了理论和方法支撑。
2026年01期 v.58 35-46页 [查看摘要][在线阅读][下载 2156K] - 周智恒;陶希远;李志豪;马碧云;
生成对抗网络(GAN)在人工智能领域持续推动着众多应用的发展。然而,在训练数据受限的情况下,现有迁移算法常难以充分学习目标域的特征,且面临生成结果多样性不足的问题。为此,提出一种混合源域与目标域的训练算法,通过隐式约束策略,在保留源域先验知识的同时,赋予模型必要的灵活性。该算法包含两项核心技术:面向判别器的双重适应性训练(SAT)与面向生成器的潜在分布扩展(ELD)。SAT通过隐式混合特征图,引导判别器的深层网络与预训练特征空间对齐,从而在保留源域判别逻辑的同时,抑制过拟合;ELD则通过潜在空间中的插值,将源域的高多样性分布与从目标域挖掘的分布相融合,以此增强模型的拟合能力并缓解模式崩溃问题。为验证所提方法的性能,在7种图像迁移任务上对比了该算法与多种现有迁移方法的生成质量与多样性。实验结果表明,ELD+SAT方法在所有任务上均取得了最优的FID分数,其性能显著优于MineGAN、FreezeD等主流迁移方法。该研究为数据受限条件下的GAN迁移训练提供了一种无需设计显式损失函数的新视角。
2026年01期 v.58 47-58页 [查看摘要][在线阅读][下载 2136K] - 王金凤;韩幽幽;王志文;谢嘉琪;王文中;
中医药智能组方推荐系统对于辅助临床决策与传承创新具有重要意义,然而,由于传统中医药领域的古籍文献与临床医案等语料数据大多以非结构化知识的形式存在,语料数据质量参差不齐,因此中医药领域下的智能组方问题长期面临着高质量数据缺失、构建的结构化知识图谱稀疏以及深度语义信息利用不足等挑战。针对上述问题,提出了一种融合生成式大语言模型与双图分层解耦传播的智能组方模型(LLM-DualKG)。该模型包含2个核心模块:基于生成式人工智能(GenAI)的语义增强模块与基于分层门控融合的双图分层解耦传播模块。在语义增强模块中,利用收集到的中医药古籍语料,通过提示工程引导GenAI生成高质量微调数据集,并采用低秩自适应技术对DeepSeek-R1 (8 B)模型进行领域适配微调。而后为知识图谱节点生成结构化文本描述,并将其编码为语义向量,随后利用门控机制实现节点语义嵌入向量与节点拓扑嵌入向量的自适应融合,以缓解图结构稀疏性问题。在双图分层解耦传播模块中构建了“症状-草药”交互图与“草药-草药”知识图,并创新性地提出双图分层解耦传播方法,通过解耦双图的信息传播过程并采用分层门控融合机制,分别建模“症状-草药”间的临床关联与“草药-草药”间的理论配伍知识。最终,将得到的节点嵌入表征输入图卷积神经网络,以TOP-K的形式生成组方。在包含自建数据集在内的两个数据集上,与一系列基线模型进行对比实验,在召回率(Recall)、精确率(Precision)以及F1值(F1-score)等指标上均取得了较好结果。此外,对LLM-DualKG模型进行了消融实验,实验结果验证了模型各模块的有效性与必要性。本研究提出的智能组方方法为中医药领域知识计算与智能辅助诊疗提供了一个可解释、可扩展的端到端解决方案。
2026年01期 v.58 59-76页 [查看摘要][在线阅读][下载 8465K] - 赵晨;马田园;李景虎;孔祥增;
针对脑电情绪识别模型在跨受试者场景中面临的泛化难题,提出一种面向领域泛化的多掩码协同学习框架M2CER。传统方法因个体间脑电信号幅值波动大、时序模式差异显著,难以直接学习稳定的跨对象特征表示。基于此,设计了一种多掩码多任务学习模型:构建以掩码重构为核心的多任务协同学习机制,将掩码重构、掩码对比学习与域对抗训练统一整合。该机制通过重构任务恢复被遮蔽的信息,利用对比学习增强特征判别性,并通过域对抗训练显式缩小不同受试者间的特征分布差异。同时,在重构任务中引入跨域聚合机制,在潜在空间中对当前受试者的多重掩码序列与其他受试者样本进行相似性加权聚合,促使模型聚焦于不同受试者间共有且不变的本质特征。在公开数据集上的实验结果表明,该方法显著提升了模型在未见受试者数据上的识别性能与鲁棒性,为跨受试者情绪识别提供了一种无需目标域数据且具备强泛化能力的新思路。
2026年01期 v.58 77-84页 [查看摘要][在线阅读][下载 3221K] - 潘家辉;陆晔;
生成式人工智能(GenAI)正重塑脑电图(EEG)视觉重建脑机接口(BCI)的研究范式。该文系统综述了该交叉领域的前沿进展,其核心贡献在于:从模型演进的视角,揭示了EEG视觉重建从判别式分类向生成式重构的范式迁移——在编码-解码架构下,任务形态已实现从静态图像到动态视频、三维模型的多维跃迁,生成模型亦历经GAN、VAE向扩散模型的迭代演进,各架构在语义一致性、结构保真度与训练稳定性上形成鲜明权衡。该文进一步梳理了公开数据集的演进脉络:从早期ImageNet-EEG的小样本验证,到THINGS-EEG、Alljoined等百万试次级大规模数据,再到SEED-DV、EEG-3D等时序化、多模态新基准,数据规模呈指数级增长,但跨被试一致性、生成式任务适配性等瓶颈仍制约领域发展。未来突破需在神经生理合理编码、视觉先验解耦与标准化评估体系构建三方面协同发力,推动EEG视觉重建从实验室原型走向真实场景,为解码大脑视觉表征机制提供可计算的建模新路径。
2026年01期 v.58 85-99页 [查看摘要][在线阅读][下载 1693K] - 李景聪;杨佳涛;高炜;
随着深度学习与大模型技术的迅猛发展,脑机接口(BCI)系统正逐步从传统的特定任务指令解码迈向通用化意图理解的关键过渡期。传统脑机接口系统长期受限于手工特征工程的局限性以及脑电信号(EEG)固有的高噪声、非平稳及个体差异大等特性,所设计与训练的脑信号解码模型通常仅适用于特定任务,难以在开放的、通用的场景下实现高效、自然的交互。随着深度学习特别是Transformer架构的兴起,基于大规模无标注神经数据预训练的通用脑信号大模型应运而生,为解决上述瓶颈提供了全新的路径。该文系统综述了脑机接口领域中大模型技术的最新研究进展,介绍自回归生成范式、掩码信号建模范式、跨模态语义对齐范式以及自动分析智能体范式等4种核心建模范式,深入剖析不同范式背后的数学假设、核心机制及其工程实现。最后,该文探讨了脑信号大模型如何将BCI从单一的“拼写器”升级为具备多模态交互、代理化执行与神经自适应能力的“第二大脑”,构建人机共生的新生态。
2026年01期 v.58 100-112页 [查看摘要][在线阅读][下载 2993K] 下载本期数据