于2020年和2021年的4—12月, 每两周对上海市闵行区浦江郊野公园内的螽斯与蟋蟀种类进行连续调查. 研究结果显示, 该地区分布有螽斯8种、蟋蟀16种、蝼蛄1种. 通过对它们生活史进行研究发现, 其成虫时间十分规律, 化性稳定, 主要通过卵滞育的方式越冬, 其次为若虫越冬. 此外, 还发现通过鸣声对物种进行鉴定, 是一种进行鸣虫物候学研究与生态学研究的简便易行的方法.
用户界面 (user interface, UI) 在应用程序与用户的交互中扮演了至关重要的角色. 当前移动互联网的普及, 已经使得基于Web (world wide web)的应用大规模从桌面端迁移到移动端, Web前端开发在应用程序的开发中愈加广泛和深入. 传统Web前端开发首先依赖设计人员给出设计稿, 然后由程序员编写相应的UI代码. 这种方式行业壁垒高、开发速度慢, 不利于产品的快速迭代. 深度学习的发展使得基于UI图像自动生成Web前端代码成为可能. 现有方法对于UI图像特征的捕捉能力较弱, 生成代码的准确性较低. 为了改善这些问题, 提出了基于Swin Transformer的Encoder-Decoder模型image2code, 用于从UI图像生成Web前端代码. image2code将从UI图像生成Web前端代码的过程视为图像描述任务的一种形式, 将包含滑动窗口设计的Swin Transformer作为模型编码器和解码器的骨干网络. 其中滑窗操作将注意力计算限制在一个窗口内, 减少了注意力机制的计算量, 同时保证了不同窗口间仍然有特征关联. 另外, image2code生成可以直接转换为HTML (hyper text markup language)代码的Emmet代码, 利用Emmet代码的简洁性提高模型训练的效率. 实验结果表明, 在已有公开数据集和新构建的数据集上, image2code在Web前端代码生成任务上的表现要优于pix2code和image2emmet等代表性模型.
随着人工智能技术的迅猛发展, 大语言模型 (large language models, LLMs) 在自然语言处理和各种知识应用中展现了强大的能力. 研究了国内大语言模型在中小学学科知识图谱自动标注中的应用, 重点以义务教育阶段道德与法治学科和高中数学学科为例进行分析和探讨. 在教育领域, 知识图谱的构建对于整理和系统化学科知识具有重要意义, 然而传统的知识图谱构建方法在数据标注方面存在效率低、耗费大量人工成本等问题. 研究旨在通过大语言模型来解决这些问题, 从而提升知识图谱构建的自动化和智能化水平. 基于国内大语言模型的现状, 探讨了其在学科知识图谱自动标注中的应用, 以道德与法治和数学学科为例, 阐述了相关方法和实验结果. 首先, 探讨了研究背景和意义. 接着, 综述了国内大语言模型的发展现状和学科知识图谱的自动标注技术. 在方法与模型部分, 尝试探索一种基于国内大语言模型的自动标注方法, 力图完善其在学科知识图谱上的应用. 还探讨了学科知识图谱人工标注方法模型, 以此作为对比, 评估自动标注方法的实际效果. 在实验与分析部分, 通过在道德与法治和数学学科的自动标注实验和对其结果的分析, 发现两个学科的知识图谱自动标注均取得了较高的准确率和效率, 与人工标注结果进行了深入比较分析, 得出了一系列有价值的结论, 验证了所提出方法的有效性和准确性. 最后, 对未来的研究方向进行了展望. 总体而言, 研究为学科知识图谱的自动标注提供了一种新的思路和方法, 有望推动相关领域的进一步发展.
传统教育大数据管理面临隐私数据泄露、数据可信度存疑和越权访问等安全风险, 为了避免上述风险, 提出了一种新型基于智能合约的教育大数据安全管理与隐私保护算法: ASPES (algorithm for security management and privacy protection of education big data based on smart contracts), 算法融合了基于Shamir秘密共享的密钥切割改进分享算法、基于SM2-SHA256-AES算法的混合加密算法和基于分层数据访问控制的智能合约管理算法. 在真实数据集MOOCCube上的实验结果表明, 相较于较先进的方法, ASPES的执行效率和安全性有显著提高, 可以有效存储和管理教育大数据, 实现教育资源的合理分配. ASPES通过向区块链中嵌入智能合约, 将数据读写等操作上链, 能够优化管理路径、提高管理效率, 保证教育公平, 极大地提升教育质量.
基于现行的材料降解率测定标准及特定微生物的降解性能, 设计了4种材料降解率的检测方法, 即两种标准方法 (接种物: 腐熟堆肥、蛭石 $+ $ 腐熟堆肥浸提液) 和两种实验方法 (接种物: 蛭石 $+ $ 芽孢杆菌、蛭石 $+ $ 嗜热菌). 采用生产环保胶带所用的原纸、塑料薄膜 (主要成分为polylactic acid, PLA) 和胶带成品作为受测材料, 对比不同处理方法下材料降解性能的效率. 结果表明, 在60 d的实验周期中, 原纸和PLA薄膜在4种方法处理下均呈现快速降解. 然而, 胶带成品降解率在腐熟堆肥、蛭石 $+ $ 腐熟堆肥浸提液处理下上升缓慢; 在蛭石 $+ $ 芽孢杆菌处理下略高; 在蛭石 $+ $ 嗜热菌处理下上升速率显著高于其他处理方法 (约1.7 ~ 7.5倍). 添加微生物菌剂尤其是嗜热菌, 能有效提升产品降解率的测定效率. 因此, 优化降解接种物的方法可提高材料降解率的测试效率, 有利于企业缩短可降解材料的研发及生产周期.
从建构主义和能力本位理论出发, 提出了一种基于知识图谱的在线学习系统设计方法, 即打破传统的知识结构, 以提升能力为目标, 构建知识、技能等多维度的能力框架; 搭建了以知识图谱为底层逻辑, 链接数字学习资源的学习系统; 开展了教学实践和实证研究. 首先, 使用调查问卷对学习系统进行了验证; 其次, 以“阅读英文学术论文”能力为学习任务, 随机分配实验组和对照组; 最后, 评估两组对于知识、技能的理解、记忆水平以及综合运用能力. 研究结果显示, 学习系统的有效性和易用性实验组总成绩、知识得分、技能得分和能力得分均高于对照组成绩, 其中总成绩和能力得分具有显著性差异, 表明该系统对于在线学习效果有一定的促进作用.
抑制遥感影像水面耀光污染并重构影像信息, 是改善无人机遥感信息质量、扩大水环境监测区域的有效途径. 针对传统经典的耀光信息重构算法难以适用于无人机高光谱影像这一问题, 提出了一种耀光自动检测去除与信息重构算法, 即采用归一化水体指数提取水体, 以全波段总和灰度图像的最低值为阈值对耀光进行分割, 利用拉普拉斯算子提取水面耀光纹理, 通过多轮形态学膨胀与阈值更新迭代计算出两者面积差值, 以投票机制获得最小差值的出现频率, 并逆向获取最佳阈值自动去除耀光. 而后, 基于主成分分析确定匹配波段, 通过改进Criminisi算法对去除区域进行重构. 去除算法应用于四个真实耀光场景, 去除率均在99%以上. 重构算法结果在主观和客观上均优于其他算法, 耀光重构水体与正常水体各波段变异系数差值在1%以内, 具有良好的光谱应用能力.
新一代电网是未来智能电网发展的主要方向, 而电力负荷精准预测是智能电网的一项重要基础工作. 为了提高智能电力系统负荷预测的精确度, 本文基于自相关机制的预测模型Autoformer, 对负荷数据集进行了特性分析, 在原模型中加入特征提取层, 从编码层数、解码层数、学习率和批量大小等方面优化了模型参数, 实现了周期灵活的负荷预测. 在真实数据集上进行了实验和分析, 实验结果表明, 本文模型在预测效果上表现更好, MAE (mean absolute error)和MSE (mean squared error)分别为0.2512和0.1915, 决定系数为0.9832. 与其他方法相比, 本文方法负荷预测效果更好.
台风等极端天气会使淤泥质潮滩发生数十厘米的冲淤变化. 在全球变暖导致台风强度及频率增大的背景下, 厘清台风影响下潮滩冲淤变化及其机制, 对潮滩保护与生态系统完整性维持具有重要意义. 本文借助基于运动恢复结构算法的无人机(unmanned aerial vehicle, UAV)摄影测量方法, 于2021年7月“烟花”台风前后对崇明东滩典型样地进行滩面高程测量, 并在盐沼-光滩过渡带现场采集水动力泥沙数据. 结果表明: 无人机摄影测量精度为4.1 cm; 台风影响下光滩区域侵蚀、盐沼区域淤积, 变幅达 ±32 cm. 其原因是: 台风影响下, 光滩区域在天文大潮时波高及水深增大, 达到波浪破碎条件后表层沉积物被侵蚀并被强潮流搬运; 涨潮流携带悬浮泥沙进入盐沼后, 因盐沼缓流消浪作用导致水体挟沙能力下降, 泥沙在盐沼区域沉积. 因此, 盐沼-光滩过渡带呈现光滩区域侵蚀、盐沼区域沉积的冲淤分带性. 本文将无人机摄影测量与同步水动力泥沙现场观测结合, 为深刻认识台风事件对潮滩冲淤的影响提供了新视角.
由于受到潮汐过程的影响, 河口区微塑料的调查和研究存在着方法不统一、数据误差较大的问题. 2019年夏季使用泵采法在九龙江河口开展原位全水层微塑料采样, 对不同水层、不同站位间的微塑料丰度及其赋存特征进行分析, 并与其他在该河口的相关调查研究结果进行对比. 结果表明: 九龙江河口表、中、底层水体中的微塑料赋存量存在明显差异, 河流入海口及靠近污染源处表层水中微塑料丰度明显高于中、底层中, 在潮汐作用剧烈的河口区, 中、底层中微塑料丰度高于表层水中, 存在明显分层现象; 使用不同采样方法获取的微塑料数量浓度值存在较大差异, 泵采法相比拖网法能更有效地截留塑料纤维; 使用泵采法过滤水样体积、滤经筛网孔径大小都对收集到的微塑料丰度、尺寸有显著影响. 采样方法的不同将导致微塑料丰度结果的显著差异, 在潮汐河口进行微塑料监测有必要将潮汐作用考虑在内. 因此, 建议建立潮汐河口的微塑料业务化监测和通量观测, 并采用洪、枯季, 大、小潮的全潮时段的观测采样方法.
投加增氧剂作为一种提升水体溶解氧的重要手段常用于城市水环境的治理与修复, 研发具有缓释效果的增氧材料可使增氧剂在实际工程中更持久、更稳定地发挥作用. 本文梳理了近年来缓释氧材料的制备方法和释氧性能, 综述了投加缓释氧材料对河湖沉积物和上覆水中营养盐等污染物赋存形态与迁移转化的影响及作用机制, 最后对缓释氧材料在河湖水体污染修复中的应用研究提出了展望和建议.
提出了一种基于自注意力融合的多图知识追踪方法(multi-graph knowledge tracing method based on self-attention, SA-MGKT), 旨在通过学生的历史答题数据, 对其知识的掌握程度进行模型化, 并评估其未来学习的表现. 首先, 该方法构建了学生–习题异质图来表示学生–习题的高阶关系, 通过图对比学习技术捕获学生的答题偏好, 并采用3层LightGCN进行图表征学习. 然后, 引入概念关联超图和有向转换图的信息, 通过超图卷积网络和有向图卷积网络进行节点嵌入. 最后, 通过引入自注意力机制, 成功融合了习题序列的内部信息以及多图表征学习所蕴含的潜在信息, 从而显著提升了知识追踪模型的准确性. 实验数据在3个标准数据集上均展现出令人鼓舞的结果, 模型的分类性能得到了大幅提升, 具体表现为相对于基线模型, 在评估指标上分别提高了3.51%、17.91%和1.47%. 这些结果充分验证了融合多图信息和自注意力机制对于增强知识追踪模型性能的有效性.
为进一步厘清上海自然博物馆植物标本室模式标本的基本情况, 促进标本的利用和共享, 通过比对馆藏标本与植物标本资源共享平台和植物分类学期刊中模式标本的采集信息, 整理出模式标本418份, 隶属69科147属239种, 其中新发现模式标本390份. 本文还对馆藏模式标本的数量、类型、种类组成、优势类群、采集地、采集时间及采集人等进行了统计和分析.
LaSalle 不变原理是研究随机系统稳定性的重要工具. 考虑到时滞与样本轨道跳跃对系统稳定性的影响, 本文通过特殊半鞅的收敛性, 建立了一类由 $\alpha$ -稳定过程驱动的随机时滞微分方程的 LaSalle 不变原理. 利用 LaSalle 不变原理给出了一类延迟方程解渐进稳定的充分条件.
在国家新工科建设背景下, 早期的C++教学已不能满足“两性一度” (高阶性、创新性和挑战度) 的要求, 另外存在知识点碎片化、理论与实践难以结合、单视角偏差等问题, 针对以上问题, 通过将QT (Qt Toolkit)和C++这两门课程合二为一, 提出了有效融合QT和C++的创新教学模式, 并在智慧树平台部署了相应的课程知识图谱辅助教学. 一方面, 扩展了教学的广度, 有效关联课程知识点, 实现多模态教学资源的整合和共享, 促进学生多视角学习知识, 体现课程的创新性和避免单视角偏差; 另一方面, 提高了教学的深度, 构造融合QT和面向对象程序设计C++的知识图谱, 通过这两门课程知识点的有机融合, 搭建从理论到实践的桥梁, 提高课程高阶性和挑战度. 本研究另辟蹊径, 为C++的教学改革开辟了新途径, 也为其他高校的编程课程教学改革提供了有价值的参考和借鉴.
数字教育资源自动化内容审查是教育信息化时代的迫切需求, 特别是对教育资源是否超标的适用性审查, 存在知识点难定位和难理解的问题. 针对这一需求, 提出了一种基于教育知识图谱和大语言模型(简称“大模型”)协同的教育资源内容审查方法. 具体地, 首先利用“本体”思想, 设计并构建一个面向中小学教育的知识图谱; 之后, 利用大模型在文本生成和排序任务上的优势, 设计基于教学内容生成和排序剪枝的知识定位方法; 最后, 通过教学内容核心知识子图与知识图谱教学路径的冲突检测, 实现超标教学内容识别. 实验结果表明, 所提出的方法可有效应对教育资源内容的超标知识审查任务, 为基于知识图谱及大语言模型协同的教育应用开辟新的技术路径.
急性肾衰竭是一种发病率较高的临床疾病, 尽早识别潜在患者有助于医生对其进行医疗干预, 降低发病率和死亡率. 近年来, 依靠电子健康病历去预测患者潜在的健康风险逐渐受到关注. 大多数模型通过聚合数据或者填充缺失值的方式处理人体生理指标数据中存在的稀疏性和不规则性问题, 忽视了缺失信息隐含的患者健康状态. 此外, 现有的急性肾衰竭预测模型并没有考虑各种模态的数据特点和模态之间的相关性. 为了解决以上问题, 提出了基于多模态的急性肾衰竭预测模型. 该模型考虑了人体生理指标数据、疾病数据和人口统计学数据. 设计了新的基于掩码和时间差的LSTM (long short term memory)网络去学习各个生理指标的时间间隔和缺失信息, 捕获指标的数值变化和检测频率变化, 引入了多头自注意力机制促进各模态表征的相互学习. 在真实的数据集上进行了急性肾衰竭预测问题和死亡风险预测问题的实验, 证明了所提出模型的有效性和合理性.
针对工业园区的污水排放企业种类较多、进水水量水质波动较大、污染物复杂且可生化性差、排放标准高的特征, 以浙江省德清县某工业园区实际污水处理工程为对象, 分析了水解酸化+A2/O+AO+芬顿氧化工艺处理以印染、食品制造、金属加工企业为主的废水排放的技术经济可行性. 实践结果显示, 出水水质的COD、NH3-N、TN及TP能稳定达到《城镇污水处理厂主要染物排放标准》 (DB33/2169—2018) 中的限值, 其余指标达到《城镇污水处理厂染物排放标准》 (GB18918—2002) 的一级A标准; 工程投资金额为8200元/m3, 实际直接运行成本为2.39元/m3.
随着政府和企业在信息化向数字化演进历程中信息化程度的加深, 各类应用系统生成的数据日益多模化、多源化、海量化, 这对数据管理造成了新的挑战. 为了解决这些挑战, 数据管理领域涌现出了许多新的技术和理念, 其中Data Fabric (数据编织) 便是一种新兴的数据管理技术和方法, 它将分布式数据存储、处理和应用整合为一个整体, 并提供了一套可视化的接口进行管理. 本文首先分析了Data Fabric的技术架构、技术特点、技术价值和对多模数据进行管理与应用的完整流程. 其次, 提出了基于时序指标的多模多源数据的异常监测方法、基于日志数据的多模多源数据的异常监测方法, 它们通过Data Fabric技术的使用, 处理速度分别提高了33.3%和42.2%, F1-score分别提高12.2个和14.8个百分点, 进一步说明了Data Fabric技术和本文新提出方法的高效性和应用价值.
提出并实现了一个本地轻量化课程教学智能辅助系统. 该系统利用IPEX-LLM (Intel PyTorch extention for large language model)加速库, 在计算资源受限的设备上高效部署并运行经过QLoRA(quantum-logic optimized resource allocation)框架微调的大语言模型, 并结合增强检索技术, 实现了智能问答、智能出题、教学大纲生成、教学演示文档生成等4个主要功能模块的课程灵活定制, 在帮助教师提高教学备课和授课的质量与效率、保护数据隐私的同时, 支撑学生个性化学习并提供实时反馈. 在性能实验中, 以集成优化后的Chatglm3-6B模型为例, 该系统处理64-token输出任务时仅需4.08 s, 验证了其在资源受限环境下快速推理的能力. 在实践案例分析中, 通过与原生Chatgml-6B和ChatGPT4.0在功能实现上的对比, 进一步表明了该系统具备优越的准确性和实用性.