栏目文章

Select

1. 基于多维特征融合的GitHub开发者地理位置预测

赵思嘉, 韩凡宇, 王伟

华东师范大学学报（自然科学版） 2025, 2025 (5): 1-13. DOI: 10.3969/j.issn.1000-5641.2025.05.001

摘要（887）

HTML （19）

PDF（pc）（1118KB）（78）

开发者地理位置信息对理解全球开源活动分布和制定区域政策具有重要意义. 然而, GitHub平台上存在大量开发者账户缺失地理位置信息, 因而限制了对全球开源生态系统地理分布的全面分析. 提出了一种基于多维特征融合的层次化地理位置预测框架, 通过整合时间行为、语言文化、网络特征这3大类多维特征, 构建了规则驱动快速定位、姓名文化推断、时区交叉验证、深度学习集成的4层递进预测机制. 基于50000名全球活跃开发者构建的大规模数据集的实验表明, 该方法成功预测了82.52%开发者的地理位置信息. 其中, 姓名文化推断层覆盖用户最多, 准确率达到了0.7629; 深度学习集成层处理最复杂案例, 准确率为0.7557. 通过对比Moonshot大语言模型的预测结果, 验证了该方法在复杂地理推断任务中的优势.

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

2. 大语言模型在开源项目主题标注中的应用与评估研究

何德鑫, 韩凡宇, 王伟

华东师范大学学报（自然科学版） 2025, 2025 (5): 14-24. DOI: 10.3969/j.issn.1000-5641.2025.05.002

摘要（434）

HTML （10）

PDF（pc）（795KB）（45）

随着开源社区的快速发展, GitHub项目的数量持续激增; 然而一部分项目未提供明确的主题标签, 给开发者在技术选型和项目检索的过程中带来了挑战. 现有的主题生成方法主要依赖于监督学习范式, 存在对高质量标注数据有较强依赖性等问题. 针对开源项目主题标注的准确性及效率问题, 首次研究了大语言模型在GitHub项目主题预测任务中的应用效果; 构建了包含3000个GitHub热门项目的数据集, 涵盖项目仓库名、README文档和描述信息等多维度特征; 选择Claude 3.7 Sonnet、DeepSeek-V3、Gemini 2.0 Flash、GPT-4o和Qwen-Plus等数个国内外主流大语言模型进行了对比实验. 实验结果表明, Claude 3.7 Sonnet在多数评估指标上表现最优, 且随着数据集规模扩大, 各模型的性能表现趋于稳定. 实验证明, 大语言模型在项目主题标注任务中展现出了良好的适用性, 但不同模型间存在显著性能差异, 这为开源项目管理和智能化标注系统设计提供了重要参考依据.

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

3. 大语言模型时代生态产业的流动性设计——以开源社区为代表的流动性要素分析

任旭东, 黄之鹏, 彭佳恒, 王伟

华东师范大学学报（自然科学版） 2025, 2025 (5): 25-31. DOI: 10.3969/j.issn.1000-5641.2025.05.003

摘要（255）

HTML （6）

PDF（pc）（660KB）（290）

随着数字经济发展、移动互联网的爆发和云商业模式的兴起, 生态型产业在资本市场上展现出显著的活力. 通过探讨生态产业的“流动性”要素, 分析了其在打造生态产业中的价值与作用, 并提出了以开源社区和开源人才为核心构建生态产业集群的建议. 此外, 结合国内主流开源生态建设的生态产业发展案例, 提出了具体策略和改进建议.

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

4. 基于智能体的可交互数据结构和算法可视化实现

庞瑞洋, 陆雪松

华东师范大学学报（自然科学版） 2025, 2025 (5): 32-42. DOI: 10.3969/j.issn.1000-5641.2025.05.004

摘要（531）

HTML （10）

PDF（pc）（1065KB）（248）

数据结构与算法 (Data Structure and Algorithm, DSA) 作为计算机教育的核心课程, 在培养学生的编程能力与算法思维方面起着关键作用. 可视化在DSA教学中可以起到提高教学效率和加深学生理解的重要作用. 然而, 现有的DSA可视化工具大多依赖人工编写可视化代码, 存在覆盖范围有限、更新成本高和缺乏交互性等局限性, 难以满足动态演示与个性化教学的需求. 随着大型语言模型 (Large Language Model, LLM) 在代码生成方面的出色表现, 基于LLM实现自动化的DSA可视化成为可能. 为此, 提出了一种基于ReAct (Reasoning and Acting)智能体的交互式可视化代码生成方法, 旨在解决传统可视化工具自动化程度低、交互性不足的问题. 该方法结合LLM的代码生成能力和DSV (Data Structure Visualization)平台的接口, 能够将基于Python编写的DSA代码转换为可交互、可执行的动态可视化的代码, 从而提升教学直观性和学习体验. 为系统评估该方法的有效性, 构建了包含150对DSA代码及其对应的DSV可视化代码的数据集, 并对比了3种方法 (直接提示、思维链提示、ReAct智能体) 在多种主流LLM上的表现. 实验结果显示, 所提出的基于ReAct智能体的方法在编译通过率 (Compilation Rate, CR)、执行通过率 (Execution Rate, ER)和可用率 (Usability Rate, UR) 这3项指标上均显著优于其他方法, 尤其在DeepSeek-R1模型下表现最优, 显著提升了生成可视化代码的准确性与可交互性, 验证了结合LLM与智能体框架在DSA可视化教学中的可行性与优势, 为构建高效、个性化、自动化的计算机编程教学工具提供了新路径.

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

5. ATBench: 面向端到端数据分析任务的分析轨迹评估基准

王旭飞, 许华容, 陈攀峰, 陈梅, 马丹, 陈正曦, 田旭, 李晖

华东师范大学学报（自然科学版） 2025, 2025 (5): 43-52. DOI: 10.3969/j.issn.1000-5641.2025.05.005

摘要（361）

HTML （6）

PDF（pc）（809KB）（70）

提出了一个用于端到端数据分析任务中分析轨迹的评估基准ATBench, 以弥补现有评估基准在粒度细节和领域覆盖方面的不足. 分析轨迹是智能体围绕分析目标, 在多轮交互中持续提出问题、生成洞察, 最终形成总结的分析链. 通过结合已有评估基准和Kaggle平台的真实任务数据, 采取目标驱动与探索驱动相结合的标注策略, 构建了151个评估数据集, 涵盖8个领域. 此外, 提出了一个细粒度的评估指标: 分析轨迹得分$ T_{{\mathrm{score}}} $, 用于量化智能体在执行端到端数据分析任务过程中的连贯分析能力. 实验结果显示, ATBench具备较高的稳定性与判别效能, 能够可靠区分不同模型在端到端数据分析任务中的性能差异. 同时, 该基准揭示了智能体在连贯分析和洞察发现方面的不足, 可为后续智能体优化提供数据支持.

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

6. 树木倒伏场景中多模态大模型的应用挑战与优化研究

冯雷, 李超楠, 盛春杰, 施宇星, 黄奕铖, 金剑虹, 许韵, 杜聿洲, 周妮娜, 缪思好

华东师范大学学报（自然科学版） 2025, 2025 (5): 53-65. DOI: 10.3969/j.issn.1000-5641.2025.05.006

摘要（521）

HTML （11）

PDF（pc）（1399KB）（412）

针对多模态大模型在处理如树木倒伏等复杂视觉场景时, 因依赖单路径推理而导致的决策鲁棒性不足问题, 提出了一种基于束搜索思维链 (Beam Search Chain-of-Thought, BS-CoT) 的推理优化方法. 该方法通过并行探索和评估多条潜在的推理路径, 有效克服了传统模型易陷入单一错误逻辑的缺陷, 显著增强了模型在复杂场景下的视觉决策能力. 为验证该方法的有效性, 构建了一个面向城市治理中树木倒伏场景的专用数据集. 实验结果表明, 与基线模型相比, 本方法在事件召回率和关键信息捕获率上均有显著提升. 本研究不仅为解决城市公共安全领域的视觉决策难题提供了可靠的技术方案, 也为提升大模型在关键任务中的推理可靠性提供了新的范式.

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论（0）

AI赋能的开源技术与应用 栏目所有文章列表

AI赋能的开源技术与应用栏目所有文章列表