随着信息技术飞速进步, 开源理念在各领域蓬勃兴起, 地理信息系统(Geographic Information System, GIS)也迎来开源浪潮. 构建开放协同、可持续繁荣的开源GIS生态, 有助于推动GIS技术创新、降低应用成本并促进领域发展. 旨在系统研究开源GIS生态建设方法与发展趋势, 工作内容分为4个方面: 梳理开源GIS的发展历程与当前技术的发展态势, 凝练出4个阶段的演进脉络; 基于GIS视角依托当前开源生态基础提出适用于GIS领域的多层次开源生态建设模式; 引入Hypercrx对8个代表性开源GIS项目的OpenRank、Activity、Contributors和Participants 4个指标进行量化分析与可视化, 揭示其影响力、活跃度和社区参与度的差异, 进而体现当前开源GIS生态发展态势; 总结开源GIS生态在社会认知、人才培养、治理机制、数据与软件协同及可持续商业模式等多方面的挑战, 展望大模型时代下的未来发展方向与领域研究热点.
开源生态中项目间协同关系日益复杂, 涵盖依赖共现、语言一致与开发者共享等多维复用机制. 传统图模型难以统一表达此类异构结构, 限制了对潜在协作关系的识别能力. 面向开源场景, 提出了一种基于多层图结构建模与结构融合链路预测方法相结合的分析框架. 通过构建包含3类协同层的无权多层网络, 并设计结构重合度调节与社群差异性评分机制, 来增强模型的结构感知与语义解释能力. 实验结果表明, 该方法在多个真实数据集上均优于现有主流链路预测算法, 尤其在结构异质性强的开源网络中表现显著. 进一步分析显示, 模型预测结果具备良好的社群一致性与语义可还原性. 研究表明, 该方法能够有效识别开源项目间潜在协同路径, 并为复用结构建模与社群分析提供结构性支撑.
基于中国知网 (CNKI) 2005—2024年篇名包含“开源”的期刊文献, 构建了涵盖732篇有效文献的样本库, 采用文献计量方法, 从年度发文量、学科分布、关键词共现与聚类、突现词及时间区间演化等维度系统分析了我国开源创新研究的演进特征与热点主题. 结果表明, 我国开源创新研究经历了起步探索、稳步发展和快速增长3个阶段, 近5年的发文量显著攀升; 学科分布呈现多学科交叉格局, 以图书情报、计算机科学与工业技术为核心, 并延伸至教育、管理、法学等领域; 关键词聚类揭示出九大核心研究领域, 并对各领域代表性成果进行了述评; 时间区间演化分析显示, 未来的研究将主要聚焦于人工智能与开源生态的深度融合、开源社区协作与治理模式演进、开源软件安全与供应链风险识别, 以及开源法律与知识产权保护. 基于上述发现, 提出强化人工智能与开源生态协同治理, 完善供应链安全体系, 推进法律与许可制度创新, 构建面向产业与公共服务的数字开源基础设施等建议, 以推动我国开源创新的可持续发展.
以识别GitHub长期活跃高星仓库帮助开源社区构建和数字基础设施建设为背景, 提出了一种基于时间序列预测模型的GitHub高星仓库长期活跃度评估方法, 旨在解决识别仓库是否能够保持长期活跃的问题. 该方法首次引入开发者活跃周期作为关键特征, 用以提升仓库发展趋势预测的准确性. 通过对活动指标的时间序列数据进行建模与挖掘, 该方法提出了全新的活跃度计算公式DTA (Development Trend-based Activity), 实现了对仓库活跃水平的准确量化评估. 设计并制作了一个时间粒度细、覆盖范围广的基准数据集, 并系统评估了多种预测模型的表现, 最终确定了适用于开源仓库活跃度预测的最优模型. 实验结果验证了所提方法的有效性, 能够准确预测仓库的长期活跃情况. 因此, 引入DTA对仓库活跃度进行评估, 能够帮助开源参与者识别长期活跃的仓库, 确定参与重心, 促进开源社区的构建和数字基础设施建设.
开源生态系统作为现代软件产业的重要组成部分, 其评价问题日益受到学术界和产业界的关注. 然而, 当前开源评价方法存在评价标准不统一、评价过程缺乏理论支撑、评价结果可比性差等问题. 以评价学基础理论为指导, 提出了开源评价学这一新的交叉研究领域, 构建了面向开源生态系统的评价理论框架与方法体系. 主要内容: 基于评价学五大公理, 构建了开源评价学的理论体系, 提出了开源生态系统评价的基本概念、评价维度和评价标准; 设计了包含问题定义、任务实例、算法机制、实现实例和支撑系统5个层次的评价条件框架, 并提出了统计度量和网络度量相结合的评价模型; 基于GitHub数据集进行实验验证, 从开源仓库、开发者和社区3个维度对方法进行了有效性验证, 结果表明所提出的评价模型在开源应用中具有较强的适用性与解释力.
面对新工业革命背景下算力复杂性上升与定制化需求加剧的挑战, 开源硬件正成为打破封闭架构限制、增强技术自主可控能力的重要途径. 重点关注了以RISC-Ⅴ(Reduced Instruction Set Computer-Five)为代表的开源指令集架构, 系统梳理了其生态优势和产业价值; 同时比较了国内外主要开源项目在设计开放性、系统灵活性及协同创新机制方面的不同特点; 从时间维度展开分析, 可以明确开源硬件从底层架构创新逐步走向异构融合和场景拓展的发展趋势. 研究表明, 开源硬件在智能制造、边缘计算、沉浸式终端等关键领域有着广阔的应用前景, 能够有效提升算力利用效率, 降低开发难度和系统成本. 开源硬件正推动芯片设计从封闭模式向共享模式转变, 为工业智能化升级和技术安全战略提供新的支撑.
为更好地利用海量开源生态数据为社区开发和协作提供洞察, 开发了OSS Insight. 其系统架构和查询引擎的创新在于, 利用HTAP(Hybrid Transactional Analytical Processing)数据库高效存储和查询GitHub数十亿事件数据, 通过前端可视化实时生成洞察; 其时空数据的深度挖掘在于, 基于事件时间序列和开发者地理信息, 对开发者行为模式和开源生态演变进行建模分析; 其与LLM(Large Language Model)集成应用Data Explorer, 利用LLM将自然语言查询自动转换为SQL(Structured Query Language), 实现了对开源数据的智能问答和趋势洞察. Kubernetes案例的实证研究从开发者洞察、项目演进和组织协作这3方面进行了开源洞察分析. 实验表明, OSS Insight能够对超大规模开源数据进行高效、全面的分析, 其LLM驱动的交互式探索降低了数据分析门槛, 可辅助用户进行数据洞察, 可为开源社区治理提供实用的分析工具.