在数字化教育应用领域, 在线课堂等平台的开发人员在追求数据驱动的优化过程中, 面临着隐私问题和现有数据集规模不足的挑战. 针对此, 构建了一种适应教育特性的异构数据模型, 并实现了相应的数据生成工具 (E-Tools), 用于模拟复杂教育场景下的数据交互. 实验表明, 该工具在多种数据规模下, 都能保持高效的数据生成速度 (64 ~ 74 $ {\rm{MB}}\cdot{\rm{s}}^{-1} $), 展现了良好的线性扩展能力, 验证了所提模型的有效性及工具生成较大数据量的能力. 同时, 设计了反映学生学习行为的异构数据查询负载, 为教育平台的性能评估与优化提供了强有力的支持.
传统教育大数据管理面临隐私数据泄露、数据可信度存疑和越权访问等安全风险, 为了避免上述风险, 提出了一种新型基于智能合约的教育大数据安全管理与隐私保护算法: ASPES (algorithm for security management and privacy protection of education big data based on smart contracts), 算法融合了基于Shamir秘密共享的密钥切割改进分享算法、基于SM2-SHA256-AES算法的混合加密算法和基于分层数据访问控制的智能合约管理算法. 在真实数据集MOOCCube上的实验结果表明, 相较于较先进的方法, ASPES的执行效率和安全性有显著提高, 可以有效存储和管理教育大数据, 实现教育资源的合理分配. ASPES通过向区块链中嵌入智能合约, 将数据读写等操作上链, 能够优化管理路径、提高管理效率, 保证教育公平, 极大地提升教育质量.
查询优化可以显著提升联机分析处理 (online analytical processing, OLAP) 数据库系统对海量教育数据的分析效率, 为智能教学系统提供快速、精准的数据支持. 优化器主要包含基数预估、空间枚举和代价模型3个模块. 其中, 基数预估决定代价模型的结果, 并指导查询计划的选择. 因此, 优化器的基数预估模块评估对OLAP数据库系统优化起到积极的推动作用. 本文设计并实现了一套基于主键驱动的、构造多样化数据分布和数据关联关系的有效负载生成工具, 包含自定义关联关系的数据生成技术、基于有限状态机的负载模版生成技术和目标基数驱动的参数实例化技术. 并在3个数据库OceanBase、TiDB和PostgreSQL上进行了实验, 分析了3个数据库优化器存在的问题, 并给出了建议.
在现代教育环境中, 高效且可靠的数据管理系统对于在线教育平台和学生信息管理系统的运行至关重要. 随着教育数据量的持续增长和多用户访问频率的提高, 数据库系统面临并发冲突操作带来的高吞吐要求的挑战. 在众多并发控制策略中, 基于锁的控制策略是数据库系统中常用的策略之一, 然而, 由于锁造成的阻塞会影响数据库中事务并发执行的性能. 现有的工作主要通过调度事务间执行顺序或优化存储过程等方法减少锁竞争. 为了进一步提升事务吞吐, 本文基于锁避免进行事务内的阻塞分析和代价建模, 并提出事务内调度策略, 通过对工作负载的阻塞分析预估调度代价, 然后根据一定规则在事务内部有限程度地交换操作顺序, 减少锁阻塞造成的延迟, 从而提高性能. 最后, 通过对比传统的调度策略, 验证了提出的调度策略对吞吐的提升及对事务平均延迟的降低的效果.