定位设备的普及产生了海量的车辆行驶数据, 使得利用历史数据预测车辆行驶时长成为可能. 车辆行驶数据由两部分组成: 车辆行驶经过的路段序列信息和出发时段; 路径总长度等外部信息. 如何提取路段序列特征, 以及如何将序列特征与外部特征有效地融合, 成为预测行驶时间的关键问题. 为解决以上问题, 提出了一个基于 Transformer 的行驶时间预测模型, 模型由路段序列处理模块和特征融合模块两部分组成. 首先, 路段序列处理模块使用自注意力机制处理路段序列, 提取路段序列特征. 该模型不但可以充分考虑各条路段与其他路段间道路速度的时空关联性, 同时可保证数据并行输入模型, 避免了使用循环神经网络时数据顺序输入导致的效率低下. 其次, 特征融合模块将路段序列特征与出发时段等外部信息相融合, 最终获得预测的行驶时长. 在此基础上, 统计路口连接的路段数作为路段的上/下游路口特征, 与路段特征结合输入模型, 进一步提升了行驶时长的预测精度. 在真实的数据集上与主流预测模型进行的对比实验表明, 该模型在预测精度以及训练速度上均有提升, 体现了所提模型的有效性.