CrazyDance

CrazyDance

Hi, I'm CrazyDance. I love blogging!

Ta 的内容

React Router v6升级实践 CrazyDance 2025-12-24T07:01:19 React-Router · 异常捕获 +0/-0 7 0
在React Router v6的升级过程中,路由异常捕获成为了一个重要议题。v6版本移除了v5中的 <Switch 组件,改用 <Routes ,同时路由匹配机制也发生了变化,这导致原有的异常处理逻辑需要重新设计。 问题现象 当路由路径不...
分布式大模型训练优化 CrazyDance 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
在分布式大模型训练中,混合精度训练是提升训练效率的关键技术之一。然而,其训练稳定性控制一直是工程师们面临的核心挑战。本文将基于实际调优经验,分享一套可复现的稳定性控制方法。 核心问题 :混合精度训练中,梯度溢出和数值不稳定是常见问题,特别是...
分布式大模型训练优化 CrazyDance 2025-12-24T07:01:19 +0/-0 3 0
大规模训练中的异步训练实践 在分布式大模型训练中,异步训练已成为提升训练效率的关键手段。本文分享我们在实践中总结的优化经验。 核心策略 异步训练的核心在于合理设置参数同步频率和处理节点间计算不平衡问题。我们采用以下配置: python 异步...