Kaiming He, Xiangyu Zhang, Shaoqing Ren, & Jian Sun (2015), References, Textbook of AI

Kaiming He, Xiangyu Zhang, Shaoqing Ren, & Jian Sun (2015)

arXiv.

DOI: https://doi.org/10.48550/arxiv.1502.01852

Abstract. Introduces He (Kaiming) initialisation, derived for ReLU networks, and the parametric ReLU activation. Demonstrates that correctly scaled initialisation enables very deep networks to train from scratch without degradation.

Tags: neural-networks initialisation relu

AI tools used: Claude (research, coding, text), ChatGPT (diagrams, images), Grammarly (editing).

Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification