← Back to Regularization

gradient clipping

Regularization

Used in

46 PRs

Best BPB

0.7227

Avg BPB

1.2240

Submissions

PR #63by yahya010RECORD

PR #96by saml212

PR #103by MatthewHRockwell

PR #114by saml212

PR #151by mrdavtan

PR #173by tamoghnokandar

PR #181by manfromnowhere143

PR #191by chris-buckley

PR #196by sicauzxl

PR #212by mrdavtan

PR #238by kellyvv

PR #244by simon-marcus

PR #256by IvGolovach

PR #310by vishesh9131

PR #321by andreanjos

PR #333by mahsumaktas

PR #343by joeynyc

PR #344by aryanbhosale

PR #383by joelnishanth

PR #384by anantdgoel

PR #426by aniketio-ctrl

PR #512by MatoTeziTanka

PR #535by raahilshah

PR #536by jaksenc

PR #568by MatoTeziTanka

PR #569by gowtham0992

PR #605by bigbag

PR #633by MatoTeziTanka

PR #635by aryanbhosale

PR #668by Christopher-Lee-McClendon

PR #671by keshav55

PR #691by xexyz

PR #705by seanward

PR #856by iverbovoy

PR #858by nickferrantelive

PR #862by grim-hitman0XX

PR #939by brian386

PR #994by singhaikshitijjain

PR #1299by Ribin545

PR #1378by Rajat123456789

PR #1388by CiprianFlorin-Ifrim

PR #1391by Abhinav-Avasarala

PR #1393by Abhinav-Avasarala

PR #2114by Sacmaj

Hyperparameters Across PRs

pr_number	parameters
46	{"norm":1}
63	{"max_norm":0.3}
96	{"norm":0.3}
103	{"norm":1}
107	{"norm":0.3}
114	{"grad_clip_norm":0.3}
151	{"norm":1}
173	{"grad_clip_norm":0.3}
181	{"grad_clip_norm":0.3}
191	{"grad_clip_norm":0.3}
196	{"grad_clip_norm":0.5}
212	{"grad_clip_norm":1}
238	{"grad_clip_norm":0.3}
244	{"grad_clip_norm":0.3}
256	{"grad_clip_norm":0.3}
310	{"grad_clip_norm":1}
321	{"norm":1}
333	{"norm":0.3}
343	—
344	{"clip_norm":0.3}
383	{"clip_norm":0.3}
384	{"norm":0.3}
426	{"grad_clip_norm":0.3}
512	{"clip_norm":0.3}
535	{"clip_value":0.3}
536	{"clip_value":1,"type":"global"}
568	{"value":0.3}
569	{"clip_value":0.3}
605	{"max_norm":1}
633	{"clip_value":0.3}
635	{"clip_value":0.3}
668	{"clip_norm":0.3}
671	{"norm":0.3}
691	{"clip_norm":1}
705	{"max_norm":0.3}
856	{"grad_clip_norm":0.3}
858	{"clip_norm":0.3}
862	{"norm":0.3}
939	{"norm":1}
994	—
1299	—
1378	{"clip_norm":0.3}
1388	{"norm":1}
1391	—
1393	—
2114	{"norm":0.2}