對(duì)macbook或一些“力量”不足的小破本,靠nanoGPT也能開訓(xùn)。
不過(guò),作者建議使用莎士比亞(shakespeare)數(shù)據(jù)集,該數(shù)據(jù)集前文已提及,大小約1MB,然后在一個(gè)很小的網(wǎng)絡(luò)上運(yùn)行。
據(jù)他自己親身示范,創(chuàng)建了一個(gè)小得多的Transformer(4層,4個(gè)head,64嵌入大?。谧髡咦约旱奶O果AIR M1本上,每次迭代大約需要400毫秒。
(GitHub上nanoGPT鏈接附在文末,有需要的朋友自?。?br />
One More Thing