作為一種通用技術(shù),人工智能不只有猜你喜歡、讓汽車自動駕駛的能力,還能幫助許多領(lǐng)域的科學(xué)家們加速科學(xué)研究的進程,這就是人工智能科學(xué)計算(AI for Science)。
現(xiàn)在已經(jīng)有許多科學(xué)家團隊正在用AI幫助解決科學(xué)難題。比如在氣象領(lǐng)域,AI實現(xiàn)更快更精準(zhǔn)的數(shù)值天氣預(yù)報,包括預(yù)測強對流天氣的短時臨近降水情況和揭示大尺度的臺風(fēng)形成和演變規(guī)律。在生命科學(xué)領(lǐng)域,傳統(tǒng)的科研方法面臨生物類型實驗數(shù)據(jù)少、計算任務(wù)復(fù)雜、學(xué)科交叉多等挑戰(zhàn),而隨著AI應(yīng)用探索的持續(xù)推進,AI已逐漸在藥物篩選、藥物設(shè)計、靶點研究、合成生物學(xué)、疾病機理研究等方面實現(xiàn)落地和持續(xù)的進步。
AI 為解決科學(xué)問題帶來新方法的同時,也對AI基礎(chǔ)軟硬件帶來諸多新挑戰(zhàn)。畢竟,推動科學(xué)進步與開發(fā)一個人臉識別算法需要的并不完全是一種能力。
首先,深度學(xué)習(xí)平臺需要具備更加豐富的各類計算表達能力,如高階自動微分、復(fù)數(shù)微分、高階優(yōu)化器等;其次,科學(xué)問題求解需要超大規(guī)模的計算,這對深度學(xué)習(xí)平臺與異構(gòu)超算/智算中心適配及融合優(yōu)化,神經(jīng)網(wǎng)絡(luò)編譯器加速和大規(guī)模分布式訓(xùn)練提出了新的要求;此外,如何實現(xiàn)人工智能與傳統(tǒng)科學(xué)計算工具鏈的協(xié)同,也是需要解決的問題。
過去的這幾年,百度飛槳團隊在這些問題取得了進展。作為國內(nèi)首個自主研發(fā)、功能豐富、開源開放的產(chǎn)業(yè)級深度學(xué)習(xí)平臺,飛槳研發(fā)了一系列用于科學(xué)研究的工具組件,比如賽槳PaddleScience、螺旋槳PaddleHelix、量槳Paddle Quantum等,支持復(fù)雜外形障礙物繞流、結(jié)構(gòu)應(yīng)力應(yīng)變分析、材料分子模擬等豐富領(lǐng)域算例,廣泛支持AI加計算流體力學(xué)、生物計算、量子計算等前沿方向的科研探索和產(chǎn)業(yè)應(yīng)用。
對于科學(xué)領(lǐng)域大規(guī)模計算的需求,飛槳推出了超大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù)PGLBox,是業(yè)界首個同時支持復(fù)雜算法+超大圖+超大離散模型的大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù),通過顯存、內(nèi)存、SSD三級存儲技術(shù)和訓(xùn)練框架的性能優(yōu)化技術(shù),單機即可支持百億節(jié)點、數(shù)百億邊的圖采樣和訓(xùn)練,并可通過多機擴展支持更大規(guī)模,目前已經(jīng)在百度的智能交通、信息推薦、搜索等標(biāo)桿場景實現(xiàn)落地,大幅提升業(yè)務(wù)效率和用戶體驗。
在科研生態(tài)方面,百度飛槳已經(jīng)與高校、科研機構(gòu)等開展了計算流體力學(xué)、分子動力學(xué)、動力氣象學(xué)等方面的范例建設(shè),并形成了一些開放性的、多學(xué)科交叉的生態(tài)社區(qū),包括飛槳特殊興趣小組(PPSIG)、共創(chuàng)計劃等,與各方一道進行技術(shù)聯(lián)合開發(fā)、推廣資源共享,生態(tài)商機共建。
瞄準(zhǔn) AI for Science 賽道,對百度飛槳來說是 AI 能力的挑戰(zhàn),但一次次技術(shù)突破,也是飛槳提升能力的機會。對于整個社會也有重大意義,百度飛槳的一個個技術(shù)突破,也讓科學(xué)家們有了更好的幫手,讓技術(shù)突破擁有了更多可能性。