斯坦福大學(xué)課程推薦:統(tǒng)計學(xué)習(xí)

閱讀:26215 來源:轉(zhuǎn)載
分享: 
斯坦福大學(xué)的統(tǒng)計學(xué)John A Overdeck 教席教授。 Hastie 廣為人知的是在應(yīng)用統(tǒng)計的研究,尤其是在數(shù)據(jù)挖掘、生物信息學(xué)和機器學(xué)習(xí)領(lǐng)域。

關(guān)于本課程

這是監(jiān)督學(xué)習(xí)的介紹性課程,關(guān)注于回歸分析和分類法。教學(xué)大綱包括:線性和多元回歸,邏輯回歸和線性判別分析;交叉驗證和引導(dǎo)程序,模型選擇和正則化方法(嶺回歸和 lasso 回歸);非線性模型,樣條函數(shù)和廣義相加模型;基于樹的方法,隨機森林和梯度提升;支持向量機。一些非監(jiān)督式學(xué)習(xí)方法也在談?wù)摲秶校褐鞒煞址治龊途垲惙治? k- 均值和分層回歸)。

這不是數(shù)學(xué)任務(wù)繁重的課程,所以,我們試著在不過度依賴公式和復(fù)雜數(shù)學(xué)運算情況下,講解方法。我們關(guān)注的是現(xiàn)代數(shù)據(jù)分析中,我們認(rèn)為重要組成部分。計算用 R 軟件完成。有專注 R 的課程,從頭給出指導(dǎo),并有更加詳細(xì)章節(jié)講述如何實踐每章中的技術(shù)。

課程包括了James, Witten, Hastie 和 Tibshirani 所著的《An Introduction to Statistical Learning,with Application in R》(Springer 出版社,2013)所有材料。這本書的 pdf 在圖書網(wǎng)站上可以免費獲得。

預(yù)修科目

統(tǒng)計學(xué)、線性代數(shù)和計算機技術(shù)

課程教師

Trevor Hastie:斯坦福大學(xué)的統(tǒng)計學(xué)John A Overdeck 教席教授。 Hastie 廣為人知的是在應(yīng)用統(tǒng)計的研究,尤其是在數(shù)據(jù)挖掘、生物信息學(xué)和機器學(xué)習(xí)領(lǐng)域。他已經(jīng)出版了有關(guān)這些領(lǐng)域的四本書,以及 180 篇多研究文獻。在 1994 年加入斯坦福大學(xué)之前, Hastie 在美國貝爾實驗室工作了 9 年,在此他協(xié)助開發(fā)了在 R 計算系統(tǒng)很受歡迎的統(tǒng)計建模環(huán)境。 1976 年,從南非羅德斯大學(xué)獲得統(tǒng)計學(xué)學(xué)士學(xué)位,1979 年,南非開普敦大學(xué)獲得碩士學(xué)位,1984 年,斯坦福大學(xué)獲得博士學(xué)位。 Hastie 教授是美國數(shù)理統(tǒng)計學(xué)會、美國統(tǒng)計協(xié)會、國際統(tǒng)計學(xué)會、南非統(tǒng)計協(xié)會和英國皇家統(tǒng)計學(xué)會會員。獲得許多獎項和榮譽,包括 1994 年來自哈佛的 Myrto Lefkopolous 獎, 2014 年的 Parzen 創(chuàng)新獎和 2015 年南非羅德斯大學(xué)的校友獎。

Robert Tibshirani:斯坦福大學(xué)健康研究、政策和統(tǒng)計學(xué)院系的教授。他為分析復(fù)雜數(shù)據(jù)集做出了重大貢獻,最近又在基因組學(xué)和蛋白質(zhì)組學(xué)上有所貢獻。他最著名的貢獻是 Lasso 回歸,也就是在回歸分析和相關(guān)問題中使用 L1 penalization 。他合作發(fā)表了 200 多篇論文和三本書。 Tibshirani 教授作為合作者發(fā)表第一篇將手機的使用與交通事故聯(lián)系起來的研究,得到廣泛引用,并在影響了開車時限制使用手機的立法。在整個數(shù)學(xué)科學(xué)領(lǐng)域,他是最被廣泛引用的作者之一。 Tibshirani 教授是美國統(tǒng)計協(xié)會、數(shù)理統(tǒng)計研究院和加拿大皇家學(xué)會成員。 1996 年,獲得頗有聲譽的 COPSS 主席獎, 1997年 獲NSERC Steacie 獎,并且在 2012 年入選美國國家科學(xué)院。

課程制作團隊

Will Fithian 和Sam Gross 制作和安排測驗問題和復(fù)習(xí)題。 Daniela Witten 幫助提出第 5 章的一些材料。 Wes Choy 管理視頻制作。 Greg Maximov 拍攝和編輯大部分課程視頻以及采訪錄音。 Greg Bruhns, Monica Diaz and Marc Sanders 協(xié)助 Open edX 。

常見問題解答

問:我需要購買一本教材嗎?

答:不,有免費的網(wǎng)絡(luò)版本的《An Introduction to Statistical Learning,with Application in R》(Springer 出版社,2013)。 Springer 已經(jīng)同意免費試用,所以不需要擔(dān)心版權(quán)問題。當(dāng)然,你不能傳播這個 pdf 文件的打印版。

問:R 軟件和 RStudio 可以免費使用嗎?

答:可以。你可以從 http://cran.us.r-project.org/ 免費得到 R 軟件。它的安裝往往需要單擊。你可以從 http://www.rstudio.com/ 得到 RStudio ,也是免費的,以類似的簡單方式安裝。

問:每周需要花多少小時的功夫?

答:我們期望每周用大約 3 至 5 小時去認(rèn)真學(xué)習(xí)材料和做練習(xí)。

問:會有結(jié)業(yè)證明嗎?

答:有,只要你完成了課程, 在測試中,取得了50% 的合格分?jǐn)?shù)。如果你取得了 90% 的合格分?jǐn)?shù)或更高,你的結(jié)業(yè)證明將是「成績優(yōu)異」。

標(biāo)簽: 大學(xué) 51offer編輯:usaedit1