不列顛哥倫比亞大學(xué)(UBC)的DSCI 100數(shù)據(jù)科學(xué)導(dǎo)論課程旨在讓學(xué)生學(xué)會(huì)通過(guò)網(wǎng)絡(luò)“抓取”(下載)數(shù)據(jù),智能“整理”(管理)數(shù)據(jù),并基于數(shù)據(jù)創(chuàng)建能清晰傳達(dá)合理結(jié)論的表格和/或圖表。學(xué)生將熟練運(yùn)用工具發(fā)現(xiàn)數(shù)據(jù)模式并預(yù)測(cè)未來(lái)數(shù)據(jù)趨勢(shì)。以下是對(duì)UBC DSCI100課程章節(jié)重點(diǎn)內(nèi)容的詳細(xì)解讀。

一、章節(jié)重點(diǎn)內(nèi)容
1、Chapter 1:數(shù)據(jù)科學(xué)導(dǎo)論
通過(guò)實(shí)踐真實(shí)數(shù)據(jù)科學(xué)應(yīng)用,學(xué)習(xí)使用R語(yǔ)言和Jupyter,包括從網(wǎng)絡(luò)下載數(shù)據(jù)、將數(shù)據(jù)整理為可用格式,以及創(chuàng)建有效的數(shù)據(jù)可視化。
2、Chapter 2:本地與網(wǎng)絡(luò)數(shù)據(jù)讀取
學(xué)習(xí)讀取本地及網(wǎng)絡(luò)環(huán)境下的各類(lèi)數(shù)據(jù)集。讀取完成后,將運(yùn)用這些數(shù)據(jù)集實(shí)踐真實(shí)數(shù)據(jù)科學(xué)應(yīng)用場(chǎng)景,包括將數(shù)據(jù)整理為可用格式并創(chuàng)建高效數(shù)據(jù)可視化。
3、Chapter 3:數(shù)據(jù)清洗與整理
聚焦數(shù)據(jù)清洗與整理工具的應(yīng)用。仍將基于實(shí)際數(shù)據(jù)科學(xué)應(yīng)用場(chǎng)景,持續(xù)通過(guò)完整案例實(shí)踐:從網(wǎng)絡(luò)下載數(shù)據(jù)、整理數(shù)據(jù)至可用格式,最終創(chuàng)建高效數(shù)據(jù)可視化。
4、Chapter 4:高效數(shù)據(jù)可視化
拓展數(shù)據(jù)可視化知識(shí)體系與工具集,超越現(xiàn)有實(shí)踐范疇。突破散點(diǎn)圖的局限,學(xué)習(xí)其他高效的數(shù)據(jù)可視化方法,并掌握可視化創(chuàng)作中的通用經(jīng)驗(yàn)法則。所有可視化任務(wù)均將應(yīng)用于真實(shí)數(shù)據(jù)集。
5、Chapter 6-7:分類(lèi)
介紹基于K最近鄰算法(k-nn)的分類(lèi)。
6、Chapter 8:回歸
介紹基于K最近鄰算法(k-nn)的回歸。重點(diǎn)探討存在目標(biāo)響應(yīng)變量與單一解釋變量時(shí)的預(yù)測(cè)場(chǎng)景。
7、Chapter 9:回歸進(jìn)階
深入探索高維空間中的k-nn回歸方法。同時(shí)開(kāi)始在回歸場(chǎng)景中對(duì)比k-nn與線性模型。
8、Chapter 10:聚類(lèi)
介紹K均值聚類(lèi)方法。
9、Chapter 11:統(tǒng)計(jì)推斷導(dǎo)論
介紹樣本均值與比例的抽樣與估計(jì)方法。
10、Chapter 12:統(tǒng)計(jì)推斷導(dǎo)論(續(xù))
引入置信區(qū)間概念,并講解通過(guò)引導(dǎo)法計(jì)算置信區(qū)間的具體方法。
二、課程學(xué)習(xí)成果
課程結(jié)束時(shí),學(xué)生應(yīng)能夠:
? 通過(guò)計(jì)算讀取來(lái)自多種來(lái)源的數(shù)據(jù)(本地及遠(yuǎn)程純文本文件、電子表格和數(shù)據(jù)庫(kù));
? 將原始數(shù)據(jù)格式轉(zhuǎn)換為符合特定用途的格式;
? 識(shí)別最常見(jiàn)的研究/統(tǒng)計(jì)問(wèn)題類(lèi)型,并將其映射至對(duì)應(yīng)的數(shù)據(jù)分析方法;
? 基于整理后的數(shù)據(jù)創(chuàng)建并解讀有意義的表格/圖表;
? 應(yīng)用并解讀簡(jiǎn)單分類(lèi)器與回歸模型的輸出結(jié)果;
? 使用簡(jiǎn)單分類(lèi)器和回歸模型進(jìn)行預(yù)測(cè)并評(píng)估預(yù)測(cè)結(jié)果;
? 應(yīng)用簡(jiǎn)單聚類(lèi)算法并解讀其輸出結(jié)果;
? 區(qū)分樣本內(nèi)預(yù)測(cè)、樣本外預(yù)測(cè)與交叉驗(yàn)證;
? 在統(tǒng)計(jì)推斷背景下計(jì)算點(diǎn)估計(jì)值,并闡釋其與總體量值的關(guān)聯(lián)性;
? 運(yùn)用合理、清晰、可復(fù)現(xiàn)且可共享的工作流程與溝通策略完成上述所有任務(wù)。
以上就是UBC DSCI100課程章節(jié)重點(diǎn)內(nèi)容解析。如果學(xué)生在學(xué)習(xí)過(guò)程中遇到問(wèn)題,可以立即與考而思的課程顧問(wèn)聯(lián)系??级紝⒓皶r(shí)安排一對(duì)一不列顛哥倫比亞大學(xué)課程輔導(dǎo),幫助學(xué)生解決課業(yè)疑問(wèn)、掌握知識(shí)重點(diǎn)、消除學(xué)習(xí)難點(diǎn),以獲得滿意的課業(yè)成績(jī)。
圖片歸版權(quán)方所有,頁(yè)面圖片僅供展示。如有侵權(quán),請(qǐng)聯(lián)系我們刪除。凡來(lái)源標(biāo)注“考而思”均為考而思原創(chuàng)文章,版權(quán)均屬考而思教育所以,任何媒體、網(wǎng)站或個(gè)人不得轉(zhuǎn)載,否則追究法律責(zé)任。
添加微信【kaoersi03】(備注官網(wǎng))申請(qǐng)?jiān)嚶?tīng),享專(zhuān)屬套餐優(yōu)惠!
kaoersi03