悉尼大學數(shù)據(jù)科學專業(yè)的DATA2001課程著重于有效探索和分析大型數(shù)據(jù)集的方法和技術(shù)。學生將學習如何從數(shù)據(jù)科學項目中遇到的各種數(shù)據(jù)模型(如關(guān)系、半結(jié)構(gòu)化、時間序列、地理空間、圖像、文本)中獲取、組合和總結(jié)數(shù)據(jù)。除了通過相關(guān)Python庫的經(jīng)驗來強化編程技能之外,課程還將向?qū)W生介紹使用SQL進行聲明性數(shù)據(jù)處理的概念,并分析關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)。學生將獲得來自社交媒體、交通、健康和社會科學的數(shù)據(jù)集,并學習基本的探索性數(shù)據(jù)分析和小型用例背景下的挖掘技術(shù)。那么DATA2001考試和作業(yè)的重點是什么呢?分析如下。
一、考試及作業(yè)具體要求
1、Homework,10%:Canvas上的每周家庭作業(yè)小測驗,旨在幫助學生回顧每周主題的學習情況。
2、SQL tutorials and SQL Test,15%:學生通過每周在線教程學習,了解SQL日益復雜的用法。SQL教程提供簡單的反饋并允許多次嘗試,示例解決方案在提交截止日期過后可用。每周都會提供解答,學期中會進行SQL測驗。
3、Practical Assignment,20%:學生以小組為單位進行更大的數(shù)據(jù)整合和數(shù)據(jù)分析任務(wù),其中一些提供的數(shù)據(jù)集必須與學生研究的額外數(shù)據(jù)相結(jié)合。最終提交的內(nèi)容包括團隊開發(fā)的源代碼工件,加上結(jié)果的簡短報告,以及在第12周的實驗中的小組演示。
4、Final Examination,55%:主要評估學生對本課程所有內(nèi)容的理解。

二、考試及作業(yè)評估重點
1、使用適當?shù)腜ython庫來自動化各種數(shù)據(jù)的數(shù)據(jù)科學活動。
2、從各種數(shù)據(jù)模型中攝取、組合和總結(jié)數(shù)據(jù)。
3、展示處理不同類型數(shù)據(jù)的數(shù)據(jù)集的經(jīng)驗,包括關(guān)系、半結(jié)構(gòu)化、時間序列、地理位置、圖像、文本,包括組合不同類型數(shù)據(jù)的經(jīng)驗。
4、理解并生成聲明性查詢,以從數(shù)據(jù)集中提取適當?shù)男畔?,包括使用SQL的能力。
5、了解分析“大數(shù)據(jù)”的主要挑戰(zhàn):數(shù)據(jù)量、多樣性、速度、準確性。
6、了解數(shù)據(jù)量對數(shù)據(jù)處理的影響,并了解解決這一問題的方法,如索引、壓縮、數(shù)據(jù)分區(qū)和分布式處理框架(Hadoop)。
7、在處理數(shù)據(jù)時表現(xiàn)出對隱私問題的意識。
悉尼大學數(shù)據(jù)科學專業(yè)的同學可以參考上述DATA2001考試及作業(yè)的具體要求和評估重點,來進行學習規(guī)劃,這樣就能更有針對性地進行學習,從而獲得更好的成績。
圖片歸版權(quán)方所有,頁面圖片僅供展示。如有侵權(quán),請聯(lián)系我們刪除。凡來源標注“考而思”均為考而思原創(chuàng)文章,版權(quán)均屬考而思教育所以,任何媒體、網(wǎng)站或個人不得轉(zhuǎn)載,否則追究法律責任。
kaoersi03