悉尼大學DATA3404:數(shù)據(jù)科學平臺課程作業(yè)考試輔導,本研究單元全面概述了數(shù)據(jù)科學平臺的內(nèi)部機制以及管理大型數(shù)據(jù)收集的系統(tǒng)。這些技能是成功進行性能調(diào)整和了解處理大數(shù)據(jù)時面臨的可伸縮性挑戰(zhàn)所必需的。本單元以DATA2001的第二年-“數(shù)據(jù)科學-大數(shù)據(jù)和數(shù)據(jù)多樣性”為基礎,并相應地具有對SQL和數(shù)據(jù)分析任務的良好理解。
? ? ?悉尼大學DATA3404本主題的第一部分著重于大規(guī)模數(shù)據(jù)管理的機制。它深入了解了數(shù)據(jù)管理平臺的內(nèi)部組件。主題包括:物理數(shù)據(jù)組織和基于磁盤的索引結構,查詢處理和優(yōu)化以及數(shù)據(jù)庫調(diào)整。第二部分著重于分布式架構中的大數(shù)據(jù)的大規(guī)模管理。主題包括:分布式和復制數(shù)據(jù)庫,信息檢索,數(shù)據(jù)流處理和Web級數(shù)據(jù)處理。該單元將吸引尋求數(shù)據(jù)管理調(diào)優(yōu),基于磁盤的數(shù)據(jù)結構和算法以及信息檢索入門的學生。對于那些從事軟件工程師,數(shù)據(jù)工程師,數(shù)據(jù)庫管理員和大數(shù)據(jù)平臺專家等職業(yè)的人來說,這將是寶貴的。和信息檢索。對于那些從事軟件工程師,數(shù)據(jù)工程師,數(shù)據(jù)庫管理員和大數(shù)據(jù)平臺專家等職業(yè)的人來說,這將是寶貴的。和信息檢索。對于那些從事軟件工程師,數(shù)據(jù)工程師,數(shù)據(jù)庫管理員和大數(shù)據(jù)平臺專家等職業(yè)的人來說,這將是寶貴的。
悉尼大學DATA3404:數(shù)據(jù)科學平臺課程作業(yè)考試輔導細節(jié)入學規(guī)則學習成果完成本單元后,您應該能夠:
LO2 。了解不同的物理數(shù)據(jù)組織,包括數(shù)據(jù)分區(qū)和數(shù)據(jù)復制
LO3 。了解基于磁盤的索引結構,例如B樹,可擴展哈希和位圖索引
LO4 。了解查詢處理和查詢優(yōu)化的原理
LO5 。了解(分布式)數(shù)據(jù)科學平臺的原理。
LO6 。了解數(shù)據(jù)分片算法和數(shù)據(jù)復制協(xié)議
LO7 。制定有效的物理數(shù)據(jù)設計決策
LO8 。識別性能問題并能夠有效地調(diào)整(分布式)數(shù)據(jù)處理系統(tǒng)的性能
圖片歸版權方所有,頁面圖片僅供展示。如有侵權,請聯(lián)系我們刪除。凡來源標注“考而思”均為考而思原創(chuàng)文章,版權均屬考而思教育所以,任何媒體、網(wǎng)站或個人不得轉載,否則追究法律責任。
kaoersi03