DATA3404:數(shù)據(jù)科學(xué)平臺課程作業(yè)考試在線輔導(dǎo)本研究單元全面概述了數(shù)據(jù)科學(xué)平臺的內(nèi)部機制以及管理大型數(shù)據(jù)收集的系統(tǒng)。這些技能是成功進行性能調(diào)整和了解處理大數(shù)據(jù)時面臨的可伸縮性挑戰(zhàn)所必需的。本單元以DATA2001的第二年-“數(shù)據(jù)科學(xué)-大數(shù)據(jù)和數(shù)據(jù)多樣性”為基礎(chǔ),并相應(yīng)地具有對SQL和數(shù)據(jù)分析任務(wù)的良好理解。本主題的第一部分著重于大規(guī)模數(shù)據(jù)管理的機制。它深入了解了數(shù)據(jù)管理平臺的內(nèi)部組件。主題包括:物理數(shù)據(jù)組織和基于磁盤的索引結(jié)構(gòu),查詢處理和優(yōu)化以及數(shù)據(jù)庫調(diào)整。

? ? ? 第二部分著重于分布式架構(gòu)中的大數(shù)據(jù)的大規(guī)模管理。主題包括:分布式和復(fù)制數(shù)據(jù)庫,信息檢索,數(shù)據(jù)流處理和Web級數(shù)據(jù)處理。該單元將吸引尋求數(shù)據(jù)管理調(diào)優(yōu),基于磁盤的數(shù)據(jù)結(jié)構(gòu)和算法以及信息檢索入門的學(xué)生。對于那些從事軟件工程師,數(shù)據(jù)工程師,數(shù)據(jù)庫管理員和大數(shù)據(jù)平臺專家等職業(yè)的人來說,這將是寶貴的。和信息檢索。對于那些從事軟件工程師,數(shù)據(jù)工程師,數(shù)據(jù)庫管理員和大數(shù)據(jù)平臺專家等職業(yè)的人來說,這將是寶貴的。和信息檢索。對于那些從事軟件工程師,數(shù)據(jù)工程師,數(shù)據(jù)庫管理員和大數(shù)據(jù)平臺專家等職業(yè)的人來說,這將是寶貴的。
DATA3404:數(shù)據(jù)科學(xué)平臺課程作業(yè)考試在線輔導(dǎo)細節(jié)入學(xué)規(guī)則學(xué)習(xí)成果完成本單元后,您應(yīng)該能夠:
LO1 。展示使用/調(diào)整數(shù)據(jù)科學(xué)平臺的經(jīng)驗
LO2 。了解不同的物理數(shù)據(jù)組織,包括數(shù)據(jù)分區(qū)和數(shù)據(jù)復(fù)制
LO3 。了解基于磁盤的索引結(jié)構(gòu),例如B樹,可擴展哈希和位圖索引
LO4 。了解查詢處理和查詢優(yōu)化的原理
LO5 。了解(分布式)數(shù)據(jù)科學(xué)平臺的原理。
LO6 。了解數(shù)據(jù)分片算法和數(shù)據(jù)復(fù)制協(xié)議
LO7 。制定有效的物理數(shù)據(jù)設(shè)計決策
LO8 。識別性能問題并能夠有效地調(diào)整(分布式)數(shù)據(jù)處理系統(tǒng)的性能
單元大綱
對于1000級和5000級單元,單元大綱將在教學(xué)的第一天前兩周提供,對于所有其他單元,單元大綱將在教學(xué)的第一天前一周提供。DATA3404:數(shù)據(jù)科學(xué)平臺課程作業(yè)考試在線輔導(dǎo)找考而思老師在線一對一補習(xí)。
圖片歸版權(quán)方所有,頁面圖片僅供展示。如有侵權(quán),請聯(lián)系我們刪除。凡來源標注“考而思”均為考而思原創(chuàng)文章,版權(quán)均屬考而思教育所以,任何媒體、網(wǎng)站或個人不得轉(zhuǎn)載,否則追究法律責任。
添加微信【kaoersi03】(備注官網(wǎng))申請試聽,享專屬套餐優(yōu)惠!
kaoersi03