新手入門必知的7個計算機編程入門基礎(chǔ)知識 2022-09-06
計算機行業(yè)作為永久不衰的行業(yè),始終是年輕人追求的目標(biāo)。但是很多人在進入計算機編程行業(yè)之前,沒有目標(biāo)和方向。首先,想要進入計算機行業(yè),...詳情>
什么是網(wǎng)絡(luò)爬蟲 2022-09-05
網(wǎng)絡(luò)爬蟲,英文名為Spider,又稱為網(wǎng)頁蜘蛛,網(wǎng)絡(luò)機器人,在數(shù)據(jù)分析應(yīng)用中,更多的將爬蟲稱為數(shù)據(jù)采集程序,是一種按照一定的規(guī)則,自動地抓取...詳情>
讀數(shù)據(jù)流程 2022-09-02
1. 客戶端向namenode發(fā)起RPC調(diào)用,請求讀取文件數(shù)據(jù)。2. namenode檢查文件是否存在,如果存在則獲取文件的元信息(blockid以及對應(yīng)的datanode...詳情>
寫數(shù)據(jù)流程 2022-09-02
1. 客戶端發(fā)出請求hdfs dfs -put /etc/profile /qf/data。2. namenode查看維護的目錄結(jié)構(gòu),檢查/qf/data是否存在,如不存在直接報錯”no such ...詳情>
Spark Streaming的窗口大小,每個窗口處理的數(shù)據(jù)量大小。 2022-09-02
該問題一定要根據(jù)業(yè)務(wù)需求來確定,比如要實現(xiàn)的需求為:統(tǒng)計每分鐘的前一個小時的在線人數(shù)。上面需求的窗口大?。ù翱陂L度)為1小時,然后再統(tǒng)...詳情>
SparkStreaming的批次間隔,處理完的的數(shù)據(jù)存在哪里 2022-09-02
批次間隔為SparkStreaming處理實時需求的時間間隔,需要根據(jù)業(yè)務(wù)需求來確定批次間隔。實時需求的處理結(jié)果一般是保存在能快速讀取的數(shù)據(jù)庫中來...詳情>
MapReduce的原理(重點) 2022-09-02
MapperTask 使用邏輯切片的方式劃分block,調(diào)用InputFormat中的算法進行劃分,TextInputFormat默認按照128M進行劃分(默認一個block至少有一片...詳情>
多線程的用處 2022-09-01
這樣可以為不同的任務(wù)步驟建立線程。網(wǎng)絡(luò)程序設(shè)計為提高網(wǎng)絡(luò)的利用效率,我們可能使用多線程,對每個連接用一個線程去處理。數(shù)據(jù)共享 同一個進...詳情>
什么是線程 2022-09-01
為了減少系統(tǒng)開銷,從進程中演化出了線程。線程存在于進程中,共享進程的資源。線程是進程中的獨立控制流,由環(huán)境(包括寄存器組和程序計數(shù)器)...詳情>
線程和進程區(qū)別 2022-09-01
在進程切換時候,涉及到整個當(dāng)前進程 CPU 環(huán)境的保存以及新被調(diào)度運行的進程的 CPU 環(huán)境的設(shè)置;并發(fā)性: 不僅進程間可以并發(fā)執(zhí)行,而且在一個...詳情>
熱問標(biāo)簽 更多>>
在線提問
專業(yè)導(dǎo)師線上坐鎮(zhèn),解答個性化學(xué)習(xí)難題
提交問題
京公網(wǎng)安備 11010802030320號