麻豆黑色丝袜jk制服福利网站-麻豆精品传媒视频观看-麻豆精品传媒一二三区在线视频-麻豆精选传媒4区2021-在线视频99-在线视频a

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進入千鋒手機站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > hive里面的分區(qū)表和分桶表一般用于什么場景?

hive里面的分區(qū)表和分桶表一般用于什么場景?

來源:千鋒教育
發(fā)布人:xqq
時間: 2023-10-13 13:20:29 1697174429

一、hive里面的分區(qū)表的一般使用場景

數(shù)據(jù)量非常大:數(shù)據(jù)量非常大的情況下,通過分區(qū)可以進行數(shù)據(jù)分割,方便管理和維護。數(shù)據(jù)需要按照某種規(guī)則進行存儲和查詢:如按照日期、地域等進行分區(qū),方便快速查詢所需數(shù)據(jù)。

二、hive里面的分桶表的一般使用場景

表的數(shù)據(jù)量較大,并且進行頻繁的聚合操作:分桶可以提高聚合操作的效率。存在一些需要頻繁查詢和過濾的字段:分桶可以使得查詢更加高效。

三、Hive分區(qū)表是什么

Hive分區(qū)是將數(shù)據(jù)表的某一個字段或多個字段進行統(tǒng)一歸類,而后存儲在在hdfs上的不同文件夾中。當(dāng)查詢過程中指定了分區(qū)條件時,只將該分區(qū)對應(yīng)的目錄作為Input,從而減少MapReduce的輸入數(shù)據(jù),提高查詢效率,這也是數(shù)倉優(yōu)化的一個列,也就是分區(qū)裁剪。分區(qū)表又分為靜態(tài)分區(qū)表和動態(tài)分區(qū)表兩種。這也是數(shù)倉性能優(yōu)化的一個常用點,也就是分區(qū)裁剪。

分區(qū)表分為靜態(tài)分區(qū)表和動態(tài)分區(qū)表兩種:

靜態(tài)分區(qū)表:所謂的靜態(tài)分區(qū)表指的就是,我們在創(chuàng)建表的時候,就已經(jīng)給該表中的數(shù)據(jù)定義好了數(shù)據(jù)類型,在進行加載數(shù)據(jù)的時候,我們已經(jīng)知道該數(shù)據(jù)屬于什么類型,并且直接加載到該分區(qū)內(nèi)就可以了。動態(tài)分區(qū)表:所謂的動態(tài)分區(qū)表,其實建表方式跟靜態(tài)分區(qū)表沒有區(qū)別,最主要的區(qū)別是在載入數(shù)據(jù)的時候,靜態(tài)分區(qū)表我們載入數(shù)據(jù)之前必須保證該分區(qū)存在,并且我么已經(jīng)明確知道載入的數(shù)據(jù)的類型,知道要將數(shù)據(jù)加載到那個分區(qū)當(dāng)中去,而動態(tài)分區(qū)表,在載入的時候,我們事先并不知道該條數(shù)據(jù)屬于哪一類,而是需要hive自己去判斷該數(shù)據(jù)屬于哪一類,并將該條數(shù)據(jù)加載到對應(yīng)的目錄中去。

四、Hive分桶表是什么

Hive分桶是相對分區(qū)進行更細粒度的劃分。是將整個數(shù)據(jù)內(nèi)容按照某列取hash值,對桶的個數(shù)取模的方式?jīng)Q定該條記錄存放在哪個桶當(dāng)中;具有相同hash值的數(shù)據(jù)進入到同一個文件中。 如要安裝name屬性分為3個桶,就是對name屬性值的hash值對3取摸,按照取模結(jié)果對數(shù)據(jù)分桶。如取模結(jié)果為0的數(shù)據(jù)記錄存放到一個文件,取模為1的數(shù)據(jù)存放到一個文件,取模為2的數(shù)據(jù)存放到一個文件。

分桶表的使用好處:

1、基于分桶字段查詢時,減少全表掃描

--基于分桶字段state查詢來自于New York州的數(shù)據(jù)
--不再需要進行全表掃描過濾
--根據(jù)分桶的規(guī)則hash_function(New York) mod 5計算出分桶編號
--查詢指定分桶里面的數(shù)據(jù) 就可以找出結(jié)果 此時是分桶掃描而不是全表掃描
select *
from t_usa_covid19_bucket where state="New York";

2、JOIN時可以提高MR程序效率,減少笛卡爾積數(shù)量

對于JOIN操作兩個表有一個相同的列,如果對這兩個表都進行了分桶操作。那么將保存相同列值的桶進行JOIN操作就可以,可以大大較少JOIN的數(shù)據(jù)量。

3、分桶表數(shù)據(jù)進行抽樣

當(dāng)數(shù)據(jù)量特別大時,對全體數(shù)據(jù)進行處理存在困難時,抽樣就顯得尤其重要了。抽樣可以從被抽取的數(shù)據(jù)中估計和推斷出整體的特性,是科學(xué)實驗、質(zhì)量檢驗、社會調(diào)查普遍采用的一種經(jīng)濟有效的工作和研究方法。

延伸閱讀1:hive是什么

hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,用來進行數(shù)據(jù)提取、轉(zhuǎn)化、加載,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規(guī)模數(shù)據(jù)的機制。hive數(shù)據(jù)倉庫工具能將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供SQL查詢功能,能將SQL語句轉(zhuǎn)變成MapReduce任務(wù)來執(zhí)行。Hive的優(yōu)點是學(xué)習(xí)成本低,可以通過類似SQL語句實現(xiàn)快速MapReduce統(tǒng)計,使MapReduce變得更加簡單,而不必開發(fā)專門的MapReduce應(yīng)用程序。hive十分適合對數(shù)據(jù)倉庫進行統(tǒng)計分析。

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
數(shù)據(jù)庫Union連接兩張表之前,怎么判斷要連接的另一張表是否存在?

一、Union連接兩張表之前,怎么判斷要連接的另一張表是否存在那你這個必須通過程序判斷 或者存儲過程去實現(xiàn),只用一條SQL是解決不了的。若是MyS...詳情>>

2023-10-13 15:20:02
mysql 不加條件查詢速度挺快,加上過濾條件就特別慢是為什么?

一、mysql 不加條件查詢速度挺快,加上過濾條件就特別慢是為什么不加條件查詢,如果是自增主鍵的話,會順序讀盤,順序讀取磁盤數(shù)據(jù)的話,速度可...詳情>>

2023-10-13 15:18:26
mysql中,replace into后怎么連接where子句?

一、mysql中,replace into后怎么連接where子句REPLACE INTO?語法完全?與?INSERT INTO?一樣工作,只是在新行已插入。這意味著您應(yīng)該將主鍵...詳情>>

2023-10-13 15:13:31
什么是數(shù)據(jù)庫表結(jié)構(gòu)?

一、什么是數(shù)據(jù)庫表結(jié)構(gòu)數(shù)據(jù)庫表結(jié)構(gòu)是指數(shù)據(jù)庫中表的組織和定義方式。它描述了表的名稱、列(字段)的定義和屬性,以及表與其他表之間的關(guān)系。...詳情>>

2023-10-13 14:52:13
MySQL日均10萬數(shù)據(jù)永久保存實現(xiàn)高可用可以采用什么方案?

一、MySQL日均10萬數(shù)據(jù)永久保存實現(xiàn)高可用可以采用的方案1、數(shù)據(jù)庫集群使用MySQL數(shù)據(jù)庫集群來實現(xiàn)高可用性和負載均衡。可以使用主從復(fù)制(Maste...詳情>>

2023-10-13 14:47:04
快速通道
主站蜘蛛池模板: 国产成人精品久久| 国内a级毛片免费···| 韩国理论电影午夜三级717| 国产国语一级毛片全部| 91成人高清在线播放| 成人午夜电影在线| 一级无毛片| 西西人体高清444rt·wang| 好妻子韩国片在线| 日本欧美日韩| 大女小娟二女小妍| 久久久香蕉视频| 一区二区3区免费视频| 91热视频在线| 午夜性爽快| 女人18片毛片60分钟| 丁香六月婷婷精品免费观看| 大佬的365天第三季完整视频在线观看| 韩国三级电影网| 翁熄合h| 99re在线视频免费观看| 一区二区三区四区电影视频在线观看| 国产精品人成在线播放新网站| 出差被绝伦上司侵犯中文字幕| 一级毛片不卡| 麻豆亚洲| 亚洲成a人片在线观| 色爱av综合网站| 欧美金发大战黑人wideo| 国产91精品久久久久久久| 欧美国产在线观看| 在线免费观看你懂的| 亚洲福利二区| 色偷偷成人网免费视频男人的天堂| chinese真实露脸hotmilf| 日日操影院| 国产精品亚洲片夜色在线| 最近中文国语字幕在线播放| 美女范冰冰hdxxxx| 国产欧美日韩精品a在线观看| 美国式禁忌芭芭拉|