hbase查找數據演算法_如何獲取hbase數據查詢語句

① HBase怎麼實現海量數據的毫秒級查詢

邏輯運算符極其優先次序
C語言中提供了三種邏輯運算符：
1) && 與運算
2) || 或運算
3) ! 非運算
與運算符&&和或運算符||均為雙目運算符。具有左結合性。非運算符!為單目運算符，具有右結合性。邏輯運算符和其它運算符優先順序的關系可表示如下：
!（非）→&&(與)→||(或)
「&&」和「||」低於關系運算符，「！」高於算術運算符。
按照運算符的優先順序可以得出：
a>b && c>d 等價於 (a>b)&&(c>d)
!b==c||d<a 等價於 ((!b)==c)||(d<a)
a+b>c&&x+y<b 等價於 ((a+b)>c)&&((x+y)<b)

② hbase如何根據某個列的值，查詢出這個列的ro

剛才理解錯了，你是要在C列顯示對應A列的B列值，修改一下答案
在c列第一個單元格C1復制如下公式：
=VLOOKUP(A1,sheet1!$A$1:$B$n,2,0)
其中n為A列最後一個單元格行數
然後把B1向下填充到其他B列單元格，公示應該會自動變為
=VLOOKUP(A2,sheet1!$A$1:$B$n,2,0)
=VLOOKUP(A3,sheet1!$A$1:$B$n,2,0)
......
=VLOOKUP(An,sheet1!$A$1:$B$n,2,0)
這樣應該可行，我沒試驗過你這種情況。你應該仔細看看VLOOKUP()這個函數的用法

下面是我給別人寫的，不過對方說沒看懂，你看看：
如果你有一個數據表，而另一個表格需要自動讀取這個數據表內的數據，函數VLOOKUP()就很有用了。
下面簡單說一下：
函數VLOOKUP()用法：
例子公式如下
=VLOOKUP(F5,Sheet2!$F$4:$W$957,2,0)
其中第一個參數F5為查找值，即使用該公式的單元格內的數據是根據F5單元格內的數據查找出來的，例如你把姓名放在F列，其中F5是一個叫張三的人，G列是身份證號。G5要查找張三的身份證號，就可以在G5用函數VLOOKUP()
第二個參數是數據表，就是由哪一個數據表的哪幾列數據為查找范圍，【Sheet2！】就是數據表名，$F$4(F4)就是范圍的左上角單元格，$W$957(W957)就是右下角單元格，查找范圍就是在這個矩形內。其中F列數據必須是第一個參數F5的比照列，簡單來說就是第一個參數F5的數值應該在查找的數據表的F列內。且F列必須是查找范圍的第一個列該公式才起作用。舉例你要查找張三，那麼張三在Sheet2數據表查找范圍內的所在列必須是查找范圍內的第一列。F4寫成$F$4是為了固定該單元格，否則在復制公式的時候excel會自動遞加單元格數值，F4在復制的時候可能會變成F5、F6...，造成查找范圍改變
第三個參數是列數，就是該函數返回的是第幾列的數值，該列數是相對列數，即查找范圍內的第幾列。例如Sheet2工作表內的F列在整個表格內屬於第6列，但在查找范圍內的相對列數是第1列。假如張三的身份證在G列內，那麼就是返回查找范圍的第二列。
第四個參數是匹配條件，一般為0。

下面舉一個具體使用的例子。
假設你有一個excel文件，裡面的sheet1工作表記錄的是單位人員姓名及人員身份證號，你現在需要創建一個新excel文件，記錄單位人員的三險一金，裡面需要輸入人員的身份證號，如果再一個一個輸入，重復勞動效率低不說，很有可能輸錯了，這時候你就可以從以前那個excel文件中讀取這些人員的身份證號。
在新表中先輸入人員姓名（如果你用人員序號作比對的話，姓名也可以自動讀取），然後在需要輸入身份證號的地方點擊上面的【fx】，出現【插入函數】的對話框，在類別中選擇【查找和引用】，最後一個就是VLOOKUP，選中它，點【確定】，然後出現【函數參數】對話框，【Lookup-value】為第一個參數，點擊旁邊的表格紅箭頭圖標，選中新表中需要查找身份證號的那個人的姓名單元格；【table-array】為第二個參數，顧名思義是表格數組，包含行列的一個范圍，就是查找范圍，點擊旁邊表格紅箭頭圖標，在老表sheet1中框選所有姓名和身份證號，保證老表中姓名在第一列；【col-index-num】為第三個參數，看看老表中身份證號在選擇范圍是第幾列，就寫上幾。假如老表內身份證號緊跟著姓名，因為姓名列是范圍內的第一列，那麼身份證號就是第二列；【range-lookup】為第四個參數，寫上0。全部弄好以後，回到新表看看身份證號是不是已經自動讀出來了。如果沒有一是查查這個人在老表中有沒有，名字有沒有空格，還有你選擇的第三個參數列數對不對，注意有沒有隱藏列，因為隱藏列雖然看不到，但是也計算在列數裡面。如果沒問題，將公示復制到所有需要讀取身份證的單元格內。
這樣有一個問題，因為你新表讀取的是文件外的數據，所以必須保證老表文件位置不能變動，否則新表就不知道去哪裡找數據了。解決方法有三個，一是保證老表文件位置永遠不動（廢話）；二是在操作前先把老表數據復制到新表所在的文件內，單獨作為一個sheet工作表存在，然後再查找新表復制後的數據，因為在同一個文件內，不用擔心數據源丟失問題；三是不復制老表，新表讀取數據後，選中讀取的數據，點擊【復制】，然後在原位置點擊【選擇性粘貼】，選中粘貼【數據】，這樣公式會被公式讀取的數據覆蓋，就和數據源沒有關系了。
還會遇到一個問題，如果老表沒有數據，比如說老表內李四這個人當時就沒有輸入身份證號，那麼新表內李四用公式查出來的身份證號並不是空，而是0，解決這個問題需要加一個if判斷語句，如下：
=IF(你的公式=0，"",你的原公式)
還有就是，如果數據查找出錯，會出現#N/A或者#VALUE，也可以用if語句取消，如下：
=IF(ISERROR(你的公式)，"",你的公式)
不過不建議這樣做，有錯誤提示才能知道去查找公式是不是有問題，公式沒問題自然不會出現錯誤提示，沒必要人為取消。

③ 如何用hive查詢hbase中的數據

第一步，啟動hadoop，命令：./start-all.sh
第二步，啟動hive，命令：
./hive --auxpath /home/dream-victor/hive-0.6.0/lib/hive_hbase-handler.jar,/home/dream-victor/hive-0.6.0/lib/hbase-0.20.3.jar,/home/dream-victor/hive-0.6.0/lib/zookeeper-3.2.2.jar -hiveconf hbase.master=127.0.0.1:60000
這里，-hiveconf hbase.master=指向自己在hbase-site.xml中hbase.master的值
第三步，啟動hbase，命令：./start-hbase.sh
第四步，建立關聯表，這里我們要查詢的表在hbase中已經存在所以，使用CREATE EXTERNAL TABLE來建立，如下：
CREATE EXTERNAL TABLE hbase_table_2(key string, value string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = "data:1")
TBLPROPERTIES("hbase.table.name" = "test");

�0�2hbase.columns.mapping指向對應的列族；多列時，data:1，data:2；多列族時，data1:1,data2:1；
�0�2hbase.table.name指向對應的表；
�0�2hbase_table_2(key string, value string)，這個是關聯表
我們看一下HBase中要查詢的表的結構，

④ 用happybase happy地查詢hbase數據

用happybase進行hbase中數據的增刪改查

前提：已經安裝happybase庫(pip install happybase)，已有hbase環境並開啟thrift通訊埠(nohup hbase thrift start &)，thrift默認埠為9090，10.10.30.200為hbase主機ip

scan方法：

參數：

row_start、row_stop：起始和終止rowkey，查詢兩rowkey間的數據

row_prefix：rowkey前綴。註：使用row_prefix的時候，row_start和row_stop不能使用

filter：要使用的過濾器(hbase 0.92版本及以上生效)

timestamp：按指定時間戳查詢

reverse：默認為False。為True時，scan結果按rowkey倒序排列

e.g：

put方法：

e.g：

△ 如put中的rowkey已存在，則為修改數據

delete方法：

row：刪除rowkey為row的數據

columns：指定columns參數時，刪除

e.g：

刪除rowkey為student2的name數據：

刪除成功：

batch方法：

1、批量操作

2、使用with管理批量

row方法及rows()方法，檢索指定rowkey的數據

檢索一條：

檢索多條：

返回結果：

e.g：

結果：

暫時就這些0v0

⑤ 如何獲取hbase數據查詢語句

get命令和HTable類的get()方法用於從HBase表中讀取數據。使用 get 命令，可以同時獲取一行數據。它的語法如下：
get 』<table name>』,』row1』

下面的例子說明如何使用get命令。掃描emp表的第一行。
hbase(main):012:0> get 'emp', '1'

COLUMN CELL

personal : city timestamp=1417521848375, value=hyderabad

personal : name timestamp=1417521785385, value=ramu

professional: designation timestamp=1417521885277, value=manager

professional: salary timestamp=1417521903862, value=50000

4 row(s) in 0.0270 seconds

讀取指定列
下面給出的是語法，使用get方法讀取指定列。
hbase>get 'table name', 『rowid』, {COLUMN => 『column family:column name 』}

下面給出的示例，是用於讀取HBase表中的特定列。
hbase(main):015:0> get 'emp', 'row1', {COLUMN=>'personal:name'}

COLUMN CELL

personal:name timestamp=1418035791555, value=raju

⑥ spark1.2.1實現讀取hbase的數據後怎麼實現實時查詢

WordCountHbaseReaderMapper類繼承了TableMapper抽象類，TableMapper類專門用於完成MapRece中Map過程與Hbase表之間的操作。此時的map(ImmutableBytesWritablekey,Resultvalue,Contextcontext)方法，第一個參數key為Hbase表的rowkey主鍵，第二個參數value為key主鍵對應的記錄集合，此處的map核心實現是遍歷key主鍵對應的記錄集合value，將其組合成一條記錄通過contentx.write(key,value)填充到鍵值對中。詳細源碼請參考：WordCountHbaseReader\src\com\zonesion\hbase\WordCountHbaseReader.{@Overrideprotectedvoidmap(ImmutableBytesWritablekey,Resultvalue,Contextcontext)throwsIOException,InterruptedException{StringBuffersb=newStringBuffer("");for(Entryentry:value.getFamilyMap("content".getBytes()).entrySet()){Stringstr=newString(entry.getValue());//將位元組數組轉換為String類型if(str!=null){sb.append(newString(entry.getKey()));sb.append(":");sb.append(str);}context.write(newText(key.get()),newText(newString(sb)));}}}3、Recer函數實現此處的WordCountHbaseReaderRece實現了直接輸出Map輸出的鍵值對，沒有對其做任何處理。詳細源碼請參考：WordCountHbaseReader\src\com\zonesion\hbase\WordCountHbaseReader.{privateTextresult=newText();@Overrideprotectedvoidrece(Textkey,Iterablevalues,Contextcontext)throwsIOException,InterruptedException{for(Textval:values){result.set(val);context.write(key,result);}}}4、驅動函數實現與WordCount的驅動類不同，在Job配置的時候沒有配置job.setMapperClass()，而是用以下方法執行Mapper類：TableMapReceUtil.initTableMapperJob(tablename,scan,WordCountHbaseReaderMapper.class,Text.class,Text.class,job);該方法指明了在執行job的Map過程時，數據輸入源是hbase的tablename表，通過掃描讀入對象scan對表進行全表掃描，為Map過程提供數據源輸入，通過WordCountHbaseReaderMapper.class執行Map過程，Map過程的輸出key/value類型是Text.class與Text.class，最後一個參數是作業對象。特別注意：這里聲明的是一個最簡單的掃描讀入對象scan，進行表掃描讀取數據，其中scan可以配置參數，這里為了例子簡單不再詳述，用戶可自行嘗試。詳細源碼請參考：WordCountHbaseReader\src\com\zonesion\hbase\WordCountHbaseReader.javapublicstaticvoidmain(String[]args)throwsException{Stringtablename="wordcount";Configurationconf=HBaseConfiguration.create();conf.set("hbase.zookeeper.quorum","Master");String[]otherArgs=newGenericOptionsParser(conf,args).getRemainingArgs();if(otherArgs.length!=1){System.err.println("Usage:WordCountHbaseReader");System.exit(2);}Jobjob=newJob(conf,"WordCountHbaseReader");job.setJarByClass(WordCountHbaseReader.class);//設置任務數據的輸出路徑；FileOutputFormat.setOutputPath(job,newPath(otherArgs[0]));job.setRecerClass(WordCountHbaseReaderRece.class);Scanscan=newScan();TableMapReceUtil.initTableMapperJob(tablename,scan,WordCountHbaseReaderMapper.class,Text.class,Text.class,job);//調用job.waitForCompletion(true)執行任務，執行成功後退出；System.exit(job.waitForCompletion(true)?0:1);}5、部署運行1）啟動Hadoop集群和Hbase服務[hadoop@K-Master~]$start-dfs.sh#啟動hadoopHDFS文件管理系統[hadoop@K-Master~]$start-mapred.sh#啟動hadoopMapRece分布式計算服務[hadoop@K-Master~]$start-hbase.sh#啟動Hbase[hadoop@K-Master~]$jps#查看進程

導航:首頁 > 源碼編譯 > hbase查找數據演算法

hbase查找數據演算法

與hbase查找數據演算法相關的資料