Hadoop與HBase中遇到的問題(續)java.io.IOException: Non-increasing Bloom keys異常

一隻鳥的天空發表於2014-05-30

在使用Bulkload向HBase匯入資料中, 自己編寫Map與使用KeyValueSortReducer生成HFile時, 出現了下面的異常:

java.io.IOException: Non-increasing Bloom keys: 201301025200000000000003520000000000000500 after 201311195100000000000000010000000000001600

   at org.apache.hadoop.hbase.regionserver.StoreFile$Writer.appendGeneralBloomfilter(StoreFile.java:869)
   at org.apache.hadoop.hbase.regionserver.StoreFile$Writer.append(StoreFile.java:905)
   at org.apache.hadoop.hbase.mapreduce.HFileOutputFormat$1.write(HFileOutputFormat.java:180)
   at org.apache.hadoop.hbase.mapreduce.HFileOutputFormat$1.write(HFileOutputFormat.java:136)
   at org.apache.hadoop.mapred.ReduceTask$NewTrackingRecordWriter.write(ReduceTask.java:586)
   at org.apache.hadoop.mapreduce.TaskInputOutputContext.write(TaskInputOutputContext.java:80)
   at org.apache.hadoop.hbase.mapreduce.KeyValueSortReducer.reduce(KeyValueSortReducer.java:53)
   at org.apache.hadoop.hbase.mapreduce.KeyValueSortReducer.reduce(KeyValueSortReducer.java:36)
   at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:177)
   at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:649)
   at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:418)
   at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
   at java.security.AccessController.doPrivileged(Native Method)
   at javax.security.auth.Subject.doAs(Subject.java:396)
   at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1190)

at org.apache.hadoop.mapred.Child.main(Child.java:249)

該異常在原始碼的StoreFile類中, 即在使用StoreFile類生成HFile檔案時丟擲異常, 根據控制檯異常資訊可以知道異常出現在原始碼StoreFile.java:905行處,此處是append方法,該方法呼叫appendGeneralBloomfilter方法,生成Bloom key, 原始碼為:

public static class HFileGenerateMapper extends
			Mapper<LongWritable, Text, ImmutableBytesWritable, KeyValue> {
		private static int familyIndex = 0;
		private static Configuration conf = null;
		private static MyMD5 md5 = new MyMD5();
		@Override
		protected void setup(Context context) throws IOException,
				InterruptedException {
			conf = context.getConfiguration();
			familyIndex = conf.getInt("familyIndex",0);
		}
		@Override
		protected void map(LongWritable key, Text value, Context context)
				throws IOException, InterruptedException {
			ImmutableBytesWritable mykey = new ImmutableBytesWritable(
					value.toString().split(",")[0].getBytes());
			List<KeyValue> list = null;
			list = createKeyValue(value.toString());
			Iterator<KeyValue> it = list.iterator();
			while (it.hasNext()) {
				KeyValue kv = new KeyValue();
				kv = it.next();
				if (kv != null) {
					  context.write(mykey, kv);
				}
			}

		}
		/**
		 * a.CITY_NO,to_char(DT,'yyyy-MM-dd'),DATA_TYPE,E0,E1,E2,E3,E4,E5,
		 * MEASUREPOINTID,TRANSFORMERID,ZONEID,CAPACITY
		 * @param str
		 * @return
		 */
		private List<KeyValue> createKeyValue(String str) {
			List<KeyValue> list = new ArrayList<KeyValue>(CONSTANT_HBASE.TB2_FNColNames[familyIndex].length);
			String[] values = str.toString().split(",");
			String[] qualifiersName = CONSTANT_HBASE.TB2_FNColNames[familyIndex];
			for (int i = 0; i < qualifiersName.length; i++) {
				//需要作為rowKey的各個欄位字串組成RowKey
				String rowkey = values[1]+values[0]+values[11]+values[12];
				//加上32位的MD5
				rowkey += md5.getMD5Code(rowkey);
				String family = CONSTANT_HBASE.TB2_FamilyNames[familyIndex];
				String qualifier = qualifiersName[i];
			    String value_str = values[i+CONSTANT_HBASE.TB2_FNColIndex[familyIndex]-1];

				KeyValue kv = new KeyValue(Bytes.toBytes(rowkey),
						Bytes.toBytes(family), Bytes.toBytes(qualifier),
						CONSTANT_HBASE.timeStamp, Bytes.toBytes(value_str));
				list.add(kv);
			}
			return list;
		}
	}

關鍵出錯的那一句在

ImmutableBytesWritable rowkey = new ImmutableBytesWritable(value.toString().split(",")[0].getBytes());

因為最終匯入RowKey的是由多個欄位的字串+32位的MD5值拼接而成的,但是生成ImmutableBytesWritable mykey卻只用到第一個欄位的字串,而這個key是用來全域性排序用的,所以需要mykey與KeyValue kv 的rowkey相等, 於是更改方法便是將map方法程式碼改成如下:

@Override
		protected void map(LongWritable key, Text value, Context context)
				throws IOException, InterruptedException {
			List<KeyValue> list = null;
			list = createKeyValue(value.toString());
			Iterator<KeyValue> it = list.iterator();
			while (it.hasNext()) {
				KeyValue kv = new KeyValue();
				kv = it.next();
				if (kv != null) {
					  <span style="color:#FF0000;">context.write(new ImmutableBytesWritable(kv.getKey()), kv);</span>
				}
			}

		}

執行之後成功了,可以通過http://localhost:50030/jobtracker.jsp檢視任務執行狀態.

flash中呼叫XML遇到的中文顯示異常問題
2019-01-07
XML
SpringBoot專案中遇到的異常
2019-02-15
Spring Boot
SpringBoot中SpringSecurity 中不能丟擲異常UserNameNotFoundException 問題解析與處理
2019-01-19
Spring BootGseException
異常問題排查之旅
2019-04-11
微服務異常問題
2024-07-04
微服務
前端開發中遇到的一些問題----持續更新
2019-04-29
前端
workerman開發過程中遇到的一些常見的問題與解決方法
2021-12-03
Python異常 ValueError的問題詳解
2023-04-21
PythonError
.net異常處理的效能問題
2020-10-28
laravel使用中遇到的問題
2019-02-16
Laravel
Hodoop配置中遇到的問題
2018-06-14
OdooOOP
工作中遇到的問題
2024-04-16
javaweb中自己遇到的問題
2020-08-27
JavaWeb
10.Java異常問題
2018-12-26
Java
JavaCV與OpenCV的區別和使用中遇到的問題
2020-09-16
JavaOpenCV
總結Java開發面試常問的問題，持續更新中~
2018-06-04
Java面試
Redis 中 Keys 與 Scan 的使用
2019-03-22
Redis
rdpclip 遠端桌面協議常遇到的問題
2019-02-14
協議
Hadoop3系列——(八)Java訪問Hbase
2020-10-07
HadoopJava
loadrunner學習中遇到的問題
2019-04-11
@UpdateProvider註解中遇到的問題
2018-11-09
IDE
weex學習中遇到的問題
2018-04-25
kafka 運維中遇到的問題
2020-12-08
Kafka運維
異常處理遇到過的那些坑
2019-01-31
學妹問我：我遇到了OutOfMemoryError異常怎麼辦？
2020-09-26
Error
【專案中遇到的zookeeper的問題】
2018-05-20
Docker實踐過程中遇到的一些問題總結(持續更新中)
2019-05-06
Docker
使用@FeignClient中的fallback屬性處理介面呼叫異常問題
2024-03-13
client
Hbase面試題(持續更新)
2020-11-28
面試題
Apiclude中Talkingdata模組異常日誌不能收集問題
2019-02-26
API
URL重寫（rewrite）的具體實現與異常問題解決
2021-09-09
一個SMMU記憶體訪問異常的問題
2024-08-10
記憶體
pip安裝時遇到的問題集錦，持續更新！
2018-09-11
用 Arthas 神器來診斷 HBase 異常程式
2020-09-01
【Hadoop】HBase元件配置
2022-04-16
Hadoop元件
實際專案中遇到的問題
2019-03-27
安裝 Laravel Mix 中遇到的問題
2018-09-27
Laravel
Vue使用中遇到的程式碼問題
2018-07-28
Vue
爬蟲過程中遇到的問題
2024-04-27
爬蟲

Hadoop與HBase中遇到的問題(續)java.io.IOException: Non-increasing Bloom keys異常

相關文章