Oracle JOB異常中斷原因分析

maohaiqing0304發表於2015-07-13


標題: Oracle JOB異常中斷原因分析

作者:lōττéry©版權所有[文章允許轉載,但必須以連結方式註明源地址,否則追究法律責任.]


註釋:
  今天研發同事找我確認PKG_WMS.proc_TaskMain儲存的job是否還在執行,竟發現dba_jobs.NEXT_DATE=4000/1/1.如下看看究竟原因吧~


JOB資訊:

SQL> select JOB,SCHEMA_USER,LAST_DATE,LAST_SEC,NEXT_DATE,NEXT_SEC,BROKEN,FAILURES,INTERVAL,WHAT from dba_jobs where WHAT like 'PKG_WMS.%';
 
 JOB    SCHEMA_USER   LAST_DATE   LAST_SEC     NEXT_DATE   NEXT_SEC    BROKEN   FAILURES  INTERVAL           WHAT                                                         
---------- ------------------------------ ------------------------------ ---------------------------------------------
 1543      fws        2015/7/13   13:00:57     4000/1/1    00:00:00    Y          16     sysdate+1/1440   PKG_WMS.proc_TaskMain;   


引數:
BROKEN   : 中斷標記 ,'N啟動、Y中斷' --> DBMS_JOBS.BROKEN(job_id,TRUE/FALSE); 停止/啟動job,隨後需要COMMIT;否則設定失效
FAILURES  :錯誤次數
last_datejob上次成功執行的時間
next_datejob下次執行的時間 (受last_date和interval的影響)
total_timejob執行的總時間 (每次執行的時間累加)
this_datejob正在執行的時間 (如果查詢時job正在執行則有值 )


*** 分析:
*** 若定時任務what儲存過程呼叫出現異常(例如:空間不足、儲存過程本身編寫問題..)
*** job會自動嘗試16次連續失敗後再將broken狀態改為Y,並將next-date改為 “4000-1-1”,只能手動exec dbms_job.run(:id);來啟動job;
    譬如:儲存過程p1,隨便註釋begin/end行,體現語法問題,job會正常按照p1儲存過程的job執行16次,再broken中斷job,
         若到10次,儲存過程更改為正確狀態,錯誤次數將改為0,job改為正常;

*** 判斷問題方法
1、手動call儲存來判斷是什麼問題,若call 儲存時未報錯,說明之前該儲存有問題過,job嘗試執行已超過16次,需要手動exec dbms_job.run(:id);啟動job;
2、檢視alert日誌,oracle job異常會記錄到告警日誌;


嘗試啟動...

SQL> begin
  2     dbms_job.run(1543);
  3    end;
  4  /

ORA-12011: 無法執行 1 作業
ORA-06512: 在 "SYS.DBMS_IJOB", line 648
ORA-06512: 在 "SYS.DBMS_JOB", line 284
ORA-06512: 在 line 2
 
SQL>  


報錯,再看下alert 內容(方案2):
1、
ORA-12012 : 自動執行作業 1543 出錯
ORA-12899 : 列 "FWS"."RECODE_ERROR_MSG"."ERROR_MSG" 的值太大 (實際值 : 704, 最大值: 500 )
ORA-06512 : 在 "FWS.PROC_WRITEERRMSG" , line 22
ORA-06512 : 在 "FWS.PKG_WMS" , line 132
ORA-01688 : 表FWS.RECODE_ERROR_MSG 分割槽 SYS_P6181 無法透過 8192 (在表空間 TBS_WMS_CITY_JK_DATA 中) 擴充套件
ORA-06512 : 在 "FWS.PROC_WRITEERRMSG" , line 22
ORA-06512 : 在 "FWS.PKG_WMS" , line 514
ORA-01688 : 表FWS.RECODE_ERROR_MSG 分割槽 SYS_P6181 無法透過 8192 (在表空間 TBS_WMS_CITY_JK_DATA 中) 擴充套件
ORA-06512 : 在 "FWS.PROC_WRITEERRMSG" , line 22
ORA-06512 : 在 "FWS.PKG_WMS" , line 502
ORA-01400 : 無法將 NULL 插入 ("FWS"."BILL_RECEIPT_CITY"."CREATOR" )
ORA-06512 : 在 line 1
ORA-1688 : unable to extend table FWS.RECODE_ERROR_MSG partition SYS_P6181 by 128 in   tablespace TBS_WMS_CITY_JK_DATA
ORA-1688 : unable to extend table FWS.RECODE_ERROR_MSG partition SYS_P6181 by 8192 in  tablespace TBS_WMS_CITY_JK_DATA
ORA-1688 : unable to extend table FWS.RECODE_ERROR_MSG partition SYS_P6181 by 128 in   tablespace TBS_WMS_CITY_JK_DATA
ORA-1688 : unable to extend table FWS.RECODE_ERROR_MSG partition SYS_P6181 by 8192 in  tablespace TBS_WMS_CITY_JK_DATA
2、 
ORA-12012: 自動執行作業 26 出錯
ORA-06550: 第 1 行, 第 96 列:
PLS-00905: 物件 LOTTERY.P_LOCK_CHECK_HD 無效
ORA-06550: 第 1 行, 第 96 列:
PL/SQL: Statement ignored
Mon Jul 13 14:39:55 2015
Errors in file /u01/app/oracle/diag/rdbms/bjcc/ccem01/trace/ccem01_j001_36869.trc:

 
按照alert log 解決即可..
***1、空間不足是因為RECODE_ERROR_MSG表每天1億資料量增加導致..truncate table RECODE_ERROR_MSG即可; 表暴漲原因 Oracle 歸檔暴漲分析 
***2、自己測試將儲存置失效的報錯資訊;
 
 


  【源於本人筆記】 若有書寫錯誤,表達錯誤,請指正...



此條目發表在 Oracle 分類目錄。將固定連線加入收藏夾。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28602568/viewspace-1731805/,如需轉載,請註明出處,否則將追究法律責任。

相關文章