深入淺出ClassLoader(譯)

中介軟體小哥發表於2016-01-14

該文章來自阿里巴巴技術協會(ATA)精選集

你真的瞭解ClassLoader嗎?

這篇文章翻譯自zeroturnaround.com的 Do You Really Get Classloaders? ,融入和補充了筆者的一些實踐、經驗和樣例。本文的例子比原文更加具有實際意義,文字內容也更充沛一些,非常感謝作者 Jevgeni Kabanov 能夠共享如此優秀的文件。

為什麼你需要了解和懼怕ClassLoader

    ClassLoader在Java語言中佔據了核心地位,Java應用伺服器,OSGi,以及大量的網路框架,它們大多數都用到了ClassLoader。如果在使用過程中出現了類載入錯誤,你能解決它嗎?

    我們將從JVM和開發者兩個角度講述ClassLoader,將會選擇一些典型的案例,然後演示如何解決它們。NoClassDefFoundError,LinkageError等很多錯誤都會有特定的表徵,我們分析每個例子,然後進行解決。

進入ClassLoader

    每個ClassLoader物件都是一個java.lang.ClassLoader的例項。每個Class物件都被這些ClassLoader物件所載入,通過繼承java.lang.ClassLoader可以擴充套件出自定義ClassLoader,並使用這些自定義的ClassLoader對類進行載入。

    先大體瞭解一下ClassLoader的API:

package java.lang;

public abstract class ClassLoader {
     public Class loadClass(String name);

     protected Class defineClass(byte[] b);

     public URL getResource(String name);

     public Enumeration getResources(String name);

     public ClassLoader getParent();
}

    最重要的是ClassLoader的loadClass方法,它接受一個全類名,然後返回一個Class型別的例項。

    defineClass方法接受一組位元組,然後將其具體化為一個Class型別例項,它一般從磁碟上載入一個檔案,然後將檔案的位元組傳遞給JVM,通過JVM(native 方法)對於Class的定義,將其具體化,例項化為一個Class型別例項。

    getParent方法返回其parent ClassLoader。

    getResourcegetResources方法,從給定的repository中查詢URLs,同時它們也具備類似loadClass一樣的代理機制,我們可以將loadClass視為:defineClass(getResource(name).getBytes())

    Java由於其晚繫結和“解釋型”的特性,型別的載入是到最晚才進行,一個型別直到被呼叫建構函式、靜態方法或者在欄位上使用時才會被載入。

    考慮如下程式碼:

public class A {
     public void doSomething() {
          B b = new B();
          b.doSomethingElse();
     }
}

    程式碼:B b = new B();等同於 B b = Class.forName(“B”, false, A.class.getClassLoader()).newInstance();

    這代表著,在型別A中使用到的型別,將由載入了型別A的類載入器來進行載入。

ClassLoader繼承體系

    當啟動一個JVM時,bootstrap 類載入器就會載入java的核心類,例如:rt.jar中的類。bootstrap 類載入器是其他類載入器的parent,它使唯一一個沒有parent的類載入器。

    接下來是extension 類載入器,它以bootstrap 類載入器作為parent,它用來從Java系統變數java.ext.dir中的jar包中載入類的。

    第三個,也是最重要的一個就是開發者使用的system classpath 類載入器 。它是extension 類載入器 的child,它用來從Java系統變數java.class.path下面載入類,可以通過 -classpath 來指定這個位置。

    注意類載入器的體系並不是“繼承”體系,而是一個“委派”體系。大多數類載入器首先會到自己的parent中查詢類或者資源,如果找不到,才會在自己的本地進行查詢。事實上,類載入器被定義載入哪些在parent中無法載入到的類,這樣在較高層級的類載入器上的型別能夠被“賦值”為較低類載入器載入的型別。

    類載入器的委託行為動機是為了避免相同的類被載入多次。回到1995年,Java的主要方向被放在Applet上,那時候網路頻寬優先,所以程式中的類直到用時才會被載入。但是事實上,Java在伺服器端展示了強勁的能力,但是伺服器端要求類載入器能夠反轉委派原則,也就是先載入本地的類,如果載入不到,再到parent中載入。

    JavaEE的 委派模型

Jave_EE_delegation_model

    每個方塊都是一個類載入器,JavaEE規範推薦每個模組的類載入器先載入本類載入的內容,如果載入不到才回到parent類載入器中嘗試載入。

    反轉委派原則的原因是應用伺服器中所攜帶的類庫並不是應用所期待的,也許不適合應用開發者,一個常見的例子就是log4j的依賴在容器和不同的應用中都存在,但是它們的版本大都不同。

    Tomcat的 類載入順序

Tomcat_WebappClassLoader_loadClass

    在Tomcat中,預設的行為是先嚐試在Bootstrap和Extension中進行型別載入,如果載入不到則在WebappClassLoader中進行載入,如果還是找不到則在Common中進行查詢。

NoClassDefFoundError

    NoClassDefFoundError是在開發JavaEE程式中常見的一種問題。該問題會隨著你所使用的JavaEE中介軟體環境的複雜度以及應用本身的體量變得更加複雜,尤其是現在的JavaEE伺服器具有大量的類載入器。

    在JavaDoc中對NoClassDefFoundError的產生是由於JVM或者類載入器例項嘗試載入型別的定義,但是該定義卻沒有找到,影響了執行路徑。換句話說,在編譯時這個類是能夠被找到的,但是在執行時卻沒有找到。

    這一刻IDE是沒有出錯提醒的,但是在執行時卻出現了錯誤。

    看看如下示例:

/**
 * @author weipeng2k 2015年3月27日 下午5:15:15
 */
@WebServlet(name = "NoClassDefFoundErrorServlet", urlPatterns = "/noClassDefFoundError.do")
public class NoClassDefFoundErrorServlet extends HttpServlet {

    private static final long serialVersionUID = 61585757018374721L;

    @Override
    protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
        resp.getWriter().println(TestCase.class.toString());
    }
}

    在看pom.xml中對於依賴的定義:

<dependencies>
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>3.8.1</version>
        <scope>provided</scope>
    </dependency>
    <dependency>
        <groupId>javax.servlet</groupId>
        <artifactId>servlet-api</artifactId>
        <version>3.0</version>
        <scope>provided</scope>
    </dependency>
    <dependency>
        <groupId>org.springframework</groupId>
        <artifactId>spring</artifactId>
        <version>2.5.6</version>
    </dependency>
</dependencies>

    其中對於junit的依賴是provided級別的,這裡是為了能簡化錯誤出現的條件。可以看到,在NoClassDefFoundErrorServlet中,使用了junit.jar中的TestCase,但是junit.jar在WEB-INF/lib中卻沒有,從而導致WebappClassLoader在進行載入TestCase時無法找到,從而丟擲NoClassDefFoundError。我們需要從最終的war包中確定是否存在這個類,而不是在IDE中進行搜尋。

NoSuchMethodError

    在另一個場景中,我們可能遇到了另一個錯誤,也就是NoSuchMethodError。

    NoSuchMethodError代表這個型別確實存在,但是一個不正確的版本被載入了。為了解決這個問題我們可以使用 ‘-verbose:class’ 來判斷該JVM載入的到底是哪個版本。

    看如下示例:

import org.springframework.beans.factory.BeanFactoryUtils;

/**
 * @author weipeng2k 2015年3月31日 上午9:09:58
 */
@WebServlet(name = "NoSuchMethodErrorServlet", urlPatterns = { "/noSuchMethodError.do" })
public class NoSuchMethodErrorServlet extends HttpServlet {

    private static final long serialVersionUID = 1699609060417354821L;

    @Override
    protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
        BeanFactoryUtils.isGeneratedBeanName("xxx");

        resp.getWriter().println("done.");
    }
}

    在doGet方法中呼叫了BeanFactoryUtils.isGeneratedBeanName(”xxx“);,看一下專案的pom依賴。

<dependencies>
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.11</version>
        <scope>provided</scope>
    </dependency>
    <dependency>
        <groupId>javax.servlet</groupId>
        <artifactId>servlet-api</artifactId>
        <version>3.0</version>
        <scope>provided</scope>
    </dependency>
    <dependency>
        <groupId>org.springframework</groupId>
        <artifactId>org.springframework.context</artifactId>
        <version>3.0.5.RELEASE</version>
        <scope>provided</scope>
    </dependency>
    <dependency>
        <groupId>org.apache.mina</groupId>
        <artifactId>mina-core</artifactId>
        <version>2.0.7</version>
    </dependency>
    <dependency>
        <groupId>com.alibaba.external</groupId>
        <artifactId>sourceforge.spring</artifactId>
        <version>2.0.7</version>
    </dependency>
</dependencies>

    這裡為了方便觀察到結果,將org.springframework.context的 scope 改為了 provided ,目的是不將其打包入war包,而只是使用了sourceforge.spring中定義的2.0.7版本,這個版本肯定沒有isGeneratedBeanName(String name)方法,但是在IDE中,由於應用依賴到了高版本的spring從而能夠編譯通過,但是在執行時卻沒有那麼好運了。這種錯誤,常見於 Maven座標 的變動,使得應用依賴了多個 相同內容,不同版本 的jar包,以致在執行時選擇了非期望的版本。

ClassCastException

    NoClassDefFoundError和NoSuchMethodError是兩個在 JavaEE 環境中經常出現的問題,這些問題需要 開發人員瞭解問題的本質,才能夠被 從容 的處理。

    下面我們看一下ClassCastException,在一個類載入器的情況下,一般出現這種錯誤都會是在轉型操作時,比如:A a = (A) method();,很容易判斷出來method()方法返回的型別不是型別A,但是在 JavaEE 多個類載入器的環境下就會出現一些難以定位的情況。

    看如下示例:

package com.murdock.classloader.servlet;

import java.io.File;
import java.io.IOException;
import java.net.URL;

import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import org.apache.mina.proxy.utils.MD4;

import com.murdock.classloader.CachedClassLoader;

/**
 * @author weipeng2k 2015年4月4日 下午6:00:54
 */
@WebServlet(name = "ClassCastExceptionServlet", urlPatterns = "/classCastException.do")
public class ClassCastExceptionServlet extends HttpServlet {
    private static final long   serialVersionUID    = -8959000121057369987L;

    @Override
    protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
        String localFirst = req.getParameter("localFirst");
        CachedClassLoader cl = null;
        cl = new CachedClassLoader(
                new URL[] { new File(
                        "/Users/weipeng2k/.m2/repository/org/apache/mina/mina-core/2.0.7/mina-core-2.0.7.jar").toURI()
                        .toURL() }, this.getClass().getClassLoader());
        if ("false".equals(localFirst)) {
            cl.setLocalFirst(false);
        }
        try {
            Class<?> klass = cl.loadClass("org.apache.mina.proxy.utils.MD4");
            MD4 md4 = (MD4) klass.newInstance();

            resp.getWriter().println(md4);

        } catch (Exception ex) {
            throw new RuntimeException(ex);
        } finally {
            cl.close();
        }

    }
}

    在ClassCastExceptionServlet中,構建了一個CachedClassLoader,利用這個ClassLoader載入org.apache.mina.proxy.utils.MD4,然後反射呼叫構造該類的例項,將其賦給MD4,最後將其列印到瀏覽器。

     請求URL :http://localhost:8080/classCastException.do

    響應頁面,出現錯誤:

java.lang.RuntimeException: java.lang.ClassCastException: org.apache.mina.proxy.utils.MD4 cannot be cast to org.apache.mina.proxy.utils.MD4
    com.murdock.classloader.servlet.ClassCastExceptionServlet.doGet(ClassCastExceptionServlet.java:42)
    javax.servlet.http.HttpServlet.service(HttpServlet.java:622)
    javax.servlet.http.HttpServlet.service(HttpServlet.java:729)
    org.apache.tomcat.websocket.server.WsFilter.doFilter(WsFilter.java:52)

     請求URL :http://localhost:8080/classCastException.do?localFirst=false

    響應頁面,輸出正常:

org.apache.mina.proxy.utils.MD4@401c8af5

    請求的URL加上了localFirst=false就可以正常的輸出,而它也就是在CachedClassLoder上設定了一下,為什麼有這麼大的差別。org.apache.mina.proxy.utils.MD4全類名一致,為什麼會出現ClassCastException呢?

    在JVM中,如何確定一個型別例項?答:全類名嗎?不是,是類載入器加上全類名。在JVM中,型別被定義在一個叫SystemDictionary 的資料結構中,該資料結構接受類載入器和全類名作為引數,返回型別例項。

     SystemDictionary 如圖所示:

JVM_system_dictionary

    型別載入時,需要傳入類載入器和需要載入的全類名,如果在 SystemDictionary 中能夠命中一條記錄,則返回class 列上對應的型別例項引用,如果無法命中記錄,則會呼叫loader.loadClass(name);進行型別載入。

    這裡不會更加深入的介紹 SystemDictionary 如何進行型別載入的過程,而是需要指出 JVM中確定一個型別的座標是通過類載入器和全類名做到的 。回想一下MD4 md4 = (MD4) klass.newInstance();,是不是代表著等式兩邊的MD4是不同的類載入器載入的呢?那問題一定出在 CachedClassLoader 上。這裡貼一下loadClass(String name)方法的部分邏輯。

     CachedClassLoader 的loadClass邏輯:

if (localFirst) {
    try {
        clazz = findClass(name);
        if (clazz != null) {
            return clazz;
        }
    } catch (ClassNotFoundException ex) {

    }
    return super.loadClass(name);
} else {
    return super.loadClass(name);
}

    可以看到在 localFirst 為true時,該類載入器會首先載入自身 repository 中的型別,如果載入不到,則會嘗試預設的載入機制進行載入,也就是parent優先載入。這樣就可以解釋MD4 md4 = (MD4) klass.newInstance();,等式左邊MD4 md4,這個型別是WebappClassLoader.org.apache.mina.proxy.utils.MD4,等式右邊klass.newInstance()返回的型別是CachedClassLoader.org.apache.mina.proxy.utils.MD4,二者並不是同一個型別,所以無法完成型別轉換,最終丟擲 ClassCastException 。而當 localFirst 為false時,該類載入器遵循parent優先,從而會先委派給WebappClassLoader進行載入,當然轉型也就不會有問題了。

    在傳統的雙親委派模型下,這種 ClassCastException 是不會發生的,因為它的載入順序杜絕了出現這種問題的可能,而在 JavaEE 環境下,每個資源模組(比如一個war包)都優先使用自身的資源,正因為突破了雙親委派模型, 奇怪的問題 就發生了。

LinkageError

    有時候事情會變得更糟,和 ClassCastException 本質一樣,載入自不同位置的*相同類*在同一段邏輯(比如:方法)中互動時,會出現 LinkageError 。

    我們先看一下出錯的異常資訊,然後分析一下它產生的條件和原因:

java.lang.LinkageError: loader constraint violation: when resolving overridden method "com.murdock.classloader.linkageerror.Param2.generate()Lcom/murdock/classloader/linkageerror/Param2;" the class loader (instance of com/murdock/classloader/linkageerror/LinkageErrorTest$1) of the current class, com/murdock/classloader/linkageerror/Param2, and its superclass loader (instance of sun/misc/Launcher$AppClassLoader), have different Class objects for the type com/murdock/classloader/linkageerror/Param2 used in the signature
    at java.lang.Class.getDeclaredConstructors0(Native Method)
    at java.lang.Class.privateGetDeclaredConstructors(Class.java:2671)
    at java.lang.Class.getConstructor0(Class.java:3075)
    at java.lang.Class.newInstance(Class.java:412)
    at com.murdock.classloader.linkageerror.LinkageErrorTest.test(LinkageErrorTest.java:34)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:497)
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:47)
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12)
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:44)
    at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:17)

    看到一堆出錯資訊,但是不要緊張,慢慢的讀一下出錯資訊,這種錯誤一般會讓你直覺感覺不會出現。loader constraint violation表示類載入器衝突了,這句話暗示: 相同的類,由不同的ClassLoader載入,但是在這裡遇到了when resolving overridden method "com.murdock.classloader.linkageerror.Param2.generate()Lcom/murdock/classloader/linkageerror/Param2;"表示在解析那條語句出現了問題,這裡表示在Param2.generate()方法的解析過程中出現了問題。the class loader (instance of com/murdock/classloader/linkageerror/LinkageErrorTest$1) of the current class, com/murdock/classloader/linkageerror/Param2,表示解析的語句所在的型別Param2LinkageErrorTest$1類載入器載入的。and its superclass loader (instance of sun/misc/Launcher$AppClassLoader), have different Class objects for the type com/murdock/classloader/linkageerror/Param2 used in the signature表示Param2的超類Param中被覆蓋的方法返回的型別Param2Launcher$AppClassLoader載入。

    Linkage在常規情況下非常難以製造,只有在多個類載入器互動時才有可能出現,下面看一下問題程式碼。出現問題的類和引數:

package com.murdock.classloader.linkageerror;

/**
 * @author weipeng2k 2015年4月28日 上午10:04:26
 */
public class HandleUtils {
    public void m(Param param) {
        param.generate();
    }

}

package com.murdock.classloader.linkageerror;

public class Param {
    public Param2 generate() {
        return new Param2();
    }
}

package com.murdock.classloader.linkageerror;

public class Param2 extends Param {
    public Param2 generate() {
        return new Param2();
    }
}

    測試用例如下:

    @Test
    public void test() throws Exception {

        // cl1在載入HandleUtils和Param時將會使用AppClassLoader
        URLClassLoader cl1 = new URLClassLoader(new URL[] {new File("target/test-classes").toURI().toURL()}, null) {

            @Override
            public Class<?> loadClass(String name) throws ClassNotFoundException {
                if ("com.murdock.classloader.linkageerror.HandleUtils".equals(name)) {
                    return ClassLoader.getSystemClassLoader().loadClass(name);
                }

                if ("com.murdock.classloader.linkageerror.Param".equals(name)) {
                    return ClassLoader.getSystemClassLoader().loadClass(name);
                }

                return super.loadClass(name);
            }

        };

        ClassLoader.getSystemClassLoader().loadClass("com.murdock.classloader.linkageerror.Param2");
        HandleUtils hu = (HandleUtils) cl1.loadClass("com.murdock.classloader.linkageerror.HandleUtils").newInstance();
        hu.m((Param) cl1.loadClass("com.murdock.classloader.linkageerror.Param2").newInstance());
    }

     LinkageError 需要觀察哪個類被不同的類載入器載入了,在哪個方法或者呼叫處發生(交匯)的,然後才能想解決方法,解決方法無外乎兩種。第一,還是不同的類載入器載入,但是相互不再交匯影響,這裡需要針對發生問題的地方做一些改動,比如更換實現方式,避免出現上述問題;第二,衝突的類需要由一個Parent類載入器進行載入。**LinkageError** 和**ClassCastException** 本質是一樣的,載入自不同類載入器的型別,在同一個類的方法或者呼叫中出現,如果有轉型操作那麼就會拋 ClassCastException ,如果是直接的方法呼叫處的引數或者返回值解析,那麼就會產生 LinkageError 。

類載入器問題對照表

    遇到類載入器問題時,可以嘗試使用下面的表格進行問題排查。

類找不到 載入了不正確的類 多於一個類被載入
ClassNotFoundException NoClassDefFoundError IncompatibleClassChangeError NoSuchMethodError NoSuchFieldError IllegalAccessError ClassCastException LinkageError
IDE class lookup (Ctrl+Shift+T in Eclipse) 或者 find . -name “*.jar” -exec jar -tf {} ; grep DateUtils 使用middelware-detector 通過在啟動引數中加-verbose:class,觀察載入的類來自哪個jar包 使用middelware-detector

使用Middleware-Detector進行類查詢

    出現了 ClassNotFoundException 或者 NoClassDefFoundError ,需要檢查一下程式的classpath下面是否存在你所預想的類。這時可以使用Middleware-Detector工具進行類查詢,該工具是 中介軟體團隊 開發的一款中介軟體問題診斷工具,當然也包括了許多支援性質的工具。

    下面我們使用Middleware-Detector進行類查詢,比如我們要查詢apache的Utils,我們懷疑這個類在classpath下找不到。

    啟動middleware-detector,檢視 Pandora 提供的自定義檢查器,目前編號為1的Pandora自定義檢查器就是進行classpath下的指定類或者介面的查詢工作。

md_start_pandora

    配置classpath目錄以及需要查詢的類名,這裡類名支援 * 號進行模糊匹配。可以看到設定當前的classpath目錄到了WEB-INF/lib 下面,然後找尋*apache*comm*A*Utils是否存在,如果能夠找到則會輸出到終端,這裡就找到了ArchiveUtils和ArrayUtils兩個符合要求的類。如果無法找到,那麼就可能是pom.xml的依賴配置不正確了,需要檢查一下。

md_pandora_customcheck

使用Middleware-Detector進行檢查類衝突

    出現了 NoSuchMethodError 或者 NoSuchFieldError ,這時一般是應用的classpath下包含了多個包含了想同類的jar包,而很不幸的載入到了 不正確 的jar包。

    我們可以通過使用Middleware-Detector的類查詢進行定位,但是不能發現一個修復一個,這裡Middleware-Detector提供了一個檢查classpath下有衝突jar包的功能。只需要設定classpath的目錄,然後執行cc --check tomcat#1即可。有衝突的jar就需要自己在pom.xml裡面進行仲裁或者排除了。

md_tomcat_conflict


相關文章