LIME (국소적 대리 모형 기반 설명)

@7/27/2022

Local Interpretable Model-agnostic Explanation (Ribeiro 2016)

지역적으로 근사하는 대리 모델(surrogate model)을 생성하여 복잡한 모델을 설명하는 기법

1. Overview

특징

•

Model-agnostic: 모델 유형에 상관 없이 적용 가능한 기법

•

복잡도가 높은 원본 모델로부터 지역적으로 근사하는 단순한 대리 모델을 생성하여 설명

◦

Linear regression 모델의 경우, 회귀계수를 통해 설명함. 또한, Decision tree 의 경우 노드의 분류 규칙을 통해 설명

(위) 모델의 복잡한 결정 경계 (아래) 특정 인스턴스를 중심으로 확대한 화면. 복잡한 결정 경계를 선형으로 근사하는 대리 모델의 결정 경계를 확인할 수 있다. (출처: Mattias Lee)

•

다양한 데이터 유형에 적용 가능하며, 별도의 시각화 결과를 제공

LIME 설명 예: 이미지 분류

LIME 설명 예: 자연어 처리(재난 관련 텍스트 분류)

LIME 설명 예: Tabular 데이터(와인 품질 예측)

LIME 기법의 유형

개별 인스턴스를 중심으로 설명하기 위한 기본 LIME 알고리즘과 다수의 인스턴스들을 설명함으로써 모델의 신뢰성을 평가하기 위한 SP-LIME(Submodular Pick for LIME) 알고리즘으로 구성됨

2. Main Concepts

2. 1 Fidelity-Interpretability Trade-off

\xi=\argmin_{g \in G}\mathcal{L}(f,g,\pi_{x})+\Omega(g)

\mathcal{L}(f,g,\pi_x)

: Locality-aware loss 로서 원본 모델의 예측과 생성한 설명 모델의 예측 사이의 오차를 통해 설명 모델이 원본 모델에 근사하는 정도를 평가

•

fff: 원본 모델

•

GGG: LIME 에 의해 생성된 설명 가능한 모델들의 집합

◦

예: 선형 모델(Linear / Logistics regression), Decision trees, Falling rule lists

◦

g∈Gg\in Gg∈G: fff 를 근사하는 설명 모델

•

xxx: 설명하고자 하는 특정 인스턴스

•

zzz: xxx 근처에 임의로 생성한 인스턴스(perturbed)

◦

z′z'z′: 생성된 인스턴스 zzz가 설명 모델 ggg 에 맞게 차원이 축소된 버전

설명하고자 하는 인스턴스 x와 이를 위해 생성한 인스턴스 z (출처: DMQA)

•

πx\pi_xπx​: 설명 대상인 인스턴스 xxx와 생성한 인스턴스 zzz 사이의 거리 함수. 출력 값은 zzz에 대한 가중치로 사용됨

Locality-aware loss 는 다음과 같은 수식을 따름

\mathcal{L}(f,g,\pi_x)=\sum_{z,z'\in \mathcal{Z}}\pi_x(z)(f(z)-g(z'))^2

해설: 설명 대상인 인스턴스 xxx에 대하여, 단순하지만 좋은 설명 모델 ggg를 찾기 위해 특징 값을 조금씩 바꾸면서(perturbation), xxx 근처에 여러 개의 인스턴스 zzz를 생성한다. 각 zzz는 모두 똑같은 취급을 받지 않고, 거리함수 πx(z)\pi_x(z)πx​(z)에 의해 xxx에 근접할수록 높은 가중치를 부여 받는다. 이 값은 오차항과 곱해지는 데, 오차는 zzz에 대하여 원본 모델 fff가 예측한 값 f(z)f(z)f(z)와 설명 모델 ggg가 차원 축소된 z′z'z′에 대하여 예측한 값 g(z′)g(z')g(z′) 사이의 오차 제곱으로 계산된다.

\Omega(g)

: 모델의 복잡도(complexity)

•

예(Decision Tree): Ω(g)=\Omega(g)=Ω(g)= 트리의 깊이

•

예(Linear models): Ω(g)=\Omega(g)=Ω(g)= 가중치(회귀 계수)의 수(≠0\neq0=0)

결론적으로 전체 수식에 의해 LIME 알고리즘은 원본 모델에 최대한 근사하면서도 복잡도가 낮은 설명 모델을 탐색하는 방향으로 동작

2.2 Sparse Linear Explanation

거리함수

\pi_x(z)

에 대한 설계 내용(exponential kernel)과 수식

2.3 Submodular Pick for Explaining Models

기본 LIME 이 단일 인스턴스에 대한 설명을 제공하는 한계점을 보완하여, 데이터셋을 대표하는 다수의 인스턴스들을 중심으로 설명 모델들을 생성하여, 원본 모델의 신뢰성을 평가하는 기법

→ 기본 LIME 알고리즘의 반복문으로 비유할 수 있음

2.4 Feature Importance

회귀 문제의 경우, LIME Python 패키지는 기본적으로 Ridge regression을 통해 설명 모델을 생성하며, 최종적으로 설명 모델의 회귀계수(non-zero coefficients)를 통해 인스턴스 또는 모델을 설명함

References

DMQA Lab, eXplainable AI (LIME and SHAP), YouTube

Lee, M., LIME(Local Interpretable Model-agnostic Explanation) 알고리즘, GitHub.io

Understanding how LIME explains predictions, Towards Data Science

LIME의 주요 과정과 자세한 수식 설명 

(Ribeiro 2016) "Why should i trust you?": Explaining the predictions of any classifier, ACM SIGKDD

Seed Paper