Restriction Method to Prove Algebraic Identity

0. 이 글에서는 일반적인 ring 위의 identity를 \mathbb{Z} 위의 identity로 restriction시킨 후 간단히 보이는 테크닉을 소개할 거예요! 아직은 제 실력이 부족해서 Cayley-Hamilton theorem을 보이는 수준으로만 소개할 것이지만요.

1. 수학에는 많은 항등식이 있는데, 그 중에서는 특정 구조 위에서는 항상 성립하는 universal한 특성을 가지고 있는 것들이 있어요. 예를 들어, commutative ring에서는 binomial theorem이 항상 성립하고, characteristic p인 commutative ring에서는 Frobenius map \varphi:a \mapsto a^{p}\varphi(a+b)=\varphi(a)+\varphi(b), \varphi(ab)=\varphi(a)\varphi(b)를 만족하지요. 그런데, 생각해보면 저저 항등식들의 증명은 ring을 무엇으로 고르든 모두 같아요! 좀 더 정확히 말하자면, 어떤 ring에서 증명하면 다른 모든 ring에 대해서도 “당연히” 성립한달까?? 예를 들어, binomial theorem을 보면 이건 그저 \mathbb{Z} 위의 어떤 다항식이 0임을 보이는 것으로 끝나는데, 마치 \mathbb{Z} 위의 항등식 (x+y)^{2}-(\binom{2}{0} x^{2}y^{0}+\binom{2}{1}x^{1}y^{1}+\binom{2}{2}x^{0}y^{2})=0에 아무 환의 원소를 evaluation해주면 된다는 느낌이에요. 그러니까, 임의의 commutative ring에서 성립하는 binomial theorem은 그저 \mathbb{Z} 위의 어떤 항등식으로부터 나오는 것이지요! 그런데, 생각해보면 \mathbb{Z} 위의 항등식은 evaluation으로부터 나와요. 그러니까, evaluation한 결과가 identically zero이면, 원래의 다항식이 zero polynomial이라는 것이에요! 따라서, 임의의 commutative ring에서 성립하는 binomial theorem은 그저 \mathbb{Z} 위의 경우만 살펴보면 충분하다는 이야기예요.

2. 이제 앞의 내용을 좀 더 수식적으로, 더 의미 있는 예시와 함께 살펴볼게요. 먼저, commutative ring 위에서의 formal derivative는 다음과 같이 정의되어요.

Definition (formal derivative). commutative ring R에 대해, formal derivative D:R[x] \to R[x]\sum_{i \in \mathbb{N}} a_{i}x^{i} \overset{D}{\mapsto} \sum_{i \in \mathbb{N}} (i+1)a_{i+1} x^{i}로 정의된다.

그러면, 다음 등식이 성립해요.

Identity. commutative ring R과 이 위의 formal derivative D:R[x] \to R[x]에 대해 다음 등식이 성립한다.
0. D(f+g)=D(f)+D(g) where f,g \in R[x].
1. D(fg)=fD(g)+D(f)g where f,g \in R[x]

물론, 이것 이외의 ‘잘 알려진 미분 공식’들도 성립하지만 생략할게요! 그런데, 이 경우엔 D(f)\mathbb{Z} 위의 다항식이 아니라는 문제점이 발생하는데, 우리는 이것을 일단 indeterminate로 바꿔놓은 후, 나중에 evaluation하는 방식으로 해결할 거예요! 그러니까, 다음을 생각하는 거예요.

Definition (formal derivative). n차 다항식 f=a_{0}+a_{1}x+\cdots+a_{n}x^{n} \in \mathbb{Z}[a_{0}, a_{1}, \cdots, a_{n}][x]에 대해, D(f)=a_{1}+2a_{2}x+\cdots+na_{n}x^{n-1}로 정의한다.

(사실 이 정의는 formal derivative의 원래 정의와 같은데, indeterminate가 많아서 혼동을 방지하기 위해 따로 정의한 것이에요.) 그러면 우리는 f=c_{0}+c_{1}x+\cdots+c_{n}x^{n} \in R[x]의 미분 D(f)\tilde{f}=a_{0}+a_{1}x+\cdots+a_{n}x^{n} \in \mathbb{Z}[a_{0}, a_{1}, \cdots, a_{n}][x]의 미분 D(\tilde{f})에 계수들을 대입한 D(f)(c_{0}, c_{1}, \cdots, c_{n})으로 계산할 수 있어요! 그리고 이걸 이용하면 앞의 identity들은 다음처럼 바꾸어 쓸 수 있어요.

Identity. 아무 자연수 n 에 대해, 다음 등식이 성립한다.
0. D(f+g)=D(f)+D(g) for all f,g \in \mathbb{Z}[a_{0}, a_{1}, \cdots, a_{n}][x]
1. D(fg)=fD(g)+D(f)g for all f,g \in \mathbb{Z}[a_{0}, a_{1}, \cdots, a_{n}][x]

그런데, 이 identity들은 \mathbb{Z} 위의 다항식이고, 결국 evaluation한 것들에 대해서 등식이 성립한다는 것만 확인하면 증명이 끝나요. 즉, 처음 주었던 identity들은 \mathbb{Z}의 경우에 대해서만 증명하면 충분하다는 것이에요! 여기서 당연하지만 조금 특별한 테크닉을 이용할 수 있는데, 바로 \mathbb{R} 위에서 참이면 \mathbb{Z} 위에서도 참이라는 것이에요. 즉, \mathbb{R}에서 앞의 등식들을 증명하면 충분하다는 것이지요. 그런데, \mathbb{R}에선 formal derivative가 미적분학의 극한을 이용한 derivative와 정확히 일치해요! 그리고 우리는 미적분학에서 저저 등식들이 참이라는 것을 알고 있고, 따라서 증명이 끝나요. 물론, 다른 많은 등식들 역시 그대로 들고올 수 있어요.

3. 앞의 예시는 사실 굳이 저저 테크닉을 이용하지 않더라도 쉽게 증명할 수 있어요. 하지만 Cayley-Hamilton theorem의 증명은 조금 까다로운데, 이번에는 이 정리를 앞의 테크닉으로 간단하게 증명해볼게요! 먼저, Cayley-Hamilton theorem은 다음을 말해요.

Theorem (Cayley-Hamilton). R이 commutative ring, A \in R^{n \times n}n \times n 행렬이고, p_{A}(x)=\det(xI-A) \in R[x]A의 characteristic polynomial일 때, p_{A}(A)=0이다.

이번에도 characteristic polynomial과 같은 것들이 정수 위에 있지 않으니 모조리 정수 위로 옮겨줄 건데, 간단히 A=(c_{ij}) \in R^{n \times n}의 characteristic polynomial p_{A}\tilde{A}=(a_{ij}) \in (\mathbb{Z}[a_{ij}:1 \le i,j \le n])^{n \times n}의 characteristic polynomial p_{\tilde{A}}를 evaluation해준 p_{\tilde{A}}(c_{ij})와 일치한다는 걸 이용할 수 있어요. 이제 앞과 같은 논의를 거치면 우리는 Cayley-Hamilton theorem을 \mathbb{Z} 위에서, 혹은 더 넓은 \mathbb{C} 위에서 증명하면 끝나요! 그런데, 다음은 너무나 잘 알려져 있어요.

Lemma. 만일 행렬 A \in \mathbb{C}^{n \times n}이 diagonalizable이라면 p_{A}(A)=0이다.

Proof. A가 대각화 가능이니깐 적절한 행렬 P를 골라서 P^{-1}AP=D={\rm diag}(\lambda_{i})를 대각행렬로 만들 수 있어요. 그런데, 간단한 계산을 통해 p_{A}(A)=p_{A}(PAP^{-1})=Pp_{A}(D)P^{-1}라는 걸 알 수 있고, 특히 p_{A}(D)=p_{A}({\rm diag}(\lambda_{i})={\rm diag}(p_{A}(\lambda_{i}))=0은 당연해요. 따라서 p_{A}(A)=0이 성립하고, 증명이 끝나요. \square

이제 대각화 가능이 아닌 경우만 살펴보면 되는데, 이 경우는 그리 많지 않은데, 만일 대각화 가능인 행렬이 dense하다면 대각화 가능이 아닌 행렬은 대각화 가능인 행렬들로 근사 가능하고, 곧 polynomial의 연속성에 의해 증명이 끝나요.(characteristic polynomial은 matrix를 변수로 보았을 때 연속이라는 건 당연해요.) 즉, 다음을 증명하면 끝나요.

Lemma. \mathbb{C}^{n \times n}에서, 모든 diagonalizable matrix들의 set은 dense다.

Proof. 먼저, 앞에서 말했듯 우리는 characteristic polynomial을 행렬의 각 entry를 변수처럼 보아 \mathbb{C}[a_{ij}:1 \le i,j \le n][x]의 원소로 생각할 수 있고, 여기에 행렬을 넣으면 그 행렬의 characteristic polynomial이 되도록 잡을 수 있어요. 그런데, 다음 lemma를 봐요.

Lemma. polynomial f \in \mathbb{C}[a_{i}:1 \le i \le m][x]에 대해, 어떤 공집합이 아닌 open set U \subseteq \mathbb{C}^{m}이 있어 모든 v \in U에 대해 x에 관한 다항식 f(v)가 중근을 가진다면, 모든 v \in \mathbb{C}^{m}에 대해 x에 관한 다항식 f(v)가 중근을 가진다.

Proof. 먼저, 다음 lemma를 볼게요.

Lemma. m \in \mathbb{N}에 대해, universal한 다항식 D_{m} \in \mathbb{Z}[a_{i}:1 \le i \le m]이 존재해서 monic인 m차 다항식 f=f_{0}+f_{1}x+\cdots+f_{m-1}x^{m-1}+x^{m}가 중근을 가지는 것과 D_{m}(f_{0}, f_{1}, \cdots, f_{n-1})이 되게 할 수 있다.

Proof. 먼저, f의 field의 algebraic closure를 생각해서 f=\prod_{1 \le i \le m}(x-\alpha_{i})로 쓸 수 있고, 이제 다음을 정의할게요.

D=\prod_{1 \le i<j \le m} (\alpha_{i}-\alpha_{j})

그러면 당연하게도 f가 중근을 가지는 것과 D=0, 혹은 D^2=0은 동치가 되겠지요. 그런데 우리는 universal한 다항식 D_{m} \in \mathbb{Z}[a_{i}:1 \le i \le m]이 존재해서 D^{2}=D_{m}(f_{0},f_{1}, \cdots, f_{m-1})이란 걸 알고 있어요. (‘대충’ 설명하자면, D^2이 대칭식이니 이것은 기본대칭식들에 관한 다항식으로 표현 가능한데, Vieta’s rule에 의해 기본대칭식들은 monic인 다항식의 계수와 정확히 대응되니까!! 물론 정확하게 설명하려면 D^2의 variable version 만들고 어쩌구 해야 하는데, 그리 어렵지 않아요.) 즉, f가 중근을 가지는 것과 D^{2}=0이 동치인데, 이건 D_{m}(f_{0}, f_{1}, \cdots, f_{m-1})과 당연히 동치예요!! 이것의 universality는 연습문제로 남길게요. \square

이 lemma에 의해, 대충 f를 (x에 대한) 최고차항의 계수로 나누어서 monic으로 만들어줄 수 있고, 우리는 D_{m}|_{U}=0이라는 걸 알 수 있어요.(최고차학의 계수가 0이라면 locally zero polynomial is zero polynomial이니 당연히 성립해요.) 그런데, 어떤 유리식이 공집합이 아닌 어떤 open set에서 0이면 \mathbb{C}^{m}에서도 0이라는 건 아주 잘 알려져 있어요!! 즉, D_{m} \equiv 0이고, 곧 f는 항상 중근을 가지게 되어요. \square

그러니까, 만일 set of all diagonalizable matrices가 dense가 아니라면, 어떤 open set U \subseteq \mathbb{C}^{n^{2}}이 있어서 모든 v \in U에 대해 x에 관한 다항식 p(v)가 중근을 가진다는 것이고, 이건 모든 v \in \mathbb{C}^{n^{2}}에 대해 p(v)가 중근을 가진다는 걸 의미해요. 하지만 이것은 거짓인데, 대충 대각 성분들이 서로 다른 diagonal matrix 아무거나 잡으면 이것의 characteristic polynomial은 중근이 없고, 따라서 모순이에요. 즉, set of all diagonalizable matrices는 dense해요!! \square

증명을 마무리 짓자면, 우리는 어떤 행렬 A를 주든, 이것으로 수렴하는 대각화 가능한 형렬렬(?) A_{n}을 잡을 수 있어요. 그런데, p_{A_{n}}(A_{n})=0이고, p_{A_{n}} \to p_{A}이니깐 p_{A}(A)=0이 성립하게 되어요!

4. 다음은 연습문제들이에요.

Exercise. (\mathbb{C} 위에서) a로 수렴하는 수열 (a_{n})과 다항식 p로 수렴하는 다항식렬 p_{n}에 대해, 만일 p_{n}(a_{n})=0이었다면 p(a)=0이라는 걸 증명해주세요!

Exercise. 앞에서 소개했던 “어떤 다항식이 중근을 가진다는 것은, 계수에 관한 다항식 D_m0인 것과 동치이다”란 lemma에서, D_m의 universality 증명을 마무리해주세요!

Exercise. (\mathbb{C}^{m} 위에서) 어떤 유리식이 locally zero이면, 이것은 identically zero임을 보여주세요! 그러니까, 유리식 f=\frac{P}{Q}에 대해, 공집합이 아닌 open set U가 있어서 f|U=0이면, f \equiv 0임을 보여주세요! (Hint. mathematical induction on m. Or if you know the ‘identity theorem’, then easily done. Actually, by using identity theorem, we can extend the lemmas from the ring \mathbb{C}[a_{i}:1 \le i \le m][x] to the ring \mathbb{C}\{a_{i}:1 \le i \le m\}[x] with some modification.)

Exercise. commutative ring R과 행렬들 A,B \in R^{n \times n}에 대해, p_{AB}=p_{BA}라는 걸 보여주세요!

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s