感受伽羅瓦:二次方程與複數

本網頁假設讀者已學習了求實係數線性(即一次)和二次多項式方程根式解(solution by radicals,即以加、減、乘、除、乘方和開方運算表示的解)的一般方法,這裡略作溫習。首先,設\(a\)、\(b\)為實數,其中\(a \not= 0\),則線性方程的一般形式為 \[ ax + b = 0 \] 而上式的解則是 \[ x = -\frac{b}{a} \] 其次,設\(a\)、\(b\)、\(c\)為實數,其中\(a \not= 0\),則二次方程的一般形式為 \[ ax^2 + bx + c = 0 \hspace{20 pt}(1) \] 而上式的解則是 \[ x = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \hspace{20 pt}(2) \] 相信大多數讀者都記得,上式可以通過「配方法」(completing square)推導而來。但除了配方法外,還有另一種稱為契爾恩豪斯變換(Tschirnhaus Transformation)的方法,這種方法的特點是設法使原有二次方程\((1)\)的二次項係數\(a\)和一次項係數\(b\)分別變為\(1\)和\(0\),從而使全式變成較易求解的方程,具體方法是先把全式除以\(a\),然後用\(x = y + k\)代入(其中\(k\)是常數,其具體值待定): \begin{align} x^2 + \frac{b}{a}x + \frac{c}{a} &= 0 \\ (y + k)^2 + \frac{b}{a}(y + k) + \frac{c}{a} &= 0 \\ y^2 + \left(2k + \frac{b}{a}\right)y + \left(k^2 + \frac{b}{a}k + \frac{c}{a}\right) &= 0 \end{align} 如要令上式的一次項係數變為0,必須有\(2k + \frac{b}{a} = 0\),由此可得\(k = -\frac{b}{2a}\),把此等式代入上式,便可得 \begin{align} y^2 + (0)(y) + \left(-\frac{b}{2a}\right)^2 + \frac{b}{a}\left(-\frac{b}{2a}\right) + \frac{c}{a} &= 0 \\ y^2 + \frac{-b^2 + 4ac}{4a^2} &= 0 \hspace{20 pt}(3) \end{align} 上式就是經化簡的二次方程,其二次項係數和一次項係數分別是\(1\)和\(0\)。上述方程很容易求解,只需把常數項移至等號右端,然後取(正負值)平方根即可: \begin{align} y^2 &= \frac{b^2 - 4ac}{4a^2} \\ y &= \pm\sqrt{\frac{b^2 - 4ac}{4a^2}} \\ &= \frac{\pm\sqrt{b^2 - 4ac}}{2a} \end{align} 上述結果是以\(y\)作為變項的二次方程\((3)\)的解,但由於前面曾設定\(x = y - \frac{b}{2a}\),故可馬上求得原來以\(x\)作為變項的二次方程\((1)\)的解如下: \begin{align} x &= \frac{\pm\sqrt{b^2 - 4ac}}{2a} -\frac{b}{2a} \\ &= \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \end{align} 上述結果跟\((2)\)完全相同。

在\((2)\)中,\(b^2 - 4ac\)稱為二次方程的判別式(discriminant),因為它可用來判斷一般二次方程\((1)\)的解的性質,以下把此判別式記作\(\Delta_2\)。當\(\Delta_2 > 0\)時,\(\sqrt{b^2 - 4ac}\)有兩個相異的值,所以\((1)\)有兩個相異的實數解。當\(\Delta_2 = 0\)時,\(\sqrt{b^2 - 4ac} = 0\),所以\((1)\)有一個二重實數解\(-\frac{b}{2a}\)。當\(\Delta_2 < 0\)時,\(\sqrt{b^2 - 4ac}\)沒有實數值,所以\((1)\)沒有實數解。可是,如果我們把解的取值範圍推廣到複數(complex number),則當\(\Delta_2 < 0\)時,\((1)\)仍有兩個相異的複數解。由於複數在抽象代數學以至伽羅瓦理論中有非常重要的作用,以下簡介複數的基本知識。

複數是指具有以下形式的數: \[ x + yi \hspace{20 pt}(4) \] 其中\(x\)和\(y\)是實數,\(i\)則代表\(\sqrt{-1}\),又稱為虛數單位(imaginary unit),例如\(1 - i\)、\(2 + \sqrt{2}i\)都是複數。請注意當\((4)\)中的\(y = 0\)時,所得結果是實數,因此實數可被看成複數的特例。類似地,當\((4)\)中的\(x = 0\)時,所得結果稱為純虛數(pure imaginary number),也可被看成複數的特例。有了複數的概念,便可以處理負數平方根的問題。設\(n < 0\),由於\(n = (-n) \times (-1)\)並且\(-n > 0\),故有\(\sqrt{n} = \sqrt{-n} \times \sqrt{-1} = \sqrt{-n}i\),例如\(\sqrt{-4} = \sqrt{4} \times \sqrt{-1} = 2i\)。因此當\(\Delta_2 < 0\)時,可知\((1)\)有兩個相異的複數解,而且可以根據\((2)\)把這兩個複數解具體寫成以下形式: \[ x = \frac{-b \pm \sqrt{4ac - b^2}i}{2a} \hspace{20 pt}(5) \] 舉例說,設有二次方程\(x^2 – 2x + 4 = 0\),那麼\(a= 1\)、\(b= -2\)、\(c= 4\),故有\(\Delta_2 = (-2)^2 - (4)(1)(4) = -12 < 0\),因此根據\((5)\),這個方程的解是: \begin{align} x &= \frac{2 \pm \sqrt{12}i}{2} \\ &= 1 \pm \sqrt{3}i \end{align} 現考慮複數\(x + yi\),我們把\(x - yi\)稱為該複數的共軛複數(complex conjugate)。在數學上,常使用\(\overline{z}\)代表複數\(z\)的共軛複數。由此我們有 \[ \overline{x + yi} = x - yi \] 從上式容易看到\(\overline{x - yi} = x + yi\),由此可見,一對具有\(x + yi\)和\(x - yi\)形式的複數互為對方的共軛複數。從以上討論亦可見,當\(\Delta_2 < 0\)時,\((1)\)有一對互為共軛複數的解。

複數像實數那樣,也可進行加、減、乘、除、乘方、開方等運算,其中加、減、乘和乘方運算跟普通代數的同類運算很相似,這裡可以把\(i\)當作一個變項(例如\(x\))處理,惟需加上\(i^2 = -1\)此一條件。舉例說,如欲驗證\(1 - \sqrt{3}i\)是\(x^2 – 2x + 4 = 0\)的解,可以把\(1 - \sqrt{3}i\)代入該二次方程的變項\(x\),看看所得結果是否等於\(0\),計算如下: \[ \begin{array}{ll} & (1 - \sqrt{3}i)^2 – 2(1 - \sqrt{3}i) + 4 \\ = & 1^2 + 2(1)(-\sqrt{3}i) + (-\sqrt{3}i)^2 - 2 + 2\sqrt{3}i + 4 \\ = & 1 - 2\sqrt{3}i -3 - 2 + 2\sqrt{3}i + 4 \\ = & 0 \end{array} \] 為進行除法,可以把相除的兩個複數寫成分數的形式\(\frac{x + yi}{z + ui}\),然後把此分數乘以\(\frac{z - ui}{z - ui}\),目的是令乘積的分母不再含有\(i\),以下展示一個計算實例: \[ \begin{array}{ll} & \frac{1 + 2i}{3 + 4i} \\ = & \left(\frac{1 + 2i}{3 + 4i}\right)\left(\frac{3 - 4i}{3 - 4i}\right) \\ = & \frac{(1 + 2i)(3 - 4i)}{(3 + 4i)(3 - 4i)} \\ = & \frac{11 + 2i}{25} \\ = & \frac{11}{25} + \frac{2}{25}i \end{array} \] 為進行複數的開方運算,須使用一些新概念。正如實數可被看成對應著一維數線上的點,複數也可被看成對應著二維平面上的點,其中\(x + yi\)對應著點\((x, y)\)。在此觀點下,實數對應著\(x\)軸上的點(因這類數具有\((x, 0)\)的形式),純虛數則對應著\(y\)軸上的點(因這類數具有\((0, y)\)的形式)。平面上的點除了用「笛卡爾坐標」(Cartesian coordinate)(即以通常的\(x\)軸和\(y\)軸確定的坐標)表示外,還可用「極坐標」(polar coordinate)表示。「極坐標」由兩個實數組成,第一個數是該點與「原點」之間的距離,可稱為\(r\)坐標;第二個數則是該點與「原點」的連線與正\(x\)軸所成的夾角,可稱為\(\theta\)坐標,這個角度須表達為區間\([0, 2\pi)\)上的實數(註1)。把上述概念應用於複數,上述\(r\)坐標也稱為某複數\(z\)的(modulus),記作\(|z|\);\(\theta\)坐標則稱為\(z\)的主幅角(principal argument),記作\(\mbox{Arg}(z)\)。

由於有兩種坐標表達法:「笛卡爾坐標」\((x, y)\)和「極坐標」\((r, \theta)\),我們須找出這兩種坐標之間的轉換公式。試看下圖:

運用普通幾何學知識,容易得到以下轉換公式: \[ \begin{array}{ccc} x = r\cos\theta & y = r\sin\theta & \hspace{20 pt}(6) \\ r = \sqrt{x^2 + y^2} & \theta = \cos^{-1}\left(\frac{x}{r}\right) & \hspace{20 pt}(7) \end{array} \] 上式中的\(\cos^{-1}\)代表三角函數\(\cos\)的逆運算,但由於\(\cos\)不是「一一對應函數」,同一個實數\(x\)可有無限多個\(\cos^{-1}(x)\),因此這裡規定\(\cos^{-1}(\frac{x}{r})\)是因應複數所對應的點所在的象限而確定的位於區間\([0, 2\pi)\)內的角度。有了以上的轉換公式 ,便可以把任一複數寫成以下兩種形式: \[ x + yi = r(\cos\theta + i\sin\theta) \hspace{20 pt}(8) \] 此外,我們還需要以下的定理:

定理1 (棣美弗定理de Moivre's Theorem): \[ (r(\cos\theta + i\sin\theta))^n = r^n(\cos n\theta + i\sin n\theta) \] 在上述定理中,\(n\)可以是任意有理數,所以可應用於複數開方運算。以下顯示如何求\(1 - \sqrt{3}i\)的平方根,首先根據\((7)\),可求得\(r = \sqrt{1^2 + (-\sqrt{3})^2} = 2\)和\(\theta = \cos^{-1}\left(\frac{1}{2}\right) = \frac{5\pi}{3}\)(由於\(1 - \sqrt{3}i\)所對應的點\((1, - \sqrt{3})\)位於第四象限,所以這裡把\(1 - \sqrt{3}i\)的主幅角定為\(\frac{5\pi}{3}\))。由此根據「定理1」,有 \[ \begin{array}{ll} & \left(2\left(\cos\frac{5\pi}{3} + i\sin\frac{5\pi}{3}\right)\right)^\frac{1}{2} \\ = & 2^\frac{1}{2}\left(\cos\left(\frac{1}{2} \times \frac{5\pi}{3}\right) + i\sin\left(\frac{1}{2} \times \frac{5\pi}{3}\right)\right) \\ = & \sqrt{2}\left(\cos\frac{5\pi}{6} + i\sin\frac{5\pi}{6}\right) \\ = & -\sqrt{\frac{3}{2}} + \frac{1}{\sqrt{2}}i \end{array} \] 我們知道在平面上,\(\theta\)與\(\theta + 2\pi\)實際表示同一個角度,因此我們可以把上述運算中的角度改為\(\frac{5\pi}{3} + 2\pi = \frac{11\pi}{3}\)。換句話說,\(1 - \sqrt{3}i\)也可表示為\(2(\cos\frac{11\pi}{3} + i\sin\frac{11\pi}{3})\)。現在讓我們看看,如用這個表達式進行上述開平方運算,會得到甚麼結果: \[ \begin{array}{ll} & \left(2\left(\cos\frac{11\pi}{3} + i\sin\frac{11\pi}{3}\right)\right)^\frac{1}{2} \\ = & \sqrt{2}\left(\cos\frac{11\pi}{6} + i\sin\frac{11\pi}{6}\right) \\ = & \sqrt{\frac{3}{2}} - \frac{1}{\sqrt{2}}i \end{array} \] 上述結果\(\sqrt{\frac{3}{2}} - \frac{1}{\sqrt{2}}i\)正好是前一運算結果\(-\sqrt{\frac{3}{2}} + \frac{1}{\sqrt{2}}i\)的負值,而我們知道若某數\(n\)是另一個數\(x\)的平方根,則\(-n\)也是\(x\)的平方根。請注意如果把上述運算中的角度改為\(\frac{5\pi}{3} + 4\pi\)、\(\frac{5\pi}{3} + 6\pi\)、\(\frac{5\pi}{3} + 8\pi\)...,只會重覆得到上述兩個平方根。由此可見,利用上述方法,只須分別用角度\(\theta\)和\(\theta + 2\pi\)進行兩次運算,便可得到任意複數的所有平方根。

一般地,設複數\(z\)可表示成\(r(\cos\theta + i\sin\theta)\)的形式,那麼\(z\)有以下\(n\)個\(n\)次方根: \[ r^{\frac{1}{n}}\left(\cos\frac{\theta + 2k\pi}{n} + i\sin\frac{\theta + 2k\pi}{n}\right), \hspace{5 pt} k = 0, 1, 2, \cdots n - 1 \hspace{20 pt}(9) \] 舉例說,為求\(1\)的\(n\)次方根,先把\(1\)寫成\(1(\cos0 + i\sin0\))的形式,然後運用上式進行計算: \[ \begin{array}{ll} & \sqrt[n]{1}\left(\cos\frac{0 + 2k\pi}{n} + i\sin\frac{0 + 2k\pi}{n}\right), \hspace{5 pt} k = 0, 1, 2, \cdots n - 1 \\ = & 1, \hspace{5 pt} \cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n}, \hspace{5 pt} \cos\frac{4\pi}{n} + i\sin\frac{4\pi}{n}, \hspace{5 pt} \cdots \hspace{5 pt} \cos\frac{2(n - 1)\pi}{n} + i\sin\frac{2(n - 1)\pi}{n} \\ \end{array} \] 請注意上列\(n\)個\(n\)次方根都可被看成\(\cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n}\)的某個冪次,這是因為根據「定理1」,有 \begin{align} \left(\cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n}\right)^0 &= 1 \\ \left(\cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n}\right)^1 &= \cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n} \\ \left(\cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n}\right)^2 &= \cos\frac{4\pi}{n} + i\sin\frac{4\pi}{n} \\ &\vdots \\ \left(\cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n}\right)^{n - 1} &= \cos\frac{2(n - 1)\pi}{n} + i\sin\frac{2(n - 1)\pi}{n} \end{align} 因此如用\(\omega_n\)代表\(1\)的主幅角為\(\frac{2\pi}{n}\)的\(n\)次方根(即\(\cos\frac{2\pi}{n} + i\sin\frac{2\pi}{n}\)),那麼\(1\)的\(n\)個\(n\)次方根可以寫成 \[ 1,\, \omega_n,\, \omega_n{}^2,\, \cdots\, \omega_n{}^{n - 1} \hspace{20 pt}(10) \] \(1\)的\(n\)次方根可以幫助求得其他複數的\(n\)次方根,這是因為根據三角恆等式\(\cos(\alpha + \beta) = \cos\alpha\cos\beta - \sin\alpha\sin\beta\)和\(\sin(\alpha + \beta) = \sin\alpha\cos\beta + \cos\alpha\sin\beta\),可以把\((9)\)改寫為 \[ \begin{array}{ll} & r^{\frac{1}{n}}\left(\cos\frac{\theta}{n}\cos\frac{2k\pi}{n} - \sin\frac{\theta}{n}\sin\frac{2k\pi}{n} + i\sin\frac{\theta}{n}\cos\frac{2k\pi}{n} + i\cos\frac{\theta}{n}\sin\frac{2k\pi}{n}\right), \hspace{5 pt} k = 0, 1, 2, \cdots n - 1 \\ = & r^{\frac{1}{n}}\left(\cos\frac{2k\pi}{n}\left(\cos\frac{\theta}{n} + i\sin\frac{\theta}{n}\right) + i\sin\frac{2k\pi}{n}\left(\cos\frac{\theta}{n} + i\sin\frac{\theta}{n}\right)\right), \hspace{5 pt} k = 0, 1, 2, \cdots n - 1 \\ = & r^{\frac{1}{n}}\left(\cos\frac{\theta}{n} + i\sin\frac{\theta}{n}\right)\left(\cos\frac{2k\pi}{n} + i\sin\frac{2k\pi}{n}\right), \hspace{5 pt} k = 0, 1, 2, \cdots n - 1 \\ = & r^{\frac{1}{n}}\left(\cos\frac{\theta}{n} + i\sin\frac{\theta}{n}\right)\omega_n{}^k, \hspace{5 pt} k = 0, 1, 2, \cdots n - 1 \end{array} \] 上式告訴我們,為求複數\(z\)的\(n\)個\(n\)次方根,可以先求\(z\)的主幅角為\(\frac{\theta}{n}\)的\(n\)次方根(其實任何一個\(n\)次方根都可以),然後把此一結果逐一乘以\(\omega_n\)的各個冪次。現在如用\(\sqrt[n]{z}\)代表\(z\)的主\(n\)次方根(principal nth root)(\(z\)的主\(n\)次方根是指\(z\)的\(n\)次方根中的唯一一個實數,如無唯一一個實數,則為具有最小主幅角的那個(註2)),那麼\(z\)的\(n\)個\(n\)次方根可以寫成 \[ \sqrt[n]{z},\, \omega_n(\sqrt[n]{z}),\, \omega_n{}^2(\sqrt[n]{z}),\, \cdots\, \omega_n{}^{n - 1}(\sqrt[n]{z}) \hspace{20 pt}(11) \] 舉例說,如欲求\(8i\)的三個立方根,可以先把\(8i\)寫成\(8\left(\cos\frac{\pi}{2} + i\sin\frac{\pi}{2}\right)\)的形式,由此容易求得\(8i\)的主幅角為\(\frac{\pi}{6}\)的立方根(即\(\sqrt[3]{8i}\))為 \begin{align} \sqrt[3]{8i} &= 2\left(\cos\frac{\pi}{6} + i\sin\frac{\pi}{6}\right) \\ &= \sqrt{3} + i \end{align} 另一方面,容易計算\(1\)的主幅角為\(\frac{2\pi}{3}\)的立方根(即\(\omega_3\))為 \begin{align} \omega_3 &= \cos\frac{2\pi}{3} + i\sin\frac{2\pi}{3} \\ &= -\frac{1}{2} + \frac{\sqrt{3}}{2}i \end{align} 根據\((11)\),\(8i\)的三個立方根是 \begin{align} \sqrt[3]{8i} &= \sqrt{3} + i \\ \omega_3{}(\sqrt[3]{8i}) &= \left(-\frac{1}{2} + \frac{\sqrt{3}}{2}i\right)(\sqrt{3} + i) \\ &= -\sqrt{3} + i \\ \omega_3{}^2(\sqrt[3]{8i}) &= \left(-\frac{1}{2} - \frac{\sqrt{3}}{2}i\right)(\sqrt{3} + i) \\ &= -2i \end{align} \((10)\)中所列\(1\)的\(n\)個\(n\)次方根具有以下重要性質:

定理2: \[ 1 + \omega_n + \omega_n{}^2 + \cdots \omega_n{}^{n - 1} = 0 \] 上式不難證明,因為我們有 \begin{align} (1 + \omega_n + \omega_n{}^2 + \cdots \omega_n{}^{n - 1})(\omega_n - 1) &= \omega_n{}^n - 1 \\ 1 + \omega_n + \omega_n{}^2 + \cdots \omega_n{}^{n - 1} &= \frac{\omega_n{}^n - 1}{\omega_n - 1} \\ &= \frac{1 - 1}{\omega_n - 1} \\ &= 0 \end{align} 上面倒數第二行成立,是因為\(\omega_n\)是\(1\)的主幅角為\(\frac{2\pi}{n}\)的\(n\)次方根,故有\(\omega_n \not= 1\)並且\(\omega_n{}^n = 1\)。

有趣的是,不僅\(1\)的\(n\)個\(n\)次方根的和等於\(0\),事實上任何複數\(z\)的\(n\)個\(n\)次方根的和都等於\(0\),這是因為根據\((11)\),\(z\)的\(n\)個\(n\)次方根的和等於 \[ \begin{array}{ll} & \sqrt[n]{z} + \omega_n(\sqrt[n]{z}) + \omega_n{}^2(\sqrt[n]{z}) + \cdots\, \omega_n{}^{n - 1}(\sqrt[n]{z}) \\ = & \sqrt[n]{z}\,(1 + \omega_n + \omega_n{}^2 + \cdots \omega_n{}^{n - 1}) \\ = & 0 \end{array} \] 舉例說,前面已求得\(8i\)的三個立方根,這三個立方根的和是 \[ (\sqrt{3} + i) + (-\sqrt{3} + i) + (-2i) = 0 \]

註1:本網頁採用「弧度制」(radian measure)表示角度,在「弧度制」下,角度可無需標示單位(不像「角度制」(degree measure)那樣要標出\(^{\circ}\)),但如要強調「弧度制」,也可用\(rad\)標示,因此在表示角度時,\(\pi\)與\(\pi\, rad\)有相同意思。「角度制」與「弧度制」的換算關係是\(180^{\circ} = \pi\),其他角度照此按比例計算,例如\(360^{\circ} = 2\pi\)、\(90^{\circ} = \frac{\pi}{2}\)等。

註2:主\(n\)次方根的定義之所以如此繁複,是因為要遷就以下事實:我們習慣了\(\sqrt[3]{-1} = -1\),請注意在\(-1\)的三個立方根(即\(\frac{1}{2} + \frac{\sqrt{3}}{2}i\)、\(-1\)和\(\frac{1}{2} - \frac{\sqrt{3}}{2}i\))中,\(-1\)不是具有最小幅角的那個,但卻是唯一一個實數。

返回數學專題
<script type="text/javascript">(function (d, w) {var x = d.getElementsByTagName('SCRIPT')[0];var f = function () {var s = d.createElement('SCRIPT');s.type = 'text/javascript';s.async = true;s.src = "//np.lexity.com/embed/YW/be0aa169de7f441c6473361be62c9ef6?id=ddad453e7753";x.parentNode.insertBefore(s, x);};w.attachEvent ? w.attachEvent('onload',f) :w.addEventListener('load',f,false);}(document, window));</script>