本文简要地介绍ZFC集合论中各公理的意义及作用。 首先,ZFC集合论中的公理大致分为3组:
1、外延公理。
2、子集公理模式、无序对公理、并集公理、幂集公理、无穷公理、替换公理模式。
3、正则公理(或 基础公理)、选择公理(记作 AC)。
下面是详细的说明:(iff 表示 当且仅当)
1、外延公理:对所有的集合$A$、$B$,A=B iff 对所有的x($x∈A$ iff $x∈B$)
分析:首先,左边 ( 即“ $A=B$ ”) 蕴含右边 ( 即 “对所有的 $x$ ($x∈A$ iff $x∈B$)”)是等词的性质;重要的是右边蕴含左边。
它说的是:一个集合完全由它的元素(即“外延”)确定,不依赖于其他任何东西(如形状等)。这体现了数学的“量”的特点,也表明了数学的“简单性”——研究集合的时候考虑且只考虑集合的元素。
它的作用是:把证明两个集合相等转化成了证明有相同的元素(这一点在做数学题时非常常用),确保了第2组公理里断言存在的集合的唯一性。
2、这一组公理都是断言某种集合的存在性。
子集公理模式:
历史回顾:康托(Cantor)认为,“内涵公理模式”(即 对所有的性质$p(x),{x:p(x)}$ 是集合)成立。
但这是错误的,1901年被“罗素(Russel)悖论”否定(罗素的反例是:取$p(x)$为“$x∉x$”)。
后来,人们把“内涵公理模式”修正为“子集公理模式”:
对所有的性质$p(x)$,对所有的集合A,${x∈A:p(x)}$是集合。
从而排除了悖论。
子集公理模式说的是:如果我们有一个现成的集合A,那么我们就可以拿A中的元素作为“材料”用性质$p(x)$造出一个新的集合${x∈A:p(x)}$,因为${x∈A:p(x)}$是A的子集,所以这个公理模式称作“子集公理模式”。
子集公理模式有重要的意义:它把“性质”实体化了。性质$p(x)$本是一个看不见摸不着的东西,但有了子集公理模式以后,我们用p(x)做成了一个集合${x∈A:p(x)}$(集合是我们的实体),它可以从局部完全地刻画p(x)的特征。这一点是集合论能够成为数学的基础的最根本的原因,其它的大多数形式系统,不能够把性质实体化,不具备研究性质的能力,因而不能成为数学的基础。
子集公理模式的作用:从已知的集合构造出新的集合。
但是,子集公理模式只能从已知的集合得到它的子集,当我们一无所有的时候,我们能得到什么呢?
首先,我们用逻辑公理能证明:存在$x(x=x)$。也就是说集合是存在的。
我们用某个存在的集合A,利用子集公理模式,可知“${x∈A:x≠x}$是集合”,这个集合就是∅。
但是,对∅使用子集公理模式,我们再也得不出新的集合,因为∅里没有我们想要的“建筑材料”。
所以,要想实现从无到有的突破,我们还需要新的公理。
无序对公理:对所有的集合$A、B,{A,B}$是集合。
有了这个公理以后,我们可以知道 ${∅}$、${{∅}}$、${{{∅}}}$、${∅, { ∅ }}$ 等都是集合。
但是,我们只能得到一元集或二元集,${∅,{∅},{{∅}}}$是不是集合,我们无从得知。
并集公理:对所有的集合A,${x:存在B∈A,使得x∈B}$ 是集合(记作$∪A$)。
有了并集公理以后,我们可以知道 ${∅,{∅},{{∅}}}=∪{{∅,{∅}},{{{∅}}}$ 是集合。
我们还可以证明交集定理:对所有的非空集合$A,∩A={x: 对所有的 B∈A, x∈B}$是集合。
有了并集公理之后,我们可以构造各式各样的集合。
幂集公理:对所有的集合A,${x:x是A的子集}$是集合(记作P(A))。
这个公理可以以更快的速度(指数速度)形成新的集合。
在外延公理的基础上,有了子集公理模式、无序对公理、并集公理和幂集公理以后,我们就可以适当地展开数学了:
首先是有序对的概念:
有序对定理:对所有的集合$a、b,<a,b>={{a},{a,b}}$是集合。
这个定理只依赖无序对公理。
可以证明:对所有的集合$a、b、c、d,<a,b>=<c,d>$ iff $a=c$且$b=d$。 (*)
事实上,怎么定义$<a,b>$并不重要,重要的是让(*)式成立。
接下来,是乘积的概念:
乘积定理:对所有的集合$A、B,A×B={<x,y>:x∈A且y∈B}$是集合。
有了这个定理以后,我们就可以定义“关系”、“函数”的概念:
A×B的一个子集R称为A到B的一个关系。
A到B的一个函数是指一个定义域为A的满足单值性条件(即“对所有的x∈A,y、z∈B,$<x,y>∈R$且$<x,z>∈R$ 蕴含 y=z”)的关系R。
关系、函数是数学中最为重要的概念,集合论能把函数、关系实体化是集合论能成为数学的基础的一个重要的原因。
数学的内容一般是:定义一些数学对象,研究这些数学对象之间的关系。
在集合论里,数学对象都被定义成一种特殊的集合,它们之间的关系也被定义成特殊的集合。
“关系”本是一种看不见摸不着的对应,现在,巧妙地采用了“用结果表达过程”的手段把“关系”实体化了:用关系R造成的结果${<x,y>:xRy}$来定义这个关系。
接下来是定义重要的关系:等价关系、良基关系、序关系。
等价关系是满足自反性、对称性和传递性的关系。
良基关系是满足良基性(所有非空子集都有极小元)的关系。
归纳法的最一般的形式就是良基关系上的归纳法。
递归定义的最一般的形式就是良基关系上的递归定义。
这是因为,“良基性”和“归纳法”是互为逆否命题的!
(这只是一种粗略的说法,当然是可以严格化的。)
良基关系有各种好的性质。
序关系通常是指偏序关系、全序关系和良序关系。
偏序关系是满足反自反性和传递性的关系。
全序关系是满足连通性的偏序关系。
良序关系是满足良基性的全序关系。
良序关系是一种特殊的良基关系,当然有归纳法成立。
良序关系是极为重要的概念,有了它,我们就可以定义序数的概念:
序数就是被∈良序的传递集。
有了序数的概念之后,我们就可以“定量”地研究良序关系了。
然后是自然数的概念:
自然数是满足下面两个条件的序数n:
(1)n是0或后继序数;
(2)n的每个元素都是0或后继序数。
这个定义是不依赖于无穷公理的。
很多教材,在定义自然数的时候,都用到了无穷公理,只有少数没有用(如 汪芳庭的《公理集论》和Levy的《Basic set theory》)。
我们应该遵循“奥卡姆(Occam)剃刀”原理,能不用的东西就坚决不用,这样才能看清问题的本质所在。
对应到集合论的研究中,能不用的公理就不要用,用到的公理都要证明必须用!
无穷公理:$w={n:n是自然数}$是集合。
在没有无穷公理的时候,我们只能看到序数宇宙呈现出下面的样子:
0,0',0'',…
有了无穷公理之后,我们能看到序数宇宙呈现出下面的样子:
0,0',0'',… w,w',w'',…
后面还有没有东西,我们就不知道了。
我们需要新的公理:
替换公理模式:对所有的类函数F,对所有的集合a,${F(x):x∈a∩Dom(F)}$ 是集合。
这个公理模式在直观上是对的,因为函数的值域的规模直观上只可能比定义域的小。
有了这个公理模式之后,我们可以得到${0,0',0'',… w,w',w'',…}={0,0',0'',… }∪{w,w',w'',…}$是集合。这个集合就是w·2,它的存在性离不开替换公理模式。
有了替换公里模式之后,序数宇宙呈现出非常丰富多姿的样子。
3、这一组公理都是否定某种集合的存在性。
正则公理:对所有的非空集合a,存在x∈a,x∩a=∅。
换一种说法,这个公理是说:∈是任一集合上的良基关系。
其实,有了序数的概念以后,我们就可以定义“基础集”的概念了。
在序数宇宙On上递归定义一个类函数V_x:
$V_0=∅$;
$V_x'=P(V_x)$;
$V_x=∪{V_y:y∈x}$,若x是极限序数。
令WF=∪{V_x:x∈On},则WF中的元素成为基础集,WF称为基础集宇宙。
WF有个“宏观”的等价定义:WF={x:∈是Tc(x)上的良基关系},其中Tc(x)是x的传递闭包。
基础集有各种好的性质。
还有个“莫斯托夫斯基(Moschovakis)表示定理”,它把任何一个良基外延关系R都表示到WF里面去了。
基础公理:对所有的集合a,a∈WF。
若把所有集合构成的真类记作V(称作“集宇宙”),那么,基础公理是说:V=WF。
可以证明:正则公理 iff 基础公理。
因此,正则公理其实是排除了所有的“非基础集”。
如果把一个集合想象成一些事物加大括号形成的对象,那么基础集的直观含义是:
沿着任何一个方向往括号里进,总能进到底(进到找不到括号为止,实际上必定找到空集)的集合。
非基础集的典型的例子是满足x∈x的集合,直观形象是“${{{…}}}$”,括号无穷无尽,沿着括号往里进,永远找不到底。
有一本书专门研究非基础集:Aczel的《Non-well-founded sets》。
选择公理(AC):任何非空集合的集族上都有选择函数。
选择公理有各种等价形式,最为重要的是:
良序原理:对所有的集合a,a∈WO。
其中,WO={x:x上存在良序关系},称作良序集宇宙。
若把所有集合构成的真类记作V(称作“集宇宙”),那么,良序原理是说:V=WO。
选择公理排除了所有的“非良序集”。
我们已经知道,良序集是可以被序数“度量”的集合。
非良序集的直观涵义就是不可能被序数“度量”的集合。
有一些书籍专门研究选择公理,如Jech的《The axiom of choice》等。
我们看到,“良基理论”和“良序理论”有类似的地方,但也有本质的区别,下面比较它们的相同点和不同点:
类似的地方如下:
良基理论是对集合的“深度”的研究,即对“括号层数”的定量研究,运用了“秩”(一种特殊的序数)这一概念;
良序理论是对集合的“广度”的研究,即对“元素个数”的定量研究,运用了“基数”(一种特殊的序数)这一概念。
但也有本质区别:
WF的性质很封闭,稳定,不依赖正则公理,正则公理的作用仅仅在于把V(集宇宙)限制于WF;
而WO的性质很开放,很不稳定,AC的作用不仅仅在于把V(集宇宙)限制于WO,就连WO自身的一些性质也要依赖于AC!(例如,没有AC,WO关于并、幂运算都可能是不封闭的)
基数的乘幂运算的定义也要依赖AC。
完。
附:下面是我对选择公理的一些看法(只是某种相当粗略的说法):
AC的本质在于:承认形式系统中某种无限次操作的合理性。无穷公理的本质在于承认形式系统中“实无限”的合理性,两者是不同的:无穷公理把实无限作为合法对象引入了形式系统,但并不知道形式系统中进行某种无限次的操作是否合法,比如不知道可不可以进行无限次任意的选取。而AC则承认了必须经过形式系统中无限次选取才能构造出来的集合的存在性,实际上是承认了形式系统中某种无限次操作的合法性。
从AC的等价形式,如Zorn引理、Tukey引理、hausdoff极大原理等命题中可以看出,AC相当于断言某种“不可构造的存在”的合法性,比如Zorn引理中的极大元是不可构造的,仅仅断言存在而已,等等。
其实,正是AC的承认形式系统中某种无限次操作的合理性这一本质导致了AC相当于断言某种“不可构造的存在”的合法性:因为无限次操作是人类无法真正做到的,无限次操作得到的东西是“不可构造”的!