本节要讨论的是当给定 n(n>=0)个结点时,可以构建多少种形态不同的树。
如果两棵树中各个结点的位置都一一对应,可以说这两棵树相似。如果两棵树不仅相似,而且对应结点上的数据也相同,就可以说这两棵树等价。本节中,形态不同的树指的是互不相似的树。
前面介绍过,对于任意一棵普通树,通过孩子兄弟表示法的转化,都可以找到唯一的一棵二叉树与之对应。所以本节研究的题目也可以转化成:n 个结点可以构建多少种形态不同的二叉树。
每一棵普通树对应的都是一棵没有右子树的二叉树,所以对于 n 个结点的树来说,树的形态改变是因为除了根结点之外的其它结点改变形态得到的,所以,n 个结点构建的形态不同的树与之对应的是 n-1 个结点构建的形态不同的二叉树。
如果 tn 表示 n 个结点构建的形态不同的树的数量,bn 表示 n 个结点构建的形态不同的二叉树的数量,则两者之间有这样的关系:tn=bn-1
。
【方法一】
最直接的一种方法就是推理。当 n=0 时,只能构建一棵空树;当 n=2 时,可以构建 2 棵形态不同的二叉树,如图 1(a);当 n=3 时,可以构建 5 棵形态互不相同的二叉树,如图 1(b)。
图 1 不同形态的二叉树
对于具有 n( n>1 )个结点的二叉树来说,都可以看成是一个根结点、由 i 个结点组成的左子树和由 n-i-1
个结点组成的右子树。
当 n=1 时,也适用,只不过只有一个根结点,没有左右孩子(i=0)。
可以得出一个递推公式:
通过对公式一步步的数学推算,最后得出,含有 n 个结点的不相似的二叉树的数量为:
【方法二】
从遍历二叉树的角度进行分析,对于任意一棵二叉树来说,它的前序序列和中序序列以及后序序列都是唯一的。其实是这句话还可以倒过来说,只要确定了一棵二叉树的三种遍历序列中的两种,那么这棵二叉树也可以唯一确定。
例如,给定了一个二叉树的前序序列和中序序列分别为:
前序序列:a b c d e f g
中序序列:c b e d a f g
可以唯一得到的二叉树如图 2(4):
图 2 构造二叉树的过程示意图
分析:通过前序序列得知,结点a为二叉树的根结点,结合中序序列,在结点 a 左侧的肯定为其左孩子中的所有结点,右边为右孩子的所有结点,如图 2(1)所示。
再分析 a 结点的左孩子,在前序序列看到,结点 a 后紧跟的是结点 b,由此断定结点 a 的左孩子是 b,再看中序序列,结点 b 左侧只有一个结点 c ,为 b 的左孩子,结点 b 右侧的结点e 和 d 为右孩子,如图 2(2)。
再分析结点 b 的右孩子,前序序列看到,结点 d 在 e 的前边,所有 d 为 b 的右孩子。在中序序列中,结点 e 在 d 前边,说明 e 是 d 的左孩子,如图 2(3)。
最后分析结点 a 的右孩子,由前序序列看到, f 在 g 前边,说明f为根结点。在中序序列中也是如此,说明,g 是 f 的右孩子。如图 2(4)所示。
如果要唯一确定一棵二叉树,必须知道至少两种遍历序列。如果只确定一种序列,无法准确判定二叉树的具体构造。
图 3 前序序列(1,2,3)的二叉树
如图 3 所示为前序序列(1,2,3)构建的不同形态的二叉树,他们的中序序列各不相同。所以不同形态二叉树的数目恰好就是前序序列一定的情况下,所能得到的不同的中序序列的个数。
中序序列是对二叉树进行中序遍历获得的,遍历的过程实质上就是结点数据进栈出栈的过程。所以,中序序列的个数就是数列(1,2,3)按1-2-3的顺序进栈,各元素选择在不同的时间点出栈,所获的的不同的出栈顺序即为中序序列,而中序序列的数目,也就是不同形态的二叉树的个数。
图 4 中序遍历时进栈和出栈的过程
根据数列中数据的个数 n,所得到的排列顺序的数目为:
通过以上两种方式,都可以知道 n 个结点能构建的不同形态的二叉树的数量,再结合 tn=bn-1,就可以计算出 n 个结点能构建的不同形态的树的个数。