热线电话：13121318867

算法导论_二叉搜索树_数据分析师

2014-12-10

算法导论_二叉搜索树_数据分析师

先上二叉树查找树的删除的代码，因为删除是二叉查找树最复杂的操作：

[cpp] view plaincopy

int BinarySearchTree<T>::tree_remove(const T& elem)
{
BinarySearchTreeNode<T> *z = tree_search(elem);//根据元素查找到要删除的节点
BinarySearchTreeNode<T> *x, *y;
if (z != NULL)
{
//用y来表示实际要删除的节点
if (z->left == NULL || z->right == NULL)//最多只有一个儿子节，要么没有儿子节点
y = z;
else
y = tree_search(tree_successor(elem));//有两个儿子的时候实际删除的是后继节点
//因为有上面的if语句，所以y要么只有一个儿子，要么没有儿子。后继节点只有右儿子或者没有儿子
//所以x要么是儿子节点，要么是空节点
if (y->left != NULL)
x = y->left;
else
x = y->right;
if (x != NULL)//判断y节点有没有儿子节点，有的花就把y节点的父节点变成x的父节点。
x->parent = y->parent;
//y是根节点或者不是根节点的情况
if (y->parent == NULL)
root = x;
else if (y == y->parent->left)//如果y节点不是根节点的情况该怎么处理呢？
y->parent->left = x;
else
y->parent->right = x;
//处理后继节点的情况，因为y表示后继的时候y！=z；
if (y != z)
z->elem = y->elem;
delete y;
}
return -1;
}

二叉查找树的概念及操作。主要内容包括二叉查找树的性质，如何在二叉查找树中查找最大值、最小值和给定的值，如何找出某一个元素的前驱和后继，如何在二叉查找树中进行插入和删除操作。在二叉查找树上执行这些基本操作的时间与树的高度成正比，一棵随机构造的二叉查找树的期望高度为O(lgn)，从而基本动态集合的操作平均时间为θ(lgn)。

1、二叉查找树

　　二叉查找树是按照二叉树结构来组织的，因此可以用二叉链表结构表示。二叉查找树中的关键字的存储方式满足的特征是：设x为二叉查找树中的一个结点。如果y是x的左子树中的一个结点，则key[y]≤key[x]。如果y是x的右子树中的一个结点，则key[x]≤key[y]。根据二叉查找树的特征可知，采用中根遍历一棵二叉查找树，可以得到树中关键字有小到大的序列。

一棵二叉树查找及其中根遍历结果如下图所示：

书中给出了一个定理：如果x是一棵包含n个结点的子树的根，则其中根遍历运行时间为θ(n)。

问题：二叉查找树性质与最小堆之间有什么区别？能否利用最小堆的性质在O(n)时间内，按序输出含有n个结点的树中的所有关键字？

2、查询二叉查找树

　　二叉查找树中最常见的操作是查找树中的某个关键字，除了基本的查询，还支持最大值、最小值、前驱和后继查询操作，书中就每种查询进行了详细的讲解。

（1）查找SEARCH

　　在二叉查找树中查找一个给定的关键字k的过程与二分查找很类似，根据二叉查找树在的关键字存放的特征，很容易得出查找过程：首先是关键字k与树根的关键字进行比较，如果k大比根的关键字大，则在根的右子树中查找，否则在根的左子树中查找，重复此过程，直到找到与遇到空结点为止。例如下图所示的查找关键字13的过程：（查找过程每次在左右子树中做出选择，减少一半的工作量）

书中给出了查找过程的递归和非递归形式的伪代码：

[cpp] view plaincopy

TREE_SEARCH(x,k)
if x=NULL or k=key[x]
then return x
if(k<key[x])
then return TREE_SEARCH(left[x],k)
else
then return TREE_SEARCH(right[x],k)

[cpp] view plaincopy

ITERATIVE_TREE_SEARCH(x,k)
while x!=NULL and k!=key[x]
do if k<key[x]
then x=left[x]
else
then x=right[x]
return x

（2）查找最大关键字和最小关键字

　　根据二叉查找树的特征，很容易查找出最大和最小关键字。查找二叉树中的最小关键字：从根结点开始，沿着各个节点的left指针查找下去，直到遇到 NULL时结束。如果一个结点x无左子树，则以x为根的子树中，最小关键字就是key[x]。查找二叉树中的最大关键字：从根结点开始，沿着各个结点的 right指针查找下去，直到遇到NULL时结束。书中给出了查找最大最小关键字的伪代码：

[cpp] view plaincopy

TREE_MINMUM(x)
hile left[x] != NULL
do x=left[x]
eturn x

[cpp] view plaincopy

TREE_MAXMUM(x)
while right[x] != NULL
do x= right[x]
return x

（3）前驱和后继

　　给定一个二叉查找树中的结点，找出在中序遍历顺序下某个节点的前驱和后继。如果树中所有关键字都不相同，则某一结点x的前驱就是小于key[x]的所有关键字中最大的那个结点，后继即是大于key[x]中的所有关键字中最小的那个结点。根据二叉查找树的结构和性质，不用对关键字做任何比较，就可以找到某个结点的前驱和后继。

　　查找前驱步骤：先判断x是否有左子树，如果有则在left[x]中查找关键字最大的结点，即是x的前驱。如果没有左子树，则从x继续向上执行此操作，直到遇到某个结点是其父节点的右孩子结点。例如下图查找结点7的前驱结点6过程：

　　查找后继步骤：先判断x是否有右子树，如果有则在right[x]中查找关键字最小的结点，即使x的后继。如果没有右子树，则从x的父节点开始向上查找，直到遇到某个结点是其父结点的左儿子的结点时为止。例如下图查找结点13的后继结点15的过程：

书中给出了求x结点后继结点的伪代码:

[cpp] view plaincopy

TREE_PROCESSOR(x)
if right[x] != NULL
then return TREE_MINMUM(right(x))
y=parent[x]
while y!= NULL and x ==right[y]
do x = y
y=parent[y]
return y

定理：对一棵高度为h的二叉查找，动态集合操作SEARCH、MINMUM、MAXMUM、SUCCESSOR、PROCESSOR等的运行时间均为O(h)。

3、插入和删除

　　插入和删除会引起二叉查找表示的动态集合的变化，难点在在插入和删除的过程中要保持二叉查找树的性质。插入过程相当来说要简单一些，删除结点比较复杂。

（1）插入

　　插入结点的位置对应着查找过程中查找不成功时候的结点位置，因此需要从根结点开始查找带插入结点位置，找到位置后插入即可。下图所示插入结点过程：

书中给出了插入过程的伪代码：

[cpp] view plaincopy

TREE_INSERT(T,z)
y = NULL;
x =root[T]
while x != NULL
do y =x
if key[z] < key[x]
then x=left[x]
else x=right[x]
parent[z] =y
if y=NULL
then root[T] =z
else if key[z]>key[y]
then keft[y] = z
else right[y] =z

插入过程运行时间为O(h)，h为树的高度。

（2）删除

　　从二叉查找树中删除给定的结点z，分三种情况讨论：

<1>结点z没有左右子树，则修改其父节点p[z]，使其为NULL。删除过程如下图所示：

<2>如果结点z只有一个子树（左子树或者右子树），通过在其子结点与父节点建立一条链来删除z。删除过程如下图所示：

<3>如果z有两个子女，则先删除z的后继y（y没有左孩子），在用y的内容来替代z的内容。

书中给出了删除过程的伪代码：

[cpp] view plaincopy

TREE_DELETE(T,z)
if left[z] ==NULL or right[z] == NULL
then y=z
else y=TREE_SUCCESSOR(z)
if left[y] != NULL
then x=left[y]
else x=right[y]
if x!= NULL
then parent[x] = parent[y]
if p[y] ==NULL
then root[T] =x
else if y = left[[prarnt[y]]
then left[parent[y]] = x
else right[parent[y]] =x
if y!=z
then key[z] = key[y]
copy y's data into z
return y

定理：对高度为h的二叉查找树，动态集合操作INSERT和DELETE的运行时间为O(h)。

4、实现测试

　　采用C++语言实现一个简单的二叉查找树，支持动态集合的基本操作：search、minmum、maxmum、predecessor、successor、insert和delete。设计的二叉查找树结构如下所示：

[cpp] view plaincopy

template<class T>
class BinarySearchTreeNode
{
public:
T elem;
BinarySearchTreeNode<T> *parent;
BinarySearchTreeNode<T> *left;
BinarySearchTreeNode<T> *right;
};
template<class T>
class BinarySearchTree
{
public:
BinarySearchTree();
void tree_insert(const T& elem);
int tree_remove(const T& elem);
BinarySearchTreeNode<T> *tree_search(const T& elem) const;
T tree_minmum(BinarySearchTreeNode<T>* root) const;
T tree_maxmum(BinarySearchTreeNode<T>* root) const;
T tree_successor(const T& elem) const;
T tree_predecessor(const T& elem) const;
int empty() const;
void inorder_tree_walk() const;
BinarySearchTreeNode<T>* get_root() { return root; }
private:
BinarySearchTreeNode<T>* root;
};

完整程序如下所示：

[cpp] view plaincopy

#include<iostream>
#include<stack>
using namespace std;
/*-----------------------------------------------------------------------------------------------*/
/*采用C++语言实现一个简单的二叉查找树，支持动态集合的基本操作： */
/*search、minmum、maxmum、predecessor、successor、insert和delete。设计的二叉查找树结构如下所示： */
/*------------------------------------------------------------------------------------------------*/
template<class T>
class BinarySearchTreeNode
{
public:
T elem;
BinarySearchTreeNode<T> *parent;
BinarySearchTreeNode<T> *left;
BinarySearchTreeNode<T> *right;
};
template<class T>
class BinarySearchTree
{
public:
BinarySearchTree();
void tree_insert(const T& elem);
int tree_remove(const T& elem);
BinarySearchTreeNode<T> *tree_search(const T& elem) const;
T tree_minmum(BinarySearchTreeNode<T>* root) const;
T tree_maxmum(BinarySearchTreeNode<T>* root) const;
T tree_successor(const T& elem) const;
T tree_predecessor(const T& elem) const;
int empty() const;
void inorder_tree_walk() const;
BinarySearchTreeNode<T>* get_root() { return root; }
private:
BinarySearchTreeNode<T>* root;
};
//构造函数，初始化二叉查找树。
template <class T>
BinarySearchTree<T>::BinarySearchTree()
{
root = NULL;
}
template <class T>
void BinarySearchTree<T>::tree_insert(const T& elem)
{
if (!empty())
{
BinarySearchTreeNode<T> *p_node = root;
BinarySearchTreeNode<T> *q_node = NULL;
BinarySearchTreeNode<T> *new_node = new BinarySearchTreeNode<T>;
new_node->elem = elem;
new_node->left = NULL;
new_node->right = NULL;
new_node->parent = NULL;
while (p_node)
{
q_node = p_node;
if (p_node->elem > elem)
p_node = p_node->left;
else
p_node = p_node->right;
}//当p_node为空的时候，q_node正好是正确的插入位置的父节点，且q_node是叶节点.
if (q_node->elem > elem)
q_node->left = new_node;
else
q_node->right = new_node;
new_node->parent = q_node;
}
else
{
root = new BinarySearchTreeNode<T>;
root->elem = elem;
root->parent = NULL;
root->left = NULL;
root->right = NULL;
}
}
//二叉查找树节点的删除
template <class T>
int BinarySearchTree<T>::tree_remove(const T& elem)
{
BinarySearchTreeNode<T> *z = tree_search(elem);
BinarySearchTreeNode<T> *x, *y;
if (z != NULL)
{
//用y来表示实际要删除的节点
if (z->left == NULL || z->right == NULL)//最多只有一个儿子节，要么没有儿子节点
y = z;
else
y = tree_search(tree_successor(elem));//有两个儿子的时候实际删除的是后继节点
//因为有上面的if语句，所以y要么只有一个儿子，要么没有儿子。后继节点只有右儿子或者没有儿子
//所以x要么是儿子节点，要么是空节点
if (y->left != NULL)
x = y->left;
else
x = y->right;
if (x != NULL)
x->parent = y->parent;
if