Cracking the Coding Interview 150题(一)

1、数组与字符串

1.1 实现一个算法,确定一个字符串的所有字符是否全都不同。假设不允许使用额外的数据结构,又该如何处理?

1.2 用C或C++实现void reverse(char* str)函数,即反转一个null结尾的字符串。

1.3 给定两个字符串,请编写程序,确定其中一个字符串的字符重新排列后,能否变成另一个字符串。

1.4 编写一个方法,将字符串中的空格全部替换为“%20”。假设该字符串尾部有足够的空间存放新增字符,并且知道字符串的“真实”长度。示例:输入Mr John Smith,输出Mr%20John%20Smith

1.5 利用字符重复出现的次数,编写一个方法,实现基本的字符串压缩功能。比如,字符串aabcccccaaa会变为a2b1c5a3。若“压缩”后的字符串没有变短,则返回原先的字符串。

1.6 给定一幅由 N x N 矩阵表示的图像,其中每个像素的大小为 4 字节,编写一个方法,将图像旋转90度。不占用额外内存空间能否做到?

1.7 编写一个算法,若 M x N 矩阵中某个元素为0,则将其所在的行与列清零。

1.8 假定有一个方法isSubstring,可检查一个单词是否为其他字符串的子串。给定两个字符串 s1 和 s2,请编写代码检查 s2 是否为 s1 旋转而成,要求只能调用一次isSubstring。(比如,waterbottleerbottlewat旋转后的字符串。)



2、链表

2.1 编写代码,移除未排序链表中的重复结点。如果不得使用临时缓冲区,又该怎么解决?

2.2 实现一个算法,找出单向链表中倒数第 k 个结点。

2.3 实现一个算法,删除单向链表中间的某个结点,假定你只能访问该结点。示例:

  • 输入:单向链表a->b->c->d->e中的结点c
  • 结果:不返回任何数据,但该链表变为a->b->d->e

2.4 编写代码,以给定值x为基准将链表分割成两部分,所有小于x的结点排在大于或等于x的结点之前。

2.5 给定两个用链表表示的整数,每个结点包含一个数位。这些数位是反向存放的,也就是个位排在链表首部。编写函数对这两个整数求和,并用链表形式返回结果。示例:

  • 输入:(7->1->6)+(5->9->2),即 617+295
  • 输出:2->1->9,即 912

假设这些数位是正向存放的,请再做一遍。示例:

  • 输入:(6->1->7)+(2->9->5),即 617+295
  • 输出:9->1->2,即 912

2.6 给定一个有环链表,实现一个算法返回环路的开头结点。有环链表的定义:在链表中某个结点的 next 元素指向在它前面出现过的结点,则表明该链表存在环路。示例:

  • 输入:A->B->C->D->E->C(C结点出现了两次)
  • 输出:C

2.7 编写一个函数,检查链表是否为回文。











参考答案(C++)


1.1 如果允许使用数据结构,我首先想到的是map,下标操作map['key']在 key 存在时执行搜索操作,否则执行插入操作。示例代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
bool func(char A[], int len)
{

map<char, int> amap;
for(int i=0; i<len; ++i)
{
amap[A[i]] += 1;
}

map<char, int>::iterator beg = amap.begin();
for(;beg!=amap.end(); ++beg)
{
if(beg->second > 1)
return false;
}
return true;
}

如果不允许使用额外的数据结构,该如何处理呢?假定字符集为 ASCII,那么我们可以创建一个标记数组,索引 i 对应的 bool 值指示该字符串是否含有字母表第 i 个字符。若这个字符第二次出现,则立即返回 false。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
bool func(char A[], int len)   // 假定字符集为 ASCII
{

if(len > 256)
return false;

bool char_set[256] = {false};
for(int i=0; i<len; ++i)
{
if(char_set[A[i]]) // 字符已经出现过
return false;
char_set[A[i]] = true;
}

return true;
}



1.2 根据函数的原型void reverse(char* str),我们并不知道字符串的长度,所以需要先求出长度再进行反转:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
void reverse(char* str)
{

char* tmp = str;
int len = 0;
while(*tmp++ != '\0') // 求出字符串的长度
++len;

int low = 0;
int high = len - 1;
while(low < high) // 反转
{
char c = str[low];
str[low] = str[high];
str[high] = c;
++low;
--high;
}
}



1.3 由题意可知,这是一个变位词的问题,可以看我的另一篇文章《变位词问题》。通常的做法是把两个字符串按字母表顺序排序,比较排序后的字符串是否相等:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
bool myfunction(char i, char j)
{

return i > j;
}

bool Compare(string s1, string s2)
{

if(s1.length() != s2.length())
return false;

// 泛型算法 sort() 采用的是快速排序算法
sort(s1.begin(), s1.end(), myfunction);
sort(s2.begin(), s2.end(), myfunction);
if(!s1.compare(s2)) // 相等返回0
return true;
else
return false;
}

另外一种方法就是:检查两个字符串的各字符数是否相同。(假定字符集为ASCII)我们只需创建一个大小 256 的整型数组,遍历第一个字符串,给每个字符计数;遍历第二个字符串,递减对应字符的数量。最后判断数组元素是否全部为0。



1.4 本题的思路就是进行两次扫描。第一次扫描记录字符串中有多少空格,从而计算最终字符串的长度;第二次扫描从后往前移动字符并插入20%。代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
void replaceSpace(char *str, int len)
{

int spaceNum = 0;
for(int i=0; i<len; ++i)
{
if(str[i] == ' ')
++spaceNum;
}

int newLen = len + spaceNum*2;
for(int i=len-1; i>=0; --i)
{
if(str[i] != ' ')
{
str[newLen - 1] = str[i];
newLen = newLen - 1;
}
else
{
str[newLen - 1] = '0';
str[newLen - 2] = '2';
str[newLen - 3] = '%';
newLen = newLen - 3;
}
}
}



1.5 本题思路很简单:遍历字符串,将字符和对应的重复次数拷贝到新字符串。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
// int转string
string int2string(int n)
{

stringstream ss;
string str;
ss << n;
ss >> str;
return str;
}

string compress(string str)
{

string tmp;
char c = str[0];
int count = 1;
for(int i=1; i<str.length(); ++i)
{
if(str[i] == c)
++count;
else
{
tmp = tmp + c + int2string(count);
c = str[i];
count = 1;
}
}
tmp = tmp + c + int2string(count);

return str.length()>tmp.length() ? tmp:str;
}



1.6 归纳题意,简言之就是:对N阶方阵进行原地转置。(思路就是对每一层执行环状旋转,将上边移到右边、右边移到下边、下边移到左边、左边移到上边)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
void rotate(int **mtx, int n)
{

for(int layer=0; layer < n/2; ++layer)
{
int first = layer;
int last = n-1-layer;
for(int i=first; i<last; ++i)
{
int offset = i - first;
// 暂存上边:top = mtx[first][i]
int top = *((int*)mtx+first*n+i);

// 左到上:mtx[first][i] = mtx[last-offset][first]
*((int*)mtx+first*n+i) = *((int*)mtx+(last-offset)*n+first);

// 下到左:mtx[last-offset][first] = mtx[last][last-offset]
*((int*)mtx+(last-offset)*n+first) = *((int*)mtx+last*n+(last-offset));

// 右到下:mtx[last][last-offset] = mtx[i][last]
*((int*)mtx+last*n+(last-offset)) = *((int*)mtx+i*n+last);

// 上到右:mtx[i][last] = top
*((int*)mtx+i*n+last) = top;
}
}
}

这里要注意二维数组作参数传递的问题,另外调用的时候像这样rotate((int**)A, 4)。这个算法的时间复杂度为O(n^2),已是最优的做法。



1.7 这个问题貌似很简单,直接遍历嘛!只要发现为零的元素,就将其所在的行与列清零。不过这个方法有个陷阱:清零以后会导致连锁效应,最后整个矩阵都变成 0。我们的做法是:遍历两遍,第一遍记录要清零的行与列,第二遍再执行清零操作。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
void setZero(int **mtx, int m, int n)
{

bool *row = new bool[m](); // 默认初始化为false
bool *col = new bool[n]();

for(int i=0; i<m; ++i)
for(int j=0; j<n; ++j)
{
if(*((int*)mtx+i*n+j) == 0)
{
row[i] = true;
col[j] = true;
}
}

for(int i=0; i<m; ++i)
for(int j=0; j<n; ++j)
{
if(row[i] || col[j])
{
*((int*)mtx+i*n+j) = 0;
}
}

delete [] row;
delete [] col;
}



1.8 如果x = waty = erbottle,则s1 = xys2 = yx。不论x和y之间的分割点在何处,我们会发现yx肯定是xyxy的子串。即,s2总是s1s1的子串。

1
2
3
4
5
6
7
8
bool isRotation(string s1, string s2)
{

if(s1.length() == s2.length() && s1.length()>0)
{
return isSubstring(s1+s1, s2);
}
return false;
}




在解决链表问题时,首先我们得学会如何创建链表,下面是单链表创建和打印的示例代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
typedef struct node 
{
node* next;
int data;
} *LinkList;

// 根据数组创建单链表:尾插法
LinkList createList(int A[], int len)
{

int i = 0;
node *head = (node*)malloc(sizeof(node));
node *s, *tail = head;
while(i<len)
{
s = (node*)malloc(sizeof(node));
s->data = A[i++];
tail->next = s;
tail = s;
}
tail->next = NULL;
return head; /*头结点不保存数据*/
}

// 打印单链表
void printList(LinkList L)
{

node *p = L->next;
while(p!=NULL)
{
cout << p->data;
p = p->next;

if(p!=NULL)
cout << "->";
}
cout << endl;
}



2.1 要想移除链表中的重复结点,我们只需在遍历的过程中,将每个未重复结点加入一个缓冲区。若发现有结点在缓冲区已经存在(即重复),则将该结点从链表中移除。只需遍历一次即可。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
void deleteDups(LinkList L)
{

set<int> buffer; // 这里使用set容器
node *p = L->next;
node *pre = L;
while(p!=NULL)
{
int data = p->data;
if(buffer.find(data) == buffer.end())
{
buffer.insert(data);
pre = p;
p = p->next;
}
else /* 重复 */
{
pre->next = p->next;
node* q = p; // 记录删除的结点
p = p->next;
free(q); // 释放
}
}
}

如果不借助额外的缓冲区,那么就只能两两比较以判断是否重复,时间复杂度为O(n^2)。需要使用两个指针来迭代:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
void deleteDups(LinkList L)
{

if(L == NULL) return;

node* current = L->next;
while(current!=NULL)
{
node* runner = current;
while(runner->next!=NULL)
{
if(runner->next->data == current->data)
{
node* p = runner->next;
runner->next = runner->next->next;
free(p);
}
else
{
runner = runner->next;
}
}
current = current->next;
}
}



2.2 本题有多种解法。

  • 解法一:有人可能首先会想到:这太简单了,先遍历一次链表获取长度 length,那么倒数第 k 个结点就是第 (length - k)个结点。但是,你觉得这会是面试官想要的答案吗??

  • 解法二:递归。先通过递归到达链表的末尾,然后从后往前进行计数,每次递归调用返回时,将计数器加1。当计数器等于 k 时,访问的就是链表倒数第 k 个元素。(注意计数器 i 需要传引用

1
2
3
4
5
6
7
8
9
10
11
12
13
node* kthToLast(node* head, int k, int &i)
{
if(head == NULL)
return NULL;

node* p = kthToLast(head->next, k, i);
i = i + 1;
if(i == k)
{
return head;
}
return p;
}
  • 解法三:迭代法。相比于递归,迭代法通常不太直观但效率更高。思路就是:用两个指针 p1 和 p2 指向链表中两个距离为k的结点,然后以相同速度移动这两个指针,当其中一个指针指向链表的尾结点时,另一个指针指向的就是倒数第k个结点。(“快行指针”技巧
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
node* kthToLast(LinkList L, int k)    // 时间复杂度O(n),空间复杂度O(1)
{
if(k<=0)
return NULL;

// 两个指针
node* p1 = L->next;
node* p2 = L->next;

// p2向前移动k个结点
for(int i=0; i<k-1; ++i)
{
if(p2 == NULL) /*错误检查*/
return NULL;
p2 = p2->next;
}

if(p2 == NULL) return NULL;

// 移动p1与p2
while(p2->next!=NULL)
{
p1 = p1->next;
p2 = p2->next;
}
return p1;
}



2.3 本题中,你访问不到链表的首结点,只能访问待删除结点及之后的结点。所以我们的做法是:直接将后继结点的数据复制到当前结点,然后删除这个后继结点。

1
2
3
4
5
6
7
8
9
10
11
12
bool deleteNode(node* c)
{

if(c==NULL || c->next==NULL) // 尾结点无法删除
return false;

node* next = c->next;
c->data = next->data;
c->next = next->next;
free(next);

return true;
}



2.4 链表不同于数组,在用现有元素创建新的链表时,我们不必移动和交换元素,只是改变元素的 next 指针的指向。所以本题的思路也很简单:遍历链表,将小于 x 的元素连接成一个链表,将大于等于 x 的元素连接成一个链表,最后合并两个链表即可。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
LinkList partition(LinkList L, int x)
{

node* biggerHead = NULL;
node* biggerTail = NULL;
node* smallerHead = NULL;
node* smallerTail = NULL;

node* p = L->next;
while(p!=NULL)
{
node* next = p->next;
p->next = NULL;
if(p->data < x)
{ /*将比x小的结点插入smaller链表的尾部*/
if(smallerHead == NULL)
{
smallerHead = p;
smallerTail = smallerHead;
}
else
{
smallerTail->next = p;
smallerTail = p;
}
}
else
{ /*将比x大的结点插入bigger链表的尾部*/
if(biggerHead == NULL)
{
biggerHead = p;
biggerTail = biggerHead;
}
else
{
biggerTail->next = p;
biggerTail = p;
}
}
p = next;
}

/*遍历结束,合并两个链表*/
if(smallerHead == NULL)
{
L->next = biggerHead;
return L;
}
smallerTail->next = biggerHead;
L->next = smallerHead;
return L;
}



2.5 本题的思路是逐个结点对应相加,然后判断是否进位。我们使用递归来模拟这个加法过程。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
LinkList add(LinkList L1, LinkList L2, int carry)
{

/*两个链表全部为空且进位为0,则函数返回*/
if(L1==NULL && L2==NULL && carry==0)
return NULL;

node* result = (node*)malloc(sizeof(node));

int value = carry;
if(L1!=NULL)
value+=L1->data;
if(L2!=NULL)
value+=L2->data;

result->data = value%10; /*取个位*/

node* more = add(L1==NULL?NULL:L1->next,
L2==NULL?NULL:L2->next,
value>=10?1:0);

result->next = more;
return result;
}

注意,这里add之后返回的链表没有“头指针”。



2.6 这个问题是由经典面试题——检查链表是否存在回路——演变而来。

如上图所示,如果链表中存在回路,那么我们遍历时会陷入死循环。那么,我们如何检测链表是否存在环 以及 寻找环的入口点呢?答案是“快慢指针”

① 设置两个指针(fast、slow),初始值都指向头,slow每次前进一步,fast每次前进二步。如果链表存在环,则fast必定先进入环,而slow后进入环,两个指针必定相遇。这是检测

② 在fast和slow第一次相遇的时候,假定slow走了n步,环路的入口是在p步,
c为fast和slow相交点距离环路入口的距离。那么,slow走的路径: p+c = n;
fast走的路径: p+c+k*L = 2*n(L为环路的周长,k是整数),即n = k*L
显然,如果从p+c点开始,slow再走n步的话,还可以回到p+c这个点。
同时,fast从头开始走,步长为1,经过n步,也会达到p+c这点。
显然,在这个过程中fast和slow只有前p步骤走的路径不同。所以当p1和p2再次重合的时候,必然是在链表的环路入口点上。

③ 综上所述,可得出如下算法:

  • 创建两个指针:fast和slow

  • slow每走一步,fast就走两步

  • 两者碰在一起时,将slow重新指向链表头,fast保持不变

  • 以相同速度移动slow和fast,一次一步,然后返回新的碰撞处。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
node* findLoopEntrance(LinkList L)
{
node* slow = L->next;
node* fast = L->next;

while(fast!=NULL && fast->next!=NULL)
{
slow = slow->next;
fast = fast->next->next;
if(fast == slow) /*碰撞*/
break;
}

if(fast==NULL || fast->next==NULL)
return NULL; /*没有环路*/

slow = L->next; /*重新指向链表头*/
while(slow!=fast)
{
slow = slow->next;
fast = fast->next;
}
return fast;
}



2.7 所谓“回文”指正向看和反向看是一样的。在链表中可以定义为 0->1->2->1->0

  • 解法一:根据定义,先将整个链表反转,然后比较反转链表和原始链表。若两者相同,则该链表为回文。(只需比较链表的前半部分)

  • 解法二:迭代法。先进行迭代,将链表的前半部分入栈,再继续进行迭代,与后半部分进行比较。每次迭代时,比较当前结点和栈顶元素,若完成迭代时比较结果完全相同,则该链表为回文。(在链表长度未知的情况下,可以使用“快慢指针”将前半部分入栈)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
bool isPalindrome(LinkList L)
{

node* fast = L->next;
node* slow = L->next;

stack<int> s;

/**将链表的前半部分入栈**/
while(fast!=NULL && fast->next!=NULL)
{
s.push(slow->data);
slow = slow->next;
fast = fast->next->next;
}

/**链表有奇数个元素,跳过中间元素**/
if(fast!=NULL)
slow = slow->next;

/**比较**/
while(slow!=NULL)
{
int top = s.top();
s.pop();
if(top!=slow->data)
return false;
slow = slow->next;
}

return true;
}