图灵机理论基础 ¶

约 2795 个字预计阅读时间 9 分钟

Abstract

理论计算机科学导引第八至第九周课程内容

图灵机 ¶

基本定义 ¶

一个“纸带”，一个读写头可进行单元格的左右移动和符号的读写
- 特殊符号 \(\rhd\)（left end symbol）表示纸带的最左侧，无法覆盖
- 特殊符号 \(⌴\)（black symbol）表示纸带这个位置是一个空格子
一个图灵机定义为一个五元组 \(M=(K, \Sigma, \delta, s, H)\)
- \(K\)：状态的有限集合
- \(\Sigma\)：纸带上可以出现的符号（包括 \(\rhd⌴\)）
- \(s\in K\)：起始状态
- \(H\subseteq K\)：停机状态（halting state）的集合
- \(\delta\colon(K-H)\times\Sigma\rightarrow K\times(\{\leftarrow, \rightarrow\}\cup (\Sigma-\{\rhd\}))\)：转移函数，其中：
  - \((K-H)\)：非停机状态，停机状态无法再转移
  - \(\Sigma\)：读写头读到的符号
  - \(\{\leftarrow, \rightarrow\}\)：读写头向左 / 右移动
  - \((\Sigma-\{\rhd\})\)：读写头写入的符号，不能写入 \(\rhd\)
  - 需要满足 \(\forall q\in K, \delta(q, \rhd)=(p, \rightarrow)\) for some \(p\)
configuration：\(K\times\rhd(\Sigma-\{\rhd\})^*\times(\{e\}\cup(\Sigma-\{\rhd\})^*(\Sigma-\{\rhd, ⌴\}))\)
- \(\rhd(\Sigma-\{\rhd\})^*\)：纸带上到读写头为止的部分，\(\rhd\) 开头，最后一个为读写头指向的位置
- \(\{e\}\)：读写头右侧没有非空格子的话就是 \(e\)
- \((\Sigma-\{\rhd\})^*(\Sigma-\{\rhd, ⌴\})\)：读写头右侧的非空格子
- e.g. \((q, \rhd⌴ab, a)\)，等价可以写为 \((q, \rhd⌴a\underline{b}a)\)（下划线表示读写头指向的位置）
- 初始 configuration：\((s, ?)\)，纸带内容不同场合有不同约定
- 停机 configuration：\((h, ?), h\in H\)，纸带内容无所谓
yields in one step / yields
- \((q_1, \rhd w_1\underline{a_1}u_1)\vdash_M(q_2, \rhd w_2\underline{a_2}u_2)\) if:
  - \(\delta(q_1, a_1) = (q_2, a_2),\ w_1=w_2,\ u_1=u_2\)：写的情况
  - \(\delta(q_1, a_1) = (q_2, \leftarrow),\ w_1=w_2a_2,\ u_2 = a_1u_1\)：左移的情况
    - 特殊情况：if \(a_1 = ⌴\) and \(u_1=e\), \(u_2=e\)
  - \(\delta(q_1, a_1) = (q_2, \rightarrow),\ w_2=w_1a_1,\ u_1 = u_2a_2\)：右移的情况
- yields 还是相等或者 yield 一步或更多步

构建图灵机 ¶

basic machines
- symbol writing machine \(M_a\)，记为 \(a\)
  - 效果：如果当前位置可写，就写入 \(a\)，如果当前位置是 \(\rhd\) 就右移一位再写入 \(a\)
  - 定义 \(M_a=(\{s, h\}, \Sigma, \delta, s, \{h\})\)，其中 \(\delta\) 定义为：
    - \(\delta(s, b) = (h, a)\) for each \(b\in\Sigma-\{\rhd\}\)
    - \(\delta(s, \rhd) = (s, \rightarrow)\)
- head moving machine \(M_\leftarrow, M_\rightarrow\) 分别记为 \(L, R\)
  - 效果：读写头向左 / 右移动一位（左移的话如果当前位置是 \(\rhd\) 就停机）
  - 定义 \(M_\leftarrow\) 类似 \(M_a\)，将 \(a\) 替换为 \(\leftarrow\) 即可
  - 定义 \(M_\rightarrow\) 更为简单，不需要考虑 \(\rhd\) 的情况
采用一个新的表示方法，用来连接图灵机的作用构成更复杂的图灵机
- 首先执行图灵机 \(M_1\) 直到停机
- 检查停机状态时当前读写头指向的位置
  - 如果是 0 则执行 \(M_2\) 直到停机
  - 如果是 1 则执行 \(M_3\) 直到停机
  - 否则直接停机
- 一些特殊的表示：
  - \(>\!\!R\overset{\Sigma}{\longrightarrow} R\)，或记为 \(>\!\!RR, >\!\!R^2\)，右移两格
  - \(>\!\!R\overset{a\neq ⌴}{\longrightarrow}Ra\)，右移，如果不为空则 copy 到右侧格子
  - \(>\!\!R\) 指向自身，箭头上是 \(\bar{⌴}\)（表示非空格），作用是移动到右侧第一个空格的位置，记为 \(R_{⌴}\)
  - \(>\!\!R\) 指向自身，箭头上是 \(⌴\)，作用是移动到右侧第一个非空格的位置，记为 \(R_{\bar{⌴}}\)
  - 同理有记法 \(L_{⌴}, L_{\bar{⌴}}\)

构建 left shifting machine \(S_\leftarrow\)

效果是对于任意 \(w\in(\Sigma-\{\rhd, ⌴\})^*\)，将 \(\rhd⌴⌴w\underline{⌴}\) 变为 \(\rhd⌴w\underline{⌴}\)

最右侧的图灵机 \(⌴LaR\) 表示先清空当前格，然后左移，将刚读取到的字符写入，然后再右移回来

图灵机功能 ¶

Recognize language
- 图灵机基础上补加一个集合 \(\Sigma_0\subseteq \Sigma-\{\rhd, ⌴\}\) 表示输入的字符集
- 定义起始 configuration 为 \((s, \rhd\underline{⌴}w)\)，其中 \(w\) 为输入字符串
- 半判定（semidecides）
  - \(M\) semidecides \(L(M)=\{w\in\Sigma_0^*: (s, \rhd\underline{⌴}w)\vdash_M^*(h, \rhd u)\}\)，其中 \(h\in H, u\in\Sigma^*\)
  - 语言中的字符串会停机，不属于语言的字符串不停机
  - “半”的原因：判定时间很长的话不知道到底最后会不会停机
- 判定（decides）
  - 令 \(M=(K, \Sigma_0, \Sigma, \delta, s, \{y, n\})\)，\(M\) decides a language \(L\subseteq \Sigma_0^*\) if:
    - \(\forall w\in L\), \((s, \rhd\underline{⌴}w)\vdash_M^*(y, \cdots)\)，称 \(M\) accepts \(w\)
    - \(\forall w\in \Sigma_0^*-L\), \((s, \rhd\underline{⌴}w)\vdash_M^*(n, \cdots)\)，称 \(M\) rejects \(w\)
  - 不管接不接受都会停机，只不过停机的状态不同
- 有图灵机判定一个语言，则称这个语言是 recursive / decidable 的
- 有图灵机半判定一个语言，则称这个语言是 recursively enumerable / recognizable 的
- 定理：如果一个语言是 recursive 的，则它是 recursively enumerable 的
  - 给 \(n\) 的停机状态变成一个循环不停机的状态就可以
Compute function
- 对于 \(w\in\Sigma_0^*\)，如果 \((s, \rhd\underline{⌴}w)\vdash_M^*(h, \rhd\underline{⌴}y)\)（其中 \(h\in H, y\in\Sigma_0^*\)），则称 \(y=M(w)\) 为图灵机在输入 \(w\) 时的输出
- 对于任意函数 \(f\colon\Sigma_0^*\rightarrow\Sigma_0^*\)，如果存在图灵机 \(M\) 使得 \(M(w)=f(w)\)，则称
  - \(M\) computes \(f\)
  - \(f\) 是 recursive / computable 的

证明 \(L=\{a^nb^nc^n:n\geq 0\}\) 是 recursive 的

构造图灵机，思路：每次从左到右依次删一组 abc，改为 x，然后检测最后是否都是 x：

但这种情况会接受 \(abcabc\)，所以需要删 \(abc\) 之后分别变为 \(xyz\)，然后再检测：

变种图灵机 ¶

一些扩展形式的图灵机，有更方便的功能，但实际上都可以用标准图灵机来实现同样效果

multiple tapes 多带图灵机
- 有 \(k\) 条纸带，每次根据 \(k\) 个读写头的信息进行判断
  - \(\delta\colon (K-H)\times\Sigma^k\rightarrow K\times ((\Sigma-\{\rhd\})\cup \{\leftarrow, \rightarrow\})\)
- 💡转换为标准图灵机的 idea
  - 比如有三个纸带 \(\rhd a\underline{b}a⌴\)，\(\rhd ba\underline{a}⌴\)，\(\rhd \underline{b}a⌴\)
  - 则构建纸带 \(\rhd (ab\underline{b})(\underline{b}aa)(a\underline{a}⌴)(⌴⌴⌴)\)
  - 每次读取所有带下划线的符号，再进行判断 / 更改
two-way infinite tape 纸带两侧都无限长的图灵机
- 💡可以用双带图灵机模拟，也就可以用标准图灵机模拟
multiple head 多读写头图灵机
- 💡用下划线标记每个头的位置，然后每次扫描所有头
2-dimensional tape 二维纸带图灵机
- 💡从左上角开始沿反对角线编号，延展成一维纸带
random access 随机访问图灵机
- 每次移动读写头可以不止一步
- 💡将多步移动拆成多次单步移动即可
non-deterministic TM 非确定性图灵机（NTM）
- 见下

非确定性图灵机 ¶

定义为一个五元组 \((K, \Sigma, \Delta, s, H)\)
- \(K, \Sigma, s, H\) 和确定性图灵机一样
- \(\Delta\): a finite subset of \(\big((K-H)\times\Sigma\big)\times\big(K\times((\Sigma-\{\rhd\})\cup\{\leftarrow,\rightarrow\})\big)\)
configuration、\(\vdash_M\)、\(\vdash_M^*\) 和确定性图灵机定义完全相同
定义 \(\vdash_M^N\) 为执行 \(N\) 步可以到达
半判定：
- 给定 NTM \(M\) 其输入符号集为 \(\Sigma_0\)
- \(M\) semidecides \(L\subseteq \Sigma_0^*\) if for any \(w\in\Sigma_0^*\), \(w\in L\) iff \((s, \rhd\underline{⌴}w)\vdash_M^*(h,\cdots)\) for some \(h\in H\)
- 如果 \(w\in L\) 则 NTM 有分支可以停机，否则没有分支可以停机
判定：
- 令 \(M=(K,\Sigma,\Delta,s,\{y,n\})\)，输入符号集 \(\Sigma_0\)
- \(M\) decides a language \(L\subseteq \Sigma_0^*\) if
  - for any \(w\in\Sigma_0^*\), exists a natural number \(N\), s.t. no configuration \(c\) satisfying \((s, \rhd\underline{⌴}w)\vdash_M^N c\)
    - 说明在 \(N\) 步内都可以停机，非确定产生的树高度小于 \(N\)
  - \(w\in L\) iff \((s, \rhd\underline{⌴}w)\vdash_M^*(y,\cdots)\)
    - 非确定执行的树上有一条分支可以停机到 \(y\) 状态

构造 NTM 判定所有合数（非质数）的二进制编码构成的语言

利用 NTM 可以“猜测”的特性，目标是猜测有没有两个数相乘等于输入。

假设输入字符串为 \(w\)，则先猜测两个数，得到 \(\rhd⌴w⌴p⌴q\)，然后将 \(p\) 和 \(q\) 相乘，如果等于 \(w\) 则停机到 \(y\)，否则停机到 \(n\)，满足第二个条件。

因为 \(p,q\) 都小于 \(w\)，所以猜测是有限的，而且都可以有限步停机，满足第一个条件。

Theorem. Every NTM can be simulated by DTM.

Proof Sketch（以半判定为例）
- Idea：NTM 执行时的多种选择会生成一颗树，DTM 要做的是 BFS 搜索这棵树直到找到停机状态
- 用 3-tape DTM 来模拟 NTM
  - 第一条用来装输入 \(\rhd⌴w\)
  - 第二条用来模拟 NTM \(N\)（在树上向下走）
  - 第三条用来枚举“提示”，指导第二条纸带里面在树上怎么走
- 步骤：
  - 每一轮开始时将第一条纸带 copy 到第二条纸带上
  - 更新第三条纸带，指挥第二条纸带模拟 NTM 的树时每一步该采用哪个转换
  - 第三条纸带内容都读取结束后，判定第二条纸带上模拟的位置是否停机
    - 如果停机则结束
    - 没停机则开始新的一轮，采用不同的第三条纸带内容
- e.g. 第三条纸带内容为 \(\rhd⌴0\) 则只向左一步，\(\rhd⌴010\) 则走左右左三步再检测是否停机

最后更新: 2023年12月12日 22:38:38
创建日期: 2023年11月8日 23:40:32