ascii letters allowed in escape sequences: a, b, e, f, n, r, t, u, v, x, E, U
Non-escape letters: A, B, C, D, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, V, W,
X, Y, Z, c, d, g, h, i, j, k, l, m, o, p, q, s, w, y, z
注意:'\U'、'\x'、'\u'本身并不构成转义序列。\、'、"、?和数字不考虑,因为它们不是字母。'\e'仅支持GCC。 这些序列是通过编译包含字符串"\a\b...(for all ascii letters)...\z"的C代码并解析编译器警告而生成的:
#!/usr/bin/env python
import re, string, subprocess, sys
def _find_non_escape_chars(compiler="cc -x c -".split(), verbose=False):
# prepare C code to compile
test_code = 'char *s = "%s";' % ''.join('\\'+c for c in string.ascii_letters)
# compile it
p = subprocess.Popen(compiler,
stdin=subprocess.PIPE,
stdout=subprocess.PIPE,
stderr=subprocess.STDOUT)
stdout, _ = p.communicate(test_code)
if verbose:
print stdout
# find all non-escape characters
return set(re.findall(r"'\\(.)'", stdout))
def is_escape_char(c, non_escape=_find_non_escape_chars()):
"""Whether `c` letter may be present in an escape sequence in C.
>>> f = is_escape_char
>>> f("a")
True
>>> f("g")
False
"""
return c not in non_escape
def main():
escape_chars = filter(is_escape_char, string.ascii_letters)
print "ascii letters allowed in escape sequences:", ', '.join(escape_chars)
print "Non-escape letters:", ', '.join(
sorted(set(string.ascii_letters)-set(escape_chars)))
if __name__=="__main__":
import doctest; doctest.testmod()
main()
3条答案
按热度按时间xv8emn3q1#
我认为OP可能会被混淆,并认为可以在C程序中以编程方式生成这些字符串转义序列,并对它们进行特殊解释(可能是由
printf
或语言环境本身),例如。这是不可能的。它所要做的就是打印文字字符反斜杠和字母“n”。如果你想 * 测试 * 一个转义序列是否被你的编译器解释,唯一的方法就是写出一个
.c
文件,然后运行编译器。但是,转义序列集是完全标准化的,因此没有理由进行测试。只需阅读语言规范或编译器手册。ldfqzlk82#
脚本的输出:
注意:
'\U'
、'\x'
、'\u'
本身并不构成转义序列。\
、'
、"
、?
和数字不考虑,因为它们不是字母。'\e'
仅支持GCC。这些序列是通过编译包含字符串
"\a\b...(for all ascii letters)...\z"
的C代码并解析编译器警告而生成的:frebpwbc3#
那检查所有可能的案件呢字母有\a、\B、\f、\n、\r、\t、\v --不太多.