如何在x86 Assembly中连接两个字符串?

lo8azlld  于 2022-12-13  发布在  其他
关注(0)|答案(1)|浏览(115)

例如,我有两个字符串:

section .data
    stringA    db    "abcde"
    stringB    db    "fghij"

稍后,我如何将它们连接到一个新的stringC中?(即stringC应该包含“abcdefghij”)

ozxc1zmp

ozxc1zmp1#

汇编程序没有数据类型,但它对CPU的每个指令都有一个指令。
不同的编程语言有不同的方法将字符串存储在内存中:
有些语言(如C)使用终止字符串:字符串是内存中存储字符的某个数组。字符串的结尾用一个特殊字符(例如NUL)标记,因为数组的长度大于字符串的最大可能长度:

char a[100] = "Hello";

其实意思是:

char a[100] = { 'H', 'e', 'l', 'l', 'o', 0, 'f', 'o', 'o', 'b', 'a', 'r', ...};

其他语言(如Java、Pascal或C#)在内部将字符串的长度存储在某个变量中,并将字符存储在数组中:

string a = "Hello";

其实意思是:

int a_len = 5;
char a_text[100] = { 'H', 'e', 'l', 'l', 'o', 'f', 'o', 'o', 'b', 'a', 'r', ...};

或者(在旧Pascal变体的情况下):

char a[100] = { 5, 'H', 'e', 'l', 'l', 'o', 'f', 'o', 'o', 'b', 'a', 'r', ...};

因为汇编语言“只是”CPU指令的另一种表示,所以任何编程语言使用的所有变体都可以用汇编语言来表示。
因此,它取决于字符串在内存中的存储方式。
如果要连接两个以NULL结尾的字符串,可以按以下方式进行连接:
1.将ds:siesirsi(取决于写入的是16位、32位还是64位代码)设置为第一个字符串的第一个字符。
1.将es:diedirdi设置为目标内存
1.清除方向标志
1.使用lodsb指令读取一个字节
1.使用stosb指令写入相同的字节
1.如果al寄存器不为零,则继续执行步骤4。(循环)
1.减少diedirdi
1.将ds:siesirsi设置为第二个字符串的第一个字符
1.再次执行循环(步骤4 -6)
如果你想使用其他的CPU(例如ARM,MIPS,PowerPC,...)来代替x86,当然你必须使用其他的寄存器。大多数CPU没有lodsbstosb的等价物,但是你必须使用两条指令:加载一个字节并递增寄存器。

相关问题