使用FFI将字符串从C#传递到Rust

93ze6v8z  于 2023-10-20  发布在  C#
关注(0)|答案(3)|浏览(195)

我尝试将string作为函数参数传递给Rust库(cdylib),如Rust FFI Omnibus中所述。
不过,我试图省略libc依赖项,因为我认为它应该不再需要了。Rust 1.50.0和.net 5.0.103
从文档中,我觉得好像CStr::from_ptr()函数通过阅读所有字节,直到 * 空终止 *,从指针构造了一个CStr。并且C#字符串会自动编组为C兼容的字符串(因此是空终止的)。然而,我的问题是,我没有得到作为函数参数提供的完整字符串,而是只得到第一个字符作为字符串。
这是我的lib.rs

use std::os::raw::c_char;
use std::ffi::CStr;

#[no_mangle]
pub extern fn print_string(text_pointer: *const c_char) {
    unsafe {
        let text: String = CStr::from_ptr(text_pointer).to_str().expect("Can not read string argument.").to_string();
        println!("{}", text);
    }
}

我的Cargo.toml

[package]
name = "mylib"
version = "0.1.0"
authors = ["FrankenApps"]
edition = "2018"

[lib]
crate-type = ["cdylib"]

这是我的C#代码:

using System;
using System.Runtime.InteropServices;

namespace dotnet
{
    class Program
    {
        [DllImport("mylib.dll", CharSet = CharSet.Unicode, SetLastError = true)]
        public static extern void print_string(string text);

        static void Main(string[] args)
        {
            print_string("Hello World.");
        }
    }
}

在这种情况下,当我运行程序时输出为:

H

当我运行链接的示例时,我得到一个错误:

thread '<unnamed>' panicked at 'called `Result::unwrap()` on an `Err` value: Utf8Error { valid_up_to: 1, error_len: Some(1) }', src\lib.rs:12:32

然而,当我只使用ASCII字符并修改代码时:
生 rust :

use libc::c_char;
use std::ffi::CStr;

#[no_mangle]
pub extern "C" fn how_many_characters(s: *const c_char) -> u32 {
    let c_str = unsafe {
        assert!(!s.is_null());

        CStr::from_ptr(s)
    };

    let r_str = c_str.to_str().unwrap();
    println!("{}", r_str.to_string());
    r_str.chars().count() as u32
}

C#语言

using System;
using System.Runtime.InteropServices;

class StringArguments
{
    [DllImport("mylib", EntryPoint="how_many_characters")]
    public static extern uint HowManyCharacters(string s);

    static public void Main()
    {
        var count = StringArguments.HowManyCharacters("Hello World.");
        Console.WriteLine(count);
    }
}

我得到了想要的输出:

Hello World.
12

我的问题是我在自己的示例中做错了什么,我试图不使用libc?libc中的c_char和标准库中的c_char之间有什么区别,使它们的行为不同吗?
我想我错过了一些简单的东西,因为我确实希望这能起作用...

d7v8vwbk

d7v8vwbk1#

从.NET 4.7开始,您可以使用MarshalAs(UnmanagedType.LPUTF8Str),因此以下内容应该可以正常工作:

using System.Runtime.InteropServices;

namespace dotnet
{
    class Program
    {
        [DllImport("mylib.dll")]
        public static extern void print_string([MarshalAs(UnmanagedType.LPUTF8Str)] string utf8Text);

        static void Main(string[] args)
        {
            print_string("göes to élevên");
        }
    }
}
lhcgjxsq

lhcgjxsq2#

你需要使用CharSet = CharSet.Ansi,这似乎是默认的。
当我更换

[DllImport("mylib.dll", CharSet = CharSet.Unicode, SetLastError = true)]

[DllImport("mylib.dll", CharSet = CharSet.Ansi, SetLastError = true)]

我得到输出:

Hello World.

不过,如果unicode字符串能以某种方式得到支持,那就太好了。

编辑

我知道如何使用UTF-8字符串了。我在rust实现中没有做任何改变,但不是在C#中自动编组string,而是使用UTF-8编码的字节数组作为C#中的函数参数:

using System;
using System.Runtime.InteropServices;

namespace dotnet
{
    class Program
    {
        [DllImport("mylib.dll", CharSet = CharSet.Unicode, SetLastError = true)]
        public static extern void print_string(byte[] utf8Text);

        static void Main(string[] args)
        {
            print_string(Encoding.UTF8.GetBytes("göes to élevên"));
        }
    }
}

这是完美的工作和打印:

göes to élevên
ulmd4ohb

ulmd4ohb3#

问题是你定义了CharSet = CharSet.Unicode
从文档中可以看出,当将CharSet设置为Unicode时,字符串被固定并直接由本机代码使用。因此,使用没有null终止的底层C#字符串。由于期望空终止,因此它失败。
请访问https://learn.microsoft.com/en-us/dotnet/framework/interop/default-marshalling-for-strings#strings-used-in-platform-invoke
只要删除CharSet = CharSet.Unicode,它就会默认地封送字符串。

相关问题