C#调百度通用翻译API翻译HALCON的示例描述

x33g5p2x  于2022-02-11 转载在 C#  
字(7.1k)|赞(0)|评价(0)|浏览(496)

通用翻译API的HTTPS 地址为https://fanyi-api.baidu.com/api/trans/vip/translate,使用方法参考通用翻译API接入文档 。 请求方式可使用 GET 或 POST 方式(Content-Type 请指定为:application/x-www-form-urlencoded),字符编码统一采用 UTF-8 编码格式,单次请求长度控制在 6000 bytes以内(汉字约为输入参数 2000 个)。 API返回的结果是json格式,需要反序列为对象实例后再进行处理。为了减少第三方库的依赖,反序列化使用.NET自带的DataContractJsonSerializer。

准备工作

HALCON示例程序的描述部分一直是英文的,看起来很不方便。我决定汉化一下HALCON示例程序的描述,准备工作如下:

  • 拿到HALCON的例程描述文件index_examples_en_US.xml,我的在C:\Program Files\MVTec\HALCON-18.11-Progress\help,其它版本类似。
  • 百度翻译开放平台注册拿到自己的ID和密钥,开通通用翻译API服务。

注:百度官方有提供通用翻译API的使用DEMO,不过比较简单,C# DEMO下载

参数简介

通用翻译API的HTTPS 地址https://fanyi-api.baidu.com/api/trans/vip/translate,使用方法参考通用翻译API接入文档

输入参数

请求方式可使用 GETPOST 方式(Content-Type 请指定为:application/x-www-form-urlencoded),字符编码统一采用 UTF-8 编码格式,单次请求长度控制在 6000 bytes以内(汉字约为输入参数 2000 个)。
将API需要的输入参数封装为一个类(ID和密钥换成自己的),代码如下:

  1. /// <summary>
  2. /// 输入参数
  3. /// </summary>
  4. class InputQuery
  5. {
  6. /// <summary>
  7. /// APP ID
  8. /// </summary>
  9. private static string appId = "2021xxxxxxx0626";
  10. /// <summary>
  11. /// 密钥
  12. /// </summary>
  13. private static string passWord = "cnblongsxtimefiles";
  14. /// <summary>
  15. /// 请求翻译query UTF-8编码
  16. /// </summary>
  17. public string Content { get; set; }
  18. /// <summary>
  19. /// 翻译源语言 可设置为auto
  20. /// </summary>
  21. public string From { get; set; }
  22. /// <summary>
  23. /// 翻译目标语言 不可设置为auto
  24. /// </summary>
  25. public string To { get; set; }
  26. /// <summary>
  27. /// APP ID
  28. /// </summary>
  29. public string AppId { get; set; }
  30. /// <summary>
  31. /// 随机数 可为字母或数字的字符串
  32. /// </summary>
  33. public string Salt { get; set; }
  34. /// <summary>
  35. /// 签名 appid+q+salt+密钥的MD5值
  36. /// </summary>
  37. public string Sign { get; set; }
  38. /// <summary>
  39. /// 构造函数
  40. /// </summary>
  41. /// <param name="content">翻译内容</param>
  42. /// <param name="fromStr">源语言</param>
  43. /// <param name="toStr">目标语言</param>
  44. public InputQuery(string content, string fromStr, string toStr)
  45. {
  46. Content = content;
  47. From = fromStr;
  48. To = toStr;
  49. AppId = appId;
  50. string randomNum = new Random().Next().ToString();
  51. string md5Sign = GetMD5(appId + content + randomNum + passWord).ToLower();
  52. Salt = randomNum;
  53. Sign = md5Sign;
  54. }
  55. /// <summary>
  56. /// 计算字符串的MD5值
  57. /// </summary>
  58. static string GetMD5(string source)
  59. {
  60. MD5CryptoServiceProvider md5 = new MD5CryptoServiceProvider();
  61. byte[] data = Encoding.UTF8.GetBytes(source);
  62. byte[] md5Data = md5.ComputeHash(data, 0, data.Length);
  63. md5.Clear();
  64. string destString = string.Empty;
  65. for (int i = 0; i < md5Data.Length; i++)
  66. {
  67. destString += Convert.ToString(md5Data[i], 16).PadLeft(2, '0');
  68. }
  69. destString = destString.PadLeft(32, '0');
  70. return destString;
  71. }
  72. }

输出参数

API返回的结果是json格式,需要反序列为对象实例后再进行处理。为了减少第三方库的依赖,反序列化使用.NET自带的DataContractJsonSerializer
封装的输出参数类代码如下:

  1. /// <summary>
  2. /// 输出参数
  3. /// </summary>
  4. [DataContract]
  5. class OutputResult
  6. {
  7. /// <summary>
  8. /// 错误码 仅当出现错误时显示
  9. /// </summary>
  10. [DataMember(Name = "error_code")]
  11. public string Error_code { set; get; }
  12. /// <summary>
  13. /// 错误信息
  14. /// </summary>
  15. [DataMember(Name = "error_msg")]
  16. public string Error_msg { set; get; }
  17. /// <summary>
  18. /// 源语言 返回用户指定的语言,或者自动检测出的语种(源语言设为 auto 时)
  19. /// </summary>
  20. [DataMember(Name = "from")]
  21. public string From { set; get; }
  22. /// <summary>
  23. /// 目标语言 返回用户指定的目标语言
  24. /// </summary>
  25. [DataMember(Name = "to")]
  26. public string To { set; get; }
  27. /// <summary>
  28. /// 翻译结果 返回翻译结果,包括 src 和 dst 字段
  29. /// </summary>
  30. [DataMember(Name = "trans_result")]
  31. public TranslateContent[] Trans_result { set; get; }
  32. }
  33. /// <summary>
  34. /// 翻译结果
  35. /// </summary>
  36. [DataContract]
  37. class TranslateContent
  38. {
  39. /// <summary>
  40. /// 原文
  41. /// </summary>
  42. [DataMember(Name = "src")]
  43. public string Src { set; get; }
  44. /// <summary>
  45. /// 译文
  46. /// </summary>
  47. [DataMember(Name = "dst")]
  48. public string Dst { set; get; }
  49. }

使用HttpClient

调用API需要一个类发送 HTTP 请求以及接收HTTP响应,推荐使用HttpClient类(微软不建议使用WebClient、HttpWebRequest类)。
需要注意的是:HttpClient 用于在应用程序的整个生存期内实例化一次并重复使用,也就是说一个应用程序只需要一个HttpClient单例即可,代码如下:

  1. public class GoodController
  2. {
  3. public static readonly HttpClient HttpClient;
  4. static GoodController()
  5. {
  6. HttpClient = new HttpClient();
  7. }
  8. }

翻译工具类

将API的调用方法封装成一个Translate类,目前只提供一个英翻中的方法,其它翻译需求可以参考 常见语种列表 自己扩展。
Translate类代码如下(注意添加System.Web依赖项):

  1. /// <summary>
  2. /// 百度通用翻译API工具类
  3. /// </summary>
  4. class Translate
  5. {
  6. /*
  7. * 代码链接:https://www.cnblogs.com/timefiles/p/BaiduTranslateAPI.html
  8. * 创建时间:2021/06/26
  9. * 主页链接:https://www.cnblogs.com/timefiles/
  10. *
  11. * 常用的语种代码:
  12. * 自动检测 auto
  13. * 中文 zh
  14. * 英语 en
  15. * 日语 jp
  16. */
  17. /// <summary>
  18. /// 英文翻译为中文
  19. /// </summary>
  20. /// <param name="content">翻译内容</param>
  21. /// <returns></returns>
  22. public static string EnToZh(string content)
  23. {
  24. string languageFrom = "en", languageTo = "zh";
  25. return GetTranslateResult(content, languageFrom, languageTo);
  26. }
  27. /// <summary>
  28. /// 获取翻译结果
  29. /// </summary>
  30. /// <param name="content">翻译内容</param>
  31. /// <param name="fromStr">源语言</param>
  32. /// <param name="toStr">目标语言</param>
  33. /// <returns></returns>
  34. static string GetTranslateResult(string content, string fromStr, string toStr)
  35. {
  36. InputQuery input = new InputQuery(content, fromStr, toStr);
  37. Uri uri = GetUri(input);
  38. var task = GetOutputResultAsync(uri);
  39. //个人认证后API的每秒请求量最高为10,异步意义不大,直接使用同步的方式
  40. OutputResult output = task.Result;
  41. if (output.Error_code == null)
  42. {
  43. return output.Trans_result[0].Dst;
  44. }
  45. else
  46. {
  47. throw new Exception("翻译异常,错误代码:" + output.Error_msg);
  48. }
  49. }
  50. /// <summary>
  51. /// 获取请求Uri
  52. /// </summary>
  53. /// <param name="input"></param>
  54. /// <returns></returns>
  55. static Uri GetUri(InputQuery input)
  56. {
  57. var query = HttpUtility.ParseQueryString(string.Empty);
  58. query["q"] = input.Content;
  59. query["from"] = input.From;
  60. query["to"] = input.To;
  61. query["appid"] = input.AppId;
  62. query["salt"] = input.Salt;
  63. query["sign"] = input.Sign;
  64. //构造Uri,不建议直接拼字符串
  65. UriBuilder uriBur = new UriBuilder("http://api.fanyi.baidu.com/api/trans/vip/translate");
  66. uriBur.Query = query.ToString();
  67. //Uri会自动进行转义
  68. return uriBur.Uri;
  69. }
  70. /// <summary>
  71. /// 获取API返回的结果
  72. /// </summary>
  73. /// <param name="uri">请求的uri</param>
  74. /// <returns></returns>
  75. static async Task<OutputResult> GetOutputResultAsync(Uri uri)
  76. {
  77. OutputResult result = null;
  78. var response = await GoodController.HttpClient.GetStringAsync(uri);
  79. var ser = new DataContractJsonSerializer(typeof(OutputResult));
  80. using (var ms = new MemoryStream(Encoding.UTF8.GetBytes(response)))
  81. {
  82. result = (OutputResult)ser.ReadObject(ms);
  83. }
  84. return result;
  85. }
  86. }

个人认证后API的每秒请求量最高为10,此处使用同步方式获取翻译结果,有异步需求的可以自己更改。

应用:翻译HALCON的示例描述

  1. static void Main(string[] args)
  2. {
  3. XmlDocument xd = new XmlDocument();
  4. xd.Load("index_examples_en_US.xml");
  5. //查找固定名称 节点名要从根节点开始写
  6. XmlNodeList nodelist = xd.DocumentElement.SelectNodes("/examples/example/desc");
  7. for (int i = 0; i < nodelist.Count; i++)
  8. {
  9. string desc = nodelist[i].InnerText;
  10. //百度翻译有时不太准确,建议保留原文
  11. nodelist[i].InnerText = Translate.EnToZh(desc)+"("+ nodelist[i].InnerText+")";
  12. Console.WriteLine("翻译结果"+i+":" + nodelist[i].InnerText);
  13. Console.WriteLine();
  14. }
  15. StreamWriter sw = new StreamWriter("index_examples_en_US_翻译.xml", false, new UTF8Encoding(false));
  16. //为了和原文件保存一致,原文件是使用的是"\n"换行
  17. sw.NewLine = "\n";
  18. xd.Save(sw);
  19. sw.Close();
  20. Console.WriteLine("完成");
  21. Console.Read();
  22. }

注:大概有1000多条需要翻译,需要等待10几分钟。考虑过使用特定字符组合成几个大字符串翻译后再拆分,但特定字符在翻译过程中有丢失导致拆分失败,只能使用这种方式。

将原HALCON的xml文件重命名作为备份,将翻译后的文件复制到HALCON程序目录下命名为index_examples_en_US.xml,效果如下:

附件

相关文章

最新文章

更多