面试题：Rust字符串字符编码转换及处理

实现思路：
- 编码转换：在Rust中，要将UTF - 8编码的字符串转换为GBK编码，需要借助第三方库，因为标准库没有直接支持GBK编码。常用的库有encoding_rs。首先将Rust的String（UTF - 8编码）转换为字节数组，然后使用encoding_rs::GBK进行编码转换得到GBK编码的字节数组。
- 提取中文字符：已知GBK编码下中文字符的范围，遍历GBK编码的字节数组，判断每个字节序列是否在中文字符的范围内，如果是则提取出来。由于GBK中文字符是2字节表示一个字符，所以要按2字节一组进行判断。最后将提取出来的字节序列转换回Rust的String。
代码实现：

use encoding_rs::GBK;

fn extract_chinese_characters(s: &str) -> String {
    // 将UTF - 8字符串转换为字节数组
    let utf8_bytes = s.as_bytes();
    // 转换为GBK编码的字节数组
    let (gbk_bytes, _, _) = GBK.encode(utf8_bytes);

    let mut result = Vec::new();
    let mut i = 0;
    while i < gbk_bytes.len() {
        if i + 1 < gbk_bytes.len() {
            let byte1 = gbk_bytes[i];
            let byte2 = gbk_bytes[i + 1];
            // 这里假设GBK中文字符范围判断逻辑，实际需按真实范围调整
            if (0xB0 <= byte1 && byte1 <= 0xF7) && (0xA1 <= byte2 && byte2 <= 0xFE) {
                result.extend_from_slice(&gbk_bytes[i..i + 2]);
                i += 2;
                continue;
            }
        }
        i += 1;
    }

    // 将提取的GBK字节数组转换回UTF - 8字符串
    let (utf8_result, _, _) = GBK.decode(&result);
    String::from_utf8_lossy(utf8_result).to_string()
}

要点：
- 编码转换：
  - Rust标准库默认处理UTF - 8编码，对于非UTF - 8编码（如GBK）需要借助第三方库。encoding_rs库提供了高效的编码转换功能。在转换过程中要注意处理转换结果中的可能的错误情况（在代码中这里简单忽略了错误处理）。
- 字符处理：
  - 不同编码下字符的表示方式不同。在GBK中，中文字符是2字节表示，所以在判断和提取时要按2字节一组处理。最后提取的GBK字节数组还需要转换回UTF - 8编码才能作为Rust的String返回，因为Rust的String默认是UTF - 8编码。

你可以使用以下方式测试这个函数：

fn main() {
    let utf8_str = "你好，世界！Hello, World!";
    let result = extract_chinese_characters(utf8_str);
    println!("{}", result);
}

面试题：Rust字符串字符编码转换及处理

知识考点

面试题答案