字符串
字符串字面量的类型是 &str
, 例如 let s: &str = "hello, world"
中的 "hello, world"
的类型就是 &str
。
str
和 &str
- 🌟 正常情况下我们无法使用
str
类型,但是可以使用&str
来替代
// 修复错误,不要新增代码行 fn main() { let s: str = "hello, world"; }
- 🌟🌟 如果要使用
str
类型,只能配合Box
。&
可以用来将Box<str>
转换为&str
类型
// 使用至少两种方法来修复错误 fn main() { let s: Box<str> = "hello, world".into(); greetings(s) } fn greetings(s: &str) { println!("{}",s) }
String
String
是定义在标准库中的类型,分配在堆上,可以动态的增长。它的底层存储是动态字节数组的方式( Vec<u8>
),但是与字节数组不同,String
是 UTF-8
编码。
- 🌟
// 填空 fn main() { let mut s = __; s.push_str("hello, world"); s.push('!'); assert_eq!(s, "hello, world!"); }
- 🌟🌟🌟
// 修复所有错误,并且不要新增代码行 fn main() { let s = String::from("hello"); s.push(','); s.push(" world"); s += "!".to_string(); println!("{}", s) }
- 🌟🌟 我们可以用
replace
方法来替换指定的子字符串
// 填空 fn main() { let s = String::from("I like dogs"); // 以下方法会重新分配一块内存空间,然后将修改后的字符串存在这里 let s1 = s.__("dogs", "cats"); assert_eq!(s1, "I like cats") }
在标准库的 String 模块中,有更多的实用方法,感兴趣的同学可以看看。
- 🌟🌟 你只能将
String
跟&str
类型进行拼接,并且String
的所有权在此过程中会被 move
// 修复所有错误,不要删除任何一行代码 fn main() { let s1 = String::from("hello,"); let s2 = String::from("world!"); let s3 = s1 + s2; assert_eq!(s3,"hello,world!"); println!("{}",s1); }
&str
和 String
与 str
的很少使用相比,&str
和 String
类型却非常常用,因此也非常重要。
- 🌟🌟 我们可以使用两种方法将
&str
转换成String
类型
// 使用至少两种方法来修复错误 fn main() { let s = "hello, world"; greetings(s) } fn greetings(s: String) { println!("{}",s) }
- 🌟🌟 我们可以使用
String::from
或to_string
将&str
转换成String
类型
// 使用两种方法来解决错误,不要新增代码行 fn main() { let s = "hello, world".to_string(); let s1: &str = s; }
字符串转义
- 🌟
fn main() { // 你可以使用转义的方式来输出想要的字符,这里我们使用十六进制的值,例如 \x73 会被转义成小写字母 's' // 填空以输出 "I'm writing Rust" let byte_escape = "I'm writing Ru\x73__!"; println!("What are you doing\x3F (\\x3F means ?) {}", byte_escape); // 也可以使用 Unicode 形式的转义字符 let unicode_codepoint = "\u{211D}"; let character_name = "\"DOUBLE-STRUCK CAPITAL R\""; println!("Unicode character {} (U+211D) is called {}", unicode_codepoint, character_name ); // 还能使用 \ 来连接多行字符串 let long_string = "String literals can span multiple lines. The linebreak and indentation here \ can be escaped too!"; println!("{}", long_string); }
- 🌟🌟🌟 有时候需要转义的字符很多,我们会希望使用更方便的方式来书写字符串: raw string.
/* 填空并修复所有错误 */ fn main() { let raw_str = r"Escapes don't work here: \x3F \u{211D}"; // 修改上面的行让代码工作 assert_eq!(raw_str, "Escapes don't work here: ? ℝ"); // 如果你希望在字符串中使用双引号,可以使用以下形式 let quotes = r#"And then I said: "There is no escape!""#; println!("{}", quotes); // 如果希望在字符串中使用 # 号,可以如下使用: let delimiter = r###"A string with "# in it. And even "##!"###; println!("{}", delimiter); // 填空 let long_delimiter = __; assert_eq!(long_delimiter, "Hello, \"##\"") }
字节字符串
想要一个非 UTF-8 形式的字符串吗(我们之前的 str
, &str
, String
都是 UTF-8 字符串) ? 可以试试字节字符串或者说字节数组:
示例:
use std::str; fn main() { // 注意,这并不是 `&str` 类型了! let bytestring: &[u8; 21] = b"this is a byte string"; // 字节数组没有实现 `Display` 特征,因此只能使用 `Debug` 的方式去打印 println!("A byte string: {:?}", bytestring); // 字节数组也可以使用转义 let escaped = b"\x52\x75\x73\x74 as bytes"; // ...但是不支持 unicode 转义 // let escaped = b"\u{211D} is not allowed"; println!("Some escaped bytes: {:?}", escaped); // raw string let raw_bytestring = br"\u{211D} is not escaped here"; println!("{:?}", raw_bytestring); // 将字节数组转成 `str` 类型可能会失败 if let Ok(my_str) = str::from_utf8(raw_bytestring) { println!("And the same as text: '{}'", my_str); } let _quotes = br#"You can also use "fancier" formatting, \ like with normal raw strings"#; // 字节数组可以不是 UTF-8 格式 let shift_jis = b"\x82\xe6\x82\xa8\x82\xb1\x82\xbb"; // "ようこそ" in SHIFT-JIS // 但是它们未必能转换成 `str` 类型 match str::from_utf8(shift_jis) { Ok(my_str) => println!("Conversion successful: '{}'", my_str), Err(e) => println!("Conversion failed: {:?}", e), }; }
如果大家想要了解更多关于字符串字面量、转义字符的话,可以看看 Rust Reference 的 'Tokens' 章节.
字符串索引string index
- 🌟🌟 你无法通过索引的方式去访问字符串中的某个字符,但是可以使用切片的方式
&s1[start..end]
,但是start
和end
必须准确落在字符的边界处.
fn main() { let s1 = String::from("hi,中国"); let h = s1[0]; // 修改当前行来修复错误,提示: `h` 字符在 UTF-8 格式中只需要 1 个字节来表示 assert_eq!(h, "h"); let h1 = &s1[3..5];// 修改当前行来修复错误,提示: `中` 字符在 UTF-8 格式中需要 3 个字节来表示 assert_eq!(h1, "中"); }
操作 UTF-8 字符串
- 🌟
fn main() { // 填空,打印出 "你好,世界" 中的每一个字符 for c in "你好,世界".__ { println!("{}", c) } }
utf8_slice
我们可以使用三方库 utf8_slice 来访问 UTF-8 字符串的某个子串,但是与之前不同的是,该库索引的是字符,而不是字节.
Example
use utf8_slice; fn main() { let s = "The 🚀 goes to the 🌑!"; let rocket = utf8_slice::slice(s, 4, 5); // 结果是 "🚀" }
你可以在这里找到答案(在 solutions 路径下)