char转string安全,需确保非空且以'\0'结尾;string转char须注意c_str()返回指针的生命周期,仅在原string有效且未修改时可用。
只要 char* 指向的是以 '\0' 结尾的有效 C 风格字符串,用 std::string 构造函数或赋值即可,底层会自动拷贝内容。
常见错误是传入空指针或野指针:nullptr 传给 std::string 构造函数会抛出 std::logic_error(GCC/Clang 表现为 std::length_error 或直接崩溃);未初始化的指针更危险。
const char* cstr = "hello"; std::string s(cstr); // 或 s = cstr;
if (cstr != nullptr) {
std::string s(cstr);
}std::string s = cstr; 和 std::string s(cstr); 行为一致,都是深拷贝,不共享内存std::string::c_str() 和 std::string::data() 返回的 const char* 仅在原 string 对象**有效且未被修改**时才有效。一旦 string 被析构、移动、重新赋值或调用非 const 成员函数(如 push_back),指针立即失效。
const char* p;
{
std::string s = "temp";
p = s.c_str(); // p 现在指向 s 内部缓冲区
} // s 析构 → p 失效!后续用 p 是未定义行为
printf("%s", p); // 崩溃或乱码std::string s = "hello"; std::vectorbuf(s.begin(), s.end()); buf.push_back('\0'); const char* p = buf.data(); // buf 生命周期可控
std::string path = "/etc/passwd"; int fd = open(path.c_str(), O_RDONLY); // c_str() 仅在此行有效,安全
c_str() 返回的是 const char*,不能写;data() 在 C++11 中也返回 const char*,直到 C++17 才允许通过非 const 引用获取可写指针。真正安全获取可写缓冲区的方式是自己管理内存或用 std::vector。
std::string s = "hello"; s.resize(10); // 确保至少 10 字节,含 '\0' char* writable = &s[0]; // 合法,s 未 move/resize 时有效 strcpy(writable, "world"); // OK
std::string s = "hello"; std::vectorv(s.begin(), s.end()); v.push_back('\0'); char* c = v.data(); // 可读可写,v 控制生命周期
&s[0] 在 s.empty() 时是未定义行为,必须先 !s.empty() 或 s.resize(1)
std::string 和 char* 都是字节容器,不感知 UTF-8、GBK 等编码。一个中文字符在 UTF-8 中占 3 字节,s.length() 返回的是字节数,不是字符数;strlen(cstr) 同理。
std::string s = "你好"; // UTF-8 编码,长度为 6
printf("len=%zu\n", s.length()); // 输出 6,不是 2
for (size_t i = 0; i < s.length(); ++i) {
printf("%02x ", (unsigned char)s[i]); // 打印 6 个字节
}std::string::size() 或循环 ++p
UTF-8),避免 Windows 上默认 ANSI 导致乱码实际项目里最常踩的坑不是语法不会,而是把 c_str() 结果存起来长期用,或者对空字符串、移动后对象反复取指针。只要盯住「谁拥有内存」「什么时候失效」这两点,转换就没大问题。