c++17标准发布,string_view是标准新增的内容。这篇文章主要分析string_view的适用范围、注意事项,并分析string_view带来的性能提升,最后从gcc 8.2的libstdc++库源码级别分析性能提升的原因。



         //指针指向静态字符串         const char* str_ptr = "this is a static string";          //字符串数组         char str_array[] = "this is a static string";          //std::string         std::string str = "this is a static string";          //std::string_view         std::string_view sv = "this is a static string";


g++ -o0 -o static_str static_str.cc -std=c++17 -g && objdump -s -t -d static_str > static_str.s


 int main() {   4013b8:       55                      push   %rbp   4013b9:       48 89 e5                mov    %rsp,%rbp   4013bc:       53                      push   %rbx   4013bd:       48 83 ec 68             sub    $0x68,%rsp         //指针指向静态字符串         const char* str_ptr = "this is a static string!";         ##直接设置字符串指针   4013c1:       48 c7 45 e8 30 1e 40    movq   $0x401e30,-0x18(%rbp)     4013c8:       00           //字符串数组         char str_array[] = "this is a static string!";         ##这里使用一个很取巧的办法,不使用循环,而是使用多个mov语句把字符串设置到堆栈   4013c9:       48 b8 74 68 69 73 20    mov    $0x2073692073696874,%rax    4013d0:       69 73 20    4013d3:       48 ba 61 20 73 74 61    mov    $0x6369746174732061,%rdx   4013da:       74 69 63    4013dd:       48 89 45 c0             mov    %rax,-0x40(%rbp)   4013e1:       48 89 55 c8             mov    %rdx,-0x38(%rbp)   4013e5:       48 b8 20 73 74 72 69    mov    $0x21676e6972747320,%rax   4013ec:       6e 67 21    4013ef:       48 89 45 d0             mov    %rax,-0x30(%rbp)   4013f3:       c6 45 d8 00             movb   $0x0,-0x28(%rbp)                  //std::string         std::string str = "this is a static string!";         #esi保存了字符串开始地址$0x401e30,调用std::string的构造函数   4013f7:       48 8d 45 e7             lea    -0x19(%rbp),%rax   4013fb:       48 89 c7                mov    %rax,%rdi   4013fe:       e8 15 fe ff ff          callq  401218 <_znsaicec1ev@plt>   401403:       48 8d 55 e7             lea    -0x19(%rbp),%rdx   401407:       48 8d 45 a0             lea    -0x60(%rbp),%rax   40140b:       be 30 1e 40 00          mov    $0x401e30,%esi   401410:       48 89 c7                mov    %rax,%rdi   401413:       e8 fe 01 00 00          callq  401616 <_znst7__cxx1112basic_stringicst11char_traitsicesaiceec1is3_eepkcrks3_>   401418:       48 8d 45 e7             lea    -0x19(%rbp),%rax   40141c:       48 89 c7                mov    %rax,%rdi   40141f:       e8 c4 fd ff ff          callq  4011e8 <_znsaiced1ev@plt>                  //std::string_view         std::string_view sv = "this is a static string!";         #直接设置字符串的长度0x18,也就是24bytes,还有字符串的起始指针$0x401e30,没有堆内存分配   401424:       48 c7 45 90 18 00 00    movq   $0x18,-0x70(%rbp)   40142b:       00    40142c:       48 c7 45 98 30 1e 40    movq   $0x401e30,-0x68(%rbp)   401433:       00                   return 0;   401434:       bb 00 00 00 00          mov    $0x0,%ebx          //字符串数组         ## 对象析构:字符串数组分配在栈上,无需析构         char str_array[] = "this is a static string!";                  //std::string         ## 对象析构:调用析构函数         std::string str = "this is a static string!";   401439:       48 8d 45 a0             lea    -0x60(%rbp),%rax   40143d:       48 89 c7                mov    %rax,%rdi   401440:       e8 a9 01 00 00          callq  4015ee <_znst7__cxx1112basic_stringicst11char_traitsicesaiceed1ev>   401445:       89 d8                   mov    %ebx,%eax   401447:       eb 1a                   jmp    401463 <main+0xab>   401449:       48 89 c3                mov    %rax,%rbx   40144c:       48 8d 45 e7             lea    -0x19(%rbp),%rax   401450:       48 89 c7                mov    %rax,%rdi   401453:       e8 90 fd ff ff          callq  4011e8 <_znsaiced1ev@plt>   401458:       48 89 d8                mov    %rbx,%rax   40145b:       48 89 c7                mov    %rax,%rdi   40145e:       e8 e5 fd ff ff          callq  401248 <_unwind_resume@plt>                  //std::string_view         ## 对象析构:std::string_view分配在栈上,无需析构         std::string_view sv = "this is a static string!";                  return 0; }
  • 静态字符串:会把指针指向静态存储区,字符串只读。如果尝试修改,会导致段错误(segment fault)。
  • 字符串数组:在栈上分配一块空间,长度等于字符串的长度+1(因为还需要包括末尾的’’字符),然后把字符串拷贝到缓冲区。上述代码,我之前一直以为会使用循环(类似memmove),但是一直找不到循环的语句,却找到一堆莫名其妙的数字($0x2073692073696874,$0x6369746174732061)仔细观察发现,原来编译器把一个长字符串分开为几个64bit的长整数,逐次mov到栈缓冲区中, 那几个长长的整数其实是: 0x2073692073696874=[ si siht],$0x6369746174732061=[citats a],0x21676e6972747320=[!gnirts],刚好就是字符串的反序,编译器是用这种方式来提高运行效率的。我觉得其实末尾的0是可以和字符串一起写在同一个mov指令中的,这样执行的指令就可以少一个了,不知道为什么不这样做。
  • std::string:只在寄存器设置了字符串的起始指针,调用了basic_string( const chart* s,const allocator& alloc = allocator() )构造函数,中间涉及各种检测和字符串拷贝,后面会在另一篇讲述std::string原理的文章中详细分析,总之动态内存分配与字符串拷贝是肯定会发生的事情。值得一提的是,如果在构造函数里面至少会有如下操作:确定字符串长度(如strlen,遍历一遍字符串),按字符串长度(或者预留更多的长度)新建一块内存空间,拷贝字符串到新建的内存空间(第二次遍历字符串)。
  • std::string_view:上面的汇编代码很简单,只是单纯设置静态字符串的起始指针和长度,没有其他调用,连内存分配都是栈上的!跟std::string相比,在创建std::string_view对象的时候,没有任何动态内存分配,没有对字符串多余的遍历。一直以来,对于c字符串而言,如果需要获取它的长度,至少需要strlen之类的函数。但是我们似乎忽略了一点,那就是,如果是静态字符串,编译器其实是知道它的长度的,也就是,静态字符串的长度可以在编译期间确定,那就可以减少了很多问题。
  • 题外话:编译期确定字符串长度、对象大小,这种并不是什么奇技淫巧,因为早在operator new运算符重载的时候,就有一个size_t参数,这个就是编译器传入的对象大小,而std::string_view,则是在编译期间传入字符串的指针和长度,构建对象。但是,std::string和std::string_view这两个类同时提供了只带字符串指针同时带字符串指针和字符串长度两个版本的构造函数,默认的情况下,std::string str = "this is a static string!"会调用basic_string( const chart* s,const allocator& alloc = allocator() )构造,但是std::string_view sv = "this is a static string!"会调用带长度的basic_string_view(const _chart* __str, size_type __len) noexcept版本,这一点我一直没弄明白(todo)。但是,标准库提供了一个方法,可以让编译器选择带长度的std::string构造函数,下一小节讲述。

std::string_view的实现(gcc 8.2)


  • 只读操作:没有std::string的c_str()函数。因为std::string_view管理的字符串可能只是一串长字符串中的一段,而c_str()函数的语义在于返回一个c风格的字符串,这会引起二义性,可能这就是设计者不提供这个接口的原因。但是与std::string一样提供了data()接口。对于std::string而言,data()与c_str()接口是一样的。std::string_view提供的data()接口只返回它所保存的数据指针,语义上是正确的。在使用std::string_view的data()接口的时候,需要注意长度限制,例如cout<<sv.data();cout<<sv;的输出结果很可能是不一样的,前者会多输出一部分字符。
  • std::string_view与std::string的生成:c++17新增了operator""sv(const char* __str, size_t __len)operator""s(const char* __str, size_t __len)操作符重载,因此,生成字符串的方法可以使用这两个操作符。令人惊奇的是,使用这种方法,生成std::string调用的是basic_string_view(const _chart* __str, size_type __len) noexcept版本的构造函数,这就意味着免去了构造时再一次获取字符串长度的开销(实际上是编译器在帮忙)
        //std::string        std::string str = "this is a static string!"s;         //std::string_view        std::string_view sv = "this is a static string!"sv;


   //std::string    std::string str = "this is a static string!"s;    ## esi存放字符串起始地址,edx存放字符串长度,0x18就是字符串长度24字节  4014b7:   48 8d 45 a0             lea    -0x60(%rbp),%rax  4014bb:   ba 18 00 00 00          mov    $0x18,%edx  4014c0:   be 50 1e 40 00          mov    $0x401e50,%esi  4014c5:   48 89 c7                mov    %rax,%rdi  4014c8:   e8 da 00 00 00          callq  4015a7 <_znst8literals15string_literalsli1sb5cxx11epkcm>


  • 修改操作:如前所述,std::string_view并不提供修改接口,因为它保存的数据指针是const _chart*类型的,无法运行时修改。
  • 字符串截取substr():这部分特别提出。因为使用std::string::substr()函数,会对所截取的部分生成一个新的字符串返回(中间又涉及内存动态分配以及拷贝),而std::string_view::substr(),也是返回一个std::string_view,但是依旧不涉及内存的动态分配。只是简单地用改变后的指针和长度生成一个新的std::string_view对象,o(1)操作。代码如下:
  constexpr basic_string_view   substr(size_type __pos, size_type __n = npos) const noexcept(false)   { __pos = _m_check(__pos, "basic_string_view::substr"); const size_type __rlen = std::min(__n, _m_len - __pos); return basic_string_view{_m_str + __pos, __rlen};   }
  • 关于字符串截取,引用一下其他人的测试结果,性能提高不是一星半点。(来自)



  • std::string_view管理的只是指针,试用期间应该注意指针所指向的内存是可访问的;
  • 如果使用静态字符串初始化std::string,建议使用operator s()重载,但是使用这个运算符重载需要使用std::literals,反正我经常会忘记。
  • 如果在项目中需要使用下面这种方式生成字符串的:
        int num = 100;        //process @num       std::string err_message = "invalid number: " + std::to_string(num);

在c++11有可能会报错,因为 "invalid number: " 是一个const char*,无法使用operator +(const std::string&),或者改为

  std::string err_message = std::string("invalid number: ") + std::to_string(num);


        using namespace std::literals;     std::string err_message = "invalid number: "s + std::to_string(num);




  • leveldb提供的slice实现
  • rocksdb提供的slice实现,这两者的实现原理大致一样,只是接口功能略有出入。
  • google开源的基础库abseil中的string_view,据说这个库是c++17的string_view库的前身,浏览了一下似乎没有发现operator sv()的重载。



    //字符串     //创建这个类,是因为在性能调优的时候发现,生成字符串太多,影响性能     class slice     {     public:         slice() = default;         ~slice() = default;          slice(const char* str, size_t len,              const std::shared_ptr<const redisreply>& reply): str_(str), len_(len), reply_(reply) {}         slice(const char* str, size_t len):str_(str), len_(len) {}                  //下面几个接口,兼容std::string         const char* c_str() const {return str_;}         const char* data() const {return str_;}         size_t length() const {return len_;}         bool empty() const {return str_ == null || len_ == 0;}                  bool begin_with(const std::string& str) const;         std::string to_string() const;         bool operator==(const char* right) const;         bool operator==(const slice& right) const;         bool operator!=(const char* right) const;         bool operator!=(const slice& right) const;      private:          //字符串         const char* str_{null};         size_t len_{0};          //字符串所属的redis返回报文         std::shared_ptr<const redisreply> reply_;     };

之所以不重用leveldb的slice,是因为这些字符串都是struct redisreply中分配的,所以使用shared_ptr管理struct redisreply对象,这样就可以不需要担心struct redisreply的释放问题了。

     /**********头文件************/     class customizedredisclient     {     public:         //get         template<class stringtype>         std::pair<status, slice> get(const stringtype& key)         {             return this->get_impl(key.data(), key.length());         }                  //....     };         /***********这部分在代码部分实现***********/          //get实现     //customizedredisclient::status是另外实现的一个状态码,不在这里讲述     std::pair<customizedredisclient::status, customizedredisclient::slice>          customizedredisclient::get_impl(const char* key, size_t key_len)     {         constexpr size_t command_item_count = 2;         const char* command_str[command_item_count];         size_t command_len[command_item_count];          command_str[0] = "get";         command_len[0] = 3;          command_str[1] = key;         command_len[1] = key_len;          //reply         //get_reply()函数使用redisappendcommandargv()和redisgetreply()函数实现,参考libhiredis文档,这样做是为了兼顾key/value中可能有二进制字符         const auto& reply_status = this->get_reply(command_str, command_len, command_item_count);         const redisreply* reply = reply_status.first.get();         if(reply == null)         {             return std::make_pair(reply_status.second,                  customizedredisclient::slice());         }         else if(reply->type == redis_reply_status             || reply->type == redis_reply_error)         {             return std::make_pair(customizedredisclient::status(std::string(reply->str, reply->len)),                  customizedredisclient::slice());         }         else if(reply->type == redis_reply_nil)         {             return std::make_pair(customizedredisclient::status(status_not_found),                  customizedredisclient::slice());         }         else if(reply->type != redis_reply_string)         {             return std::make_pair(customizedredisclient::status(status_invalid_message),                  customizedredisclient::slice());         }          return std::make_pair(customizedredisclient::status(),              customizedredisclient::slice(reply->str, reply->len, reply_status.first));     }



