rfc7230.ipp 14 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389
  1. //
  2. // Copyright (c) 2016-2019 Vinnie Falco (vinnie dot falco at gmail dot com)
  3. //
  4. // Distributed under the Boost Software License, Version 1.0. (See accompanying
  5. // file LICENSE_1_0.txt or copy at http://www.boost.org/LICENSE_1_0.txt)
  6. //
  7. // Official repository: https://github.com/boostorg/beast
  8. //
  9. #ifndef BOOST_BEAST_HTTP_DETAIL_RFC7230_IPP
  10. #define BOOST_BEAST_HTTP_DETAIL_RFC7230_IPP
  11. #include <boost/beast/core/string.hpp>
  12. #include <iterator>
  13. #include <utility>
  14. namespace boost {
  15. namespace beast {
  16. namespace http {
  17. namespace detail {
  18. bool
  19. is_digit(char c)
  20. {
  21. return c >= '0' && c <= '9';
  22. }
  23. char
  24. is_alpha(char c)
  25. {
  26. static char constexpr tab[] = {
  27. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 0
  28. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  29. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 32
  30. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 48
  31. 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  32. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, // 80
  33. 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  34. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, // 112
  35. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 128
  36. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 144
  37. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 160
  38. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 176
  39. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 192
  40. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 208
  41. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 224
  42. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 // 240
  43. };
  44. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  45. return tab[static_cast<unsigned char>(c)];
  46. }
  47. char
  48. is_text(char c)
  49. {
  50. // TEXT = <any OCTET except CTLs, but including LWS>
  51. static char constexpr tab[] = {
  52. 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, // 0
  53. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  54. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 32
  55. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 48
  56. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  57. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 80
  58. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  59. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, // 112
  60. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 128
  61. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 144
  62. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 160
  63. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 176
  64. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 192
  65. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 208
  66. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 224
  67. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 // 240
  68. };
  69. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  70. return tab[static_cast<unsigned char>(c)];
  71. }
  72. char
  73. is_token_char(char c)
  74. {
  75. /*
  76. tchar = "!" | "#" | "$" | "%" | "&" |
  77. "'" | "*" | "+" | "-" | "." |
  78. "^" | "_" | "`" | "|" | "~" |
  79. DIGIT | ALPHA
  80. */
  81. static char constexpr tab[] = {
  82. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 0
  83. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  84. 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, // 32
  85. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, // 48
  86. 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  87. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, // 80
  88. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  89. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, // 112
  90. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 128
  91. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 144
  92. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 160
  93. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 176
  94. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 192
  95. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 208
  96. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 224
  97. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 // 240
  98. };
  99. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  100. return tab[static_cast<unsigned char>(c)];
  101. }
  102. char
  103. is_qdchar(char c)
  104. {
  105. /*
  106. qdtext = HTAB / SP / "!" / %x23-5B ; '#'-'[' / %x5D-7E ; ']'-'~' / obs-text
  107. */
  108. static char constexpr tab[] = {
  109. 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, // 0
  110. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  111. 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 32
  112. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 48
  113. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  114. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, // 80
  115. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  116. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, // 112
  117. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 128
  118. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 144
  119. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 160
  120. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 176
  121. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 192
  122. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 208
  123. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 224
  124. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 // 240
  125. };
  126. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  127. return tab[static_cast<unsigned char>(c)];
  128. }
  129. char
  130. is_qpchar(char c)
  131. {
  132. /*
  133. quoted-pair = "\" ( HTAB / SP / VCHAR / obs-text )
  134. obs-text = %x80-FF
  135. */
  136. static char constexpr tab[] = {
  137. 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, // 0
  138. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  139. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 32
  140. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 48
  141. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  142. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 80
  143. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  144. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, // 112
  145. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 128
  146. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 144
  147. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 160
  148. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 176
  149. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 192
  150. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 208
  151. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 224
  152. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 // 240
  153. };
  154. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  155. return tab[static_cast<unsigned char>(c)];
  156. }
  157. // converts to lower case,
  158. // returns 0 if not a valid text char
  159. //
  160. char
  161. to_value_char(char c)
  162. {
  163. // TEXT = <any OCTET except CTLs, but including LWS>
  164. static unsigned char constexpr tab[] = {
  165. 0, 0, 0, 0, 0, 0, 0, 0, 0, 9, 0, 0, 0, 0, 0, 0, // 0
  166. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  167. 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, // 32
  168. 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, // 48
  169. 64, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, // 64
  170. 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 91, 92, 93, 94, 95, // 80
  171. 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, // 96
  172. 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 0, // 112
  173. 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, // 128
  174. 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, // 144
  175. 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, // 160
  176. 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, // 176
  177. 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, // 192
  178. 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, // 208
  179. 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, // 224
  180. 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255 // 240
  181. };
  182. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  183. return static_cast<char>(tab[static_cast<unsigned char>(c)]);
  184. }
  185. // VFALCO TODO Make this return unsigned?
  186. std::int8_t
  187. unhex(char c)
  188. {
  189. static signed char constexpr tab[] = {
  190. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 0
  191. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 16
  192. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 32
  193. 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, -1, -1, -1, -1, -1, -1, // 48
  194. -1, 10, 11, 12, 13, 14, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 64
  195. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 80
  196. -1, 10, 11, 12, 13, 14, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 96
  197. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 112
  198. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 128
  199. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 144
  200. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 160
  201. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 176
  202. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 192
  203. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 208
  204. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 224
  205. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 // 240
  206. };
  207. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  208. return tab[static_cast<unsigned char>(c)];
  209. }
  210. void
  211. skip_ows(char const*& it, char const* end)
  212. {
  213. while(it != end)
  214. {
  215. if(*it != ' ' && *it != '\t')
  216. break;
  217. ++it;
  218. }
  219. }
  220. void
  221. skip_token(char const*& it, char const* last)
  222. {
  223. while(it != last && is_token_char(*it))
  224. ++it;
  225. }
  226. string_view
  227. trim(string_view s)
  228. {
  229. auto first = s.begin();
  230. auto last = s.end();
  231. skip_ows(first, last);
  232. while(first != last)
  233. {
  234. auto const c = *std::prev(last);
  235. if(c != ' ' && c != '\t')
  236. break;
  237. --last;
  238. }
  239. if(first == last)
  240. return {};
  241. return {&*first,
  242. static_cast<std::size_t>(last - first)};
  243. }
  244. BOOST_BEAST_DECL
  245. void
  246. param_iter::
  247. increment()
  248. {
  249. /*
  250. param-list = *( OWS ";" OWS param )
  251. param = token OWS [ "=" OWS ( token / quoted-string ) ]
  252. quoted-string = DQUOTE *( qdtext / quoted-pair ) DQUOTE
  253. qdtext = HTAB / SP / "!" / %x23-5B ; '#'-'[' / %x5D-7E ; ']'-'~' / obs-text
  254. quoted-pair = "\" ( HTAB / SP / VCHAR / obs-text )
  255. obs-text = %x80-FF
  256. */
  257. auto const err =
  258. [&]
  259. {
  260. it = first;
  261. };
  262. v.first = {};
  263. v.second = {};
  264. detail::skip_ows(it, last);
  265. first = it;
  266. if(it == last)
  267. return err();
  268. if(*it != ';')
  269. return err();
  270. ++it;
  271. detail::skip_ows(it, last);
  272. if(it == last)
  273. return err();
  274. // param
  275. if(! detail::is_token_char(*it))
  276. return err();
  277. auto const p0 = it;
  278. skip_token(++it, last);
  279. auto const p1 = it;
  280. v.first = { &*p0, static_cast<std::size_t>(p1 - p0) };
  281. detail::skip_ows(it, last);
  282. if(it == last)
  283. return;
  284. if(*it == ';')
  285. return;
  286. if(*it != '=')
  287. return err();
  288. ++it;
  289. detail::skip_ows(it, last);
  290. if(it == last)
  291. return;
  292. if(*it == '"')
  293. {
  294. // quoted-string
  295. auto const p2 = it;
  296. ++it;
  297. for(;;)
  298. {
  299. if(it == last)
  300. return err();
  301. auto c = *it++;
  302. if(c == '"')
  303. break;
  304. if(detail::is_qdchar(c))
  305. continue;
  306. if(c != '\\')
  307. return err();
  308. if(it == last)
  309. return err();
  310. c = *it++;
  311. if(! detail::is_qpchar(c))
  312. return err();
  313. }
  314. v.second = { &*p2, static_cast<std::size_t>(it - p2) };
  315. }
  316. else
  317. {
  318. // token
  319. if(! detail::is_token_char(*it))
  320. return err();
  321. auto const p2 = it;
  322. skip_token(++it, last);
  323. v.second = { &*p2, static_cast<std::size_t>(it - p2) };
  324. }
  325. }
  326. bool
  327. opt_token_list_policy::operator()(value_type& v,
  328. char const*& it, string_view s) const
  329. {
  330. v = {};
  331. auto need_comma = it != s.data();
  332. for(;;)
  333. {
  334. detail::skip_ows(it, (s.data() + s.size()));
  335. if(it == (s.data() + s.size()))
  336. {
  337. it = nullptr;
  338. return true;
  339. }
  340. auto const c = *it;
  341. if(detail::is_token_char(c))
  342. {
  343. if(need_comma)
  344. return false;
  345. auto const p0 = it;
  346. for(;;)
  347. {
  348. ++it;
  349. if(it == (s.data() + s.size()))
  350. break;
  351. if(! detail::is_token_char(*it))
  352. break;
  353. }
  354. v = string_view{p0,
  355. static_cast<std::size_t>(it - p0)};
  356. return true;
  357. }
  358. if(c != ',')
  359. return false;
  360. need_comma = false;
  361. ++it;
  362. }
  363. }
  364. } // detail
  365. } // http
  366. } // beast
  367. } // boost
  368. #endif // BOOST_BEAST_HTTP_DETAIL_RFC7230_IPP