我们的挑战迎来了两位数! 本周挑战是 /u/jordanreiter 的主义; 该挑战是把一个句子转为合适搜索的 'tokens' 关键词。
例如 - "don't tell Suzie Smith-Hopper that I broke Daniel's toy horse"
应转为 "don't,tell,Suzie,Smith-Hopper,that,I,broke,Daniel's,toy,horse"
并且 "other "big name" items" 应该转为 "other,big name, items"。四个标准如下:
如果把英语单词放在引号内,就将他当做一个关键词:例如 "This "huge test" is pointless" 应该转为 "this,huge test,is,pointless"。对于单引号和双引号都应该这样处理。
连续的词 (例如 "Smith-Hopper") 应该被当做一个关键词, 但是连续出现多个横杆,或者在单词开头或结尾出现横杆的话,应该被当做多个关键词处理: "Suzie Smith-Hopper test--hyphens" 应该转为 "Suzie,Smith-Hopper,test,hyphens"。
缩写的词,也应该当做一个关键词,例如: "I can't do it" 应该转为 "I,can't,do,it".
多余的标点符号应该被移除 (- 和 引号 要转义); "Too long; didn't read" 应该转为 "Too,long,didn't,read".
这是个具有挑战性的挑战! 当然他是可以实现的,加油。
在你输入正则之后,每个测试用例都会标注为是否通过,红色是未通过,绿色是通过,因为是基于 web 的,所以只能使用基于 JavaScript 传统型 NFA (Traditional NFA)正则引擎。它类似于PCRE,但有一些不同之处。