跳到主要内容

2047.句子中的有效单词数

· 阅读需 4 分钟

1、题干

句子仅由小写字母('a''z')、数字('0''9')、连字符('-')、标点符号('!''.'',')以及空格(' ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ' ' 分隔。

如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:

  • 仅由小写字母、连字符和/或标点(不含数字)组成。
  • 至多一个 连字符 '-' 。如果存在,连字符两侧应当都存在小写字母("a-b" 是一个有效单词,但 "-ab""ab-" 不是有效单词)。
  • 至多一个 标点符号。如果存在,标点符号应当位于 token 的 末尾

这里给出几个有效单词的例子:"a-b.""afad""ba-c""a!""!"

给你一个字符串 sentence ,请你找出并返回 sentence 有效单词的数目

 

示例 1:

输入:sentence = "cat and  dog"
输出:3
解释:句子中的有效单词是 "cat"、"and" 和 "dog"

示例 2:

输入:sentence = "!this  1-s b8d!"
输出:0
解释:句子中没有有效单词
"!this" 不是有效单词,因为它以一个标点开头
"1-s" 和 "b8d" 也不是有效单词,因为它们都包含数字

示例 3:

输入:sentence = "alice and  bob are playing stone-game10"
输出:5
解释:句子中的有效单词是 "alice"、"and"、"bob"、"are" 和 "playing"
"stone-game10" 不是有效单词,因为它含有数字

 

提示:

  • 1 <= sentence.length <= 1000
  • sentence 由小写英文字母、数字(0-9)、以及字符(' ''-''!''.'',')组成
  • 句子中至少有 1 个 token

2、解题思路

终于轮到正则选手出场


c2b8f8d11010c98b21d6b1f9906e8dcb.gif


看下面内容之前需要一些正则基础


正则说明

  • 完整正则表达式:/^([,.!]|[a-z]+(-[a-z]+)?[,.!]?)$/
  • 其中用 ()| 把正则中间部分分成两种情况,实际可以当成两个正则:/^[,.!]$//^[a-z]+(-[a-z]+)?[,.!]?$/
  • 要匹配完整的token:用 ^ 表示匹配到字符串起始位置,用 $ 表示匹配到字符串末尾
  • token只有1个标点符号,即第一种情况 /^[,.!]$/,表示整个字符串是3个标点中任意1个
  • token有字母的情况下,即第二种情况 /^[a-z]+(-[a-z]+)?[,.!]?$/,一定是1个或多个字母开头即 ^[a-z]+,后面可能有连字符 - 和字母即 (-[a-z]+)?,末尾可能有标点即 [,.!]?$

3、代码

var countValidWords = function (sentence) {
return sentence.split(' ').filter(w => /^([,.!]|[a-z]+(-[a-z]+)?[,.!]?)$/.test(w)).length;
};

4、执行结果

  • 执行用时: 76 ms
  • 内存消耗: 39.4 MB