品詞一覧検索語(句)の各単語に品詞条件を追加します:

品詞 ( 選択した品詞を 含む 含まない ) 例
NN0 aircraft, data, committeeなど。単複両方扱いをされる単数形の名詞。
NN1 pencil, goose, time, revelationなど。
NN2 pencils, geese, times, revelationsなど。
NP0 London, Michael, Mars, IBMなど。単複の区別はない。
PNI none, everything, one, nobodyなど。someやtheseなどは含まれず、「指示形容詞・限定詞」および「指示代名詞・限定詞」に含まれることに注意。
PNP I, you, them, oursなど。yours, ours, hersなどの所有代名詞もここに含まれる。
PNX myself, yourself, itself, ourselvesなど。
DT0 this, that, these, thoseのほか、much, many, more, most, least, some, any, all, such, own, same, another, each, few, both, several, half,former,less,latter, enough, either, fewer, neither no, every。
「指示形容詞・限定詞」と区別されない。littleはここに含まれず、形容詞一般の原級または副詞として扱う。
AJ0 good, oldなど
AJC better, olderなど
AJS best, oldestなど
DPS your, their, hisなど。
DT0 this, that, these, thoseのほか、much, many, more, most, least, some, any, all, such, own, same, another, each, few, both, several, half,former,less,latter, enough, either, fewer, neither no, every。
「指示代名詞・限定詞」と区別されない。littleはここに含まれず、形容詞一般の原級または副詞として扱う。
AT0 the, a, anなど。
AV0 often, well, longer, furthestなど。比較級、最上級も含まれる。形容詞との違いに注意。
AVP up, off, outなど。いわゆる前置詞的副詞 prepositional adverbがここに含まれる。
AVQ when, how, whyなど。関係副詞、関係代名詞と区別されない。
DTQ which, what, whoseなど。疑問副詞、関係代名詞と区別されない。
PNQ who, whoever, whomなど。疑問副詞、関係代名詞と区別されない。
CJC and, or, but.
CJS although, whenなど。
CJT 関係代名詞thatはここに含まれる。
PRF  
PRP about, at, in, on, withなど。
VBB isと 's は除くことに注意。am, are, 'm, 're, be(条件法、命令法のbeも含む), ai(ain'tの中のai)が含まれる。
VBD was, were
VBG being
VBI be
VBN been
VBZ is, 's
VDB do
VDD did
VDG doing
VDI do
VDN done
VDZ does
VHB have, 've
VHD had, 'd
VHG having
VHI have
VHN had
VHZ has, 's
VVB forget, send, live, returnなど。条件法現在、命令法も含むが、原形不定詞は含まない。
VVD forgot, sent, lived, returnedなど。
VVG forgetting, sending, living, returningなど。動名詞、現在分詞の区別なし。
VVI forget, send, live, returnなど。
VVN forgotten, sent, lived, returnedなど。
VVZ forgets, sends, lives, returnsなど。
VM0 can, could, will, 'll, 'd, wo(won'tの中のwo)
TO0  
ITJ oh, yes, mhm, wowなど。
CRD one, 3, fifty-five, 6609など。
ORD first, sixth, 77th, next, lastなど。形容詞用法だけでなく、名詞用法、副詞用法も含まれる。nextやlastもここに含まれることに注意。
その他 POS 単語扱いとしてタグを付与されている点に注意。
UNC 外来語、特殊記号、数式、話し言葉に現れるerrmなどの言いよどみなど。
ZZ0 A, a, B, b, c, dなど。
XX0 not, 'nt
EX0 there
[注意] POSタグ付与にはSpaCy(V.2.1.0)を用い、それをCLAWS5のtagセットに変換しました。そのため、BNCやWordbanksのPOSとは以下のように一部一致しない点があります。
(いずれのタガーにも誤解析が一定程度含まれており、その部分での異なりは除きます)
  1. 1. CLAWSではout ofやin spite of, as soon asなどの群前置詞、群接続詞、群副詞などは、out_of(前置詞)、in_spite_of(前置詞)、as_soon_as(接続詞)のように1語扱いとして品詞が付与されていますが、SpaCyはそれぞれの単語ごとに品詞解析をしており、CJECではそれぞれ個別の品詞タグが付いています。
  2. 2. Social SecurityやWorld War II、STOP Signのように大文字で始まる単語が続く場合、SpaCyはしばしば普通名詞ではなく固有名詞と判定しており、CJECではNP0の品詞タグが付いています。これらを含めた品詞検索をしたい場合は「普通名詞(NN1またはNN2)でなく、「名詞(NN.*)」を品詞一覧からお選びください。
  3. 3. CLAWSに合わせて、muchやmany, more, most, least, few, such, sameなどはCJECでも限定詞(DT0)の品詞タグに変換していますが、littleは変換が困難なため、限定詞ではなく、SpaCyの品詞解析のまま形容詞、副詞などのタグが付いています。
  4. 4. CLAWSではnoおよびeveryを冠詞扱い(AT0)にしていますが、SpaCyは限定詞に判定しており、CJECではDT0の品詞タグが付いています。