Lexikoaren Behatokia 10 milioi testu-hitzetara iritsi da
XXI. mendean euskara izaten ari den bilakaera ikertzeko Euskaltzaindiak eratua duen corpusa da Lexikoaren Behatokia.
2009an ekin zion egitasmo horri. Lehen urtean 4 milioi testu-hitzeko corpus lematizatu eta etiketatua sortu zuen, Berria egunkariko edukiekin. 2010ean beste 6 milioi erantsi dizkio, Berria-koak, EITB-koak eta Argia-koak. Aurten iturri horietako eta beste bi iturritako edukiak gehituko zaizkio: El Diario Vasco-koak eta Deia-koak.
Euskaltzaindiak hitzarmenak ditu komunikabide horiekin guztiekin, egitasmo horretarako edukiak eskuratu ahal izateko. Gainera hiru partaide ditu, ikuspegi teknikotik, egitasmoa gauzatzen laguntzen diotenak: EHUko Informatika Fakultateko IXA Taldea, Elhuyar eta UZEI.