Das Computational Linguistics Toolset ist eine Sammlung von Tools für numerische Linguistik. Es enthält wiederverwendbaren Code zum Säubern, Aufteilen, Verfeinern und Beispielsammeln von Textkörpern (ICE, Penn und ein nativer), zu deren Markieren mit Tags unter Verwendung des TnT-Taggers, zum Durchführen von Permutations-Statistiken auf N-Grammen (nützlich zum Finden von statistisch signifikanten syntaktischen Unterschieden zwischen zwei beliebigen Mengen von getaggten Texten), und verschiedenen Untersuchungs-Tools. Die Tools selbst sind gut dokumentiert. (non)