Основной техникой для многих систем распознавания речи является статистический метод, называемый скрытым марковским моделированием (HMM). Такие системы разрабатываются в многих центрах и способны на хорошее распознавание слов речи...не используя тренировку распознавания акустической речи (87) Данный результат был получен тестированием системы на данных, полученных из мнистерства обороны США, содержащих записи тысяч телефонных переговоров. В масштабах ограниченного тестирования вероятность правильно обнаруженных 22 ключевых слов варьировалась от 45 до 60% при условии допущения 10 ложных положительных результатов на ключевой слово в час. Таким образом, если 1000 ключевых слов была использована во время часового переговора, будет по крайней мере 300 пропущенных ключевых слов и 220 ложных обнаружений.
Примерно в то же время (Февраль 1990) канадское агенство выдало компьютерной компании в Монреале первый из серии контрактов на разработку систем распознавания слов для (88) Целью проекта было разработать распознаватель слов, работающий в условиях шумных телефонных линий. Три года спустя, агенство сообщило, что опыт показал нам, что безотносительно к условиям связи, распознавание слов остается сложной проблемой . Ключевая проблема, знакомая многим людям, состоит в том, что одно слово само по себе может быть легко неправильно воспринято, тогда как в непрерывном разговоре его значение выводится из контекста разговора. Агенство заключило в 1993 году, что вероятно наиболее эффективным способом разработки надежной системы распознавания слов будет разработка систем распознавания непрерывного разговора с большим словарем .
Система непрерывного распознавания речи требует быстрого мощного процессора. Из-за отсутствия тренировки и нечеткости выделенного сигнала из перехваченных телефонных переговоров, скорее всего даже лучшие алгоритмы и быстрые процессоры, чем используемые сейчас, будут давать худшие результаты, чем получаемые в современных хорошо обученных коммерческих системах. Другой проблемой является то, что равспознавание речи является не совсем подходящим средством для более полезной цели - распознаванию тем.
В 1993 году после неудачной попытке создать распознаватель слов, канадское агенство предложило обойти проблему путем попытки разработать систему распознавания тем переговоров. Агенство сообщило, что предварительные эксперименты, о которых сообщалось на встрече американских поставщиков для министерства обороны...указывают на то, что это позволит решить проблему . Они предложили разработать действующую систему распознавания тем к 1995 году. Однако попытка провалилась. Четыре года спустя, они все еще экспериментировали в попытках создать разпознаватель тем переговоров. (89) Однако, они получили контракт на дальнейшие исследования. Одним из предложенных методов был Н-грамм анализ, разработанный NSA.