20.11.2017
 
 
abonnieren!


Home  >  Bibliothek  >  Glossar

Glossar der Sprachtechnologie
Fachbegriffe aus der Voice Welt
Schnellzugriff:
A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z




A - Abandoned Call bis AWU  

Abandoned Call
Anrufversuch, bei dem der Anrufer vor der persönlichen Entgegennahme des Gesprächs auflegt. Wird häufig auch als -> Lost Call bezeichnet.
ABR
Application Based Routing ist die Weiterleitung von Anrufen über die -> ACD-Anlage nach dem Anrufgrund bzw. der Anwendung (Application) - beispielsweise Kundenservice, Bestellung, Hotline.
ACD
Automated Call Distribution ist ein Telefonsystem im Call Center, das ankommende Anrufe zu Mitarbeitern des Call Centers leitet und ausführliche Statistiken (z. B. über Anrufaufkommen, Dauer und Wartezeit) erstellt. Im allgemeinen als „ACD-Anlage“ bezeichnet, beschreibt dieses Akronym eine Technologie, die es einem Call Center gestattet, eingehende Anrufe nach bestimmten Regeln zu organisieren und an zur Verfügung stehende Call Center Agenten weiterzuleiten, so dass eine möglichst hohe Auslastung herbeigeführt wird
ACD Entertainment
hier: Die Verteilung von Anrufern für Unterhaltungsangebote wie beispielsweise bei Live-Erotik-Gesprächen auf freie Operatoren
Active Grammar
aktives Grammatiksystem einer Sprachanwendung. Wird von einem Spracherkenner genutzt und regelt die Verwendung des aktiven Wortschatzes eines Sprachdialogsystems -> Dynamic Grammar
ADA
Average Delay of Abandon
Steht für die durchschnittliche Zeit, die der Anrufer in einer Warteschleife verbringt und dann auflegt, ohne mit einem Call Center-Mitarbeiter gesprochen zu haben.
Adaptive Dialoge
Adaptive Dialoge in sprachgesteuerten Dialogsystemen sind Dialoge, die sich an den Benutzer bzw. an das Benutzerverhalten anpassen. Es lassen sich dabei zum einen vorhandene Benutzerdaten (Alter, Geschlecht, Name, Kontakthistorie) und zum anderen das Benutzerverhalten im aktuellen Dialog (Dialoghistorie) auswerten. Mit diesen Daten können dann verschiedenste individuelle Adaptionen und Personalisierungen des Dialogs vorgenommen werden. Es lässt sich damit z.B. eine personalisierte Begrüßung in der passenden Zielsprache umsetzen: "Herr Mayer, was kann ich für Sie tun?" Abhängig von Alter und/oder Kontakthistorie können die Menüführung und die Eskalationsstrategien angepasst werden - weniger geübte Nutzer werden durch ausführliche geführte Dialoge unterstützt, erfahrenen Anwendern wird eine kürzere, interaktive Dialogführung ermöglicht. Darüber hinaus kann sich ein Dialogsystem an kundenspezifische Sprachvariationen anpassen: Bei der Bestätigung von Telefonnummern etwa gibt das System die Nummer in der gleichen Sprechweise aus, wie der Anrufer sie eingegeben hat.
AHT
Average Handling Time Im Deutschen »durchschnittliche Bearbeitungszeit« genannt. Sie bezeichnet die Zeitspanne des Gespräches inklusive der Nachbearbeitungszeit. Die Zeit, die der Anrufer in der Warteschleife verbringt, wird hierbei nicht berücksichtigt.
Airtime
Gesprächszeit
ANI
Automatic Number Identification ist ein Dienst, der die Nummer des Anrufers auf dem Empfangsgerät anzeigt. In der Regel wird - bei im Empfangsgerät integriertem Adressbuch - auch der Name bereit gestellt. ANI identifiziert den Anrufer über die Telefonnummer und kann in Verbindung mit CTI beispielsweise die Adresse und die Anrufhistorie aus einer Datenbank laden
Applets
Gemeint sind allein stehende, funktionierende Programme. Applets können zum Beispiel innerhalb eines Voice Browsers ausgeführt werden
Application Analytics
... untersuchen Anwendungen auf die Richtigkeit und Effizienz ihrer Abläufe sowie ihre Übereinstimmung mit Unternehmenszielen. Mit Application Analytics Tools lassen sich so eine Vielzahl von Informationen z.B. für Tuningvorhaben ableiten. Diese Tools liefern Parameter und Werte für die Bewertung der Performance, verringern den Aufwand für das Tuning von Sprachdialogsystemen signifikant und wirken sich positiv auf die Effizienz von Sprachanwendungen aus. Zugleich liefern Application Analytics wichtige Informationen über das Anruferverhalten. Zum Beispiel können Unternehmen, die ihre Kunden segmentiert haben, herausfinden, wie die verschiedenen Kundensegmente mit der Sprachanwendung interagieren und Aufschlüsse z.B. über das Verhalten der Premium Kunden im Vergleich mit anderen gewinnen, mit denen sich Kampagnenstrategien für das Cross- und Upselling gestalten lassen.
Application Lifecycle Management
ist das Ändern, Anpassen und Managen des Designs, Aufbaus, Angebots und der Inhalte einer Anwendung. Es dient der schnellen, kostengünstigen Optimierung, beziehungsweise Modifikation einer Applikationen (z. B. bei einer Kampagnenänderung).

Das Application Lifecycle Management (ALM) betrachtet die Entwicklung von Anwendungen als einen zirkulären und andauernden Prozess, in dem sich bestimmte, wechselseitig voneinander abhängige Arbeitsschritte wiederholen. Diese lassen sich grob zusammenfassen zu den drei grundlegenden Phasen:

- Anforderungsanalyse und –management
- Projektplanung und -management
- Änderungsanforderungen und Fehlersuche

Mit dem ALM, also kontinuierlicher Pflege und Tuning im laufenden Wirkbetrieb einer Applikation, lässt sich kundenorientierter und fehlerfreier Service von höchster Qualität realisieren. Es steigert die Produktivität und Qualität der Applikation, ermöglicht einen barrierefreien Informationsfluss und verkürzt Zeiten für Entwicklung, Bearbeitung und Synchronisation mit Geschäftszielen. Das optimiert ebenfalls die Flexibilität und Effizienz der Applikation sowie das daraus resultierende Kundenerlebnis.
ARPU
Average Revenue Per User ist der durchschnittliche Umsatz pro Kunde
ASA
Average Speed of Answer Eine wichtige Meßgröße im Call Center, die anzeigt, wie lange ein Anrufer durchschnittlich auf die persönliche Entgegennahme seines Gesprächs warten muß. Sie berechnet sich aus der Summe der Wartezeiten aller eingehenden Anrufe dividiert durch die Gesamtzahl der eingegangenen Gespräche.
ASP
Application Service Provider ist ein Unternehmen, das eine Anwendungsinfrastruktur für andere Unternehmen bereitstellt. Eine besondere Form von ASPs sind voiceASPs, die auch als -> VSPs bezeichnet werden
ASR
Automated Speech Recognition wird mit "Spracherkennung" übersetzt und beschreibt die automatische Interpretation menschlicher Sprache von einer Maschine, also die Umsetzung von gesprochener Sprache in Text ("Speech to Text")
ATB
All Trunks Busy bezeichnet den Zustand, in dem alle Leitungen (Trunks) eines Call Centers belegt sind.
Audio-Clipping
Der Begriff Clipping bezeichnet die automatisierte Medienbeobachtung und Erfassung der Reichweite von Medieninhalten. Audio-Clipping weitet dieses bisher auf Texte beschränkte Verfahren auf Audio-Inhalte aus. Durch die Kombination von Spracherkennungssystemen und mathematischen Sprachmodellen können so audiovisuelle Daten (Radio- oder TV-Programme, Podcasts und Videos) automatisiert nach bestimmten Begriffen und Kontexten durchsucht werden und anschließend die Fundstellen mit Angabe wesentlicher Daten (Datum, Uhrzeit, Fundort, Sendung, etc.) ausgegeben werden. Neben der Verwendung als Monitoring-Instrument eröffnet die gezielte Verfügbarmachung vorhandenen Contents außerdem neue Erlösquellen und zusätzliche Verwertungsmöglichkeiten. Ein Beispiel dafür ist die online-Videosuche, die per semantischer Suche Videos im Internet auffindbar macht. Solche Systeme bieten dabei sogar die Möglichkeit, nicht nur die Metadaten von Videos zu berücksichtigen, also Schlagworte oder Kategorien, sondern aus Kontexten von Gesprochenem Rückschlüsse auf Suchbegriffe zu ziehen.
Audiotex-Systeme
ist ein anderer Begriff für Tastaturwahl-Systeme, der bei den Telefongesellschaften ähnliche Verbreitung hat wie -> IVR bei Telefonanlagen-Herstellern, mit dem Unterschied, dass Audiotex-Systeme für den Hochlastbetrieb am Telekommuni­kations­netz konzipiert sind
Augmented Reality
Augmented Reality (dt: erweiterte Realität) bezeichnet die computergestützte Erweiterung der Wahrnehmung, bei der sich reale und virtuelle Welt vermischen. Eine solche Erweiterung kann alle menschlichen Sinne ansprechen, meist wird jedoch nur auf die visuelle Darstellung von Informationen Bezug genommen.
Im Gegensatz zur virtuellen Realität, bei der man komplett in eine virtuelle Welt eintaucht, geht es bei der erweiterten Realität um die Präsentation zusätzlicher Informationen. Über die gerade betrachtete reale Welt werden in Echtzeit bspw. Textinformationen oder Grafiken geblendet.
AR-Anwendungen sind in allen Bereichen des Alltags denkbar: Von der Information über die unmittelbare Umgebung, über die ins Sichtfeld eingeblendete Navigation bis hin zu Spielen. Bei Fußball-Übertragungen z.B. erweitert das Einblenden von Entfernungen bei Freistößen mithilfe eines Kreises oder einer Linie die Realität.
Authentifizierung
Prozess, bei dem die Identität eines Anrufers durch den Vergleich seiner Stimme mit einem zuvor hinterlegten Stimmbeispiel oder Stimmabdruck des Benutzers überprüft wird -> Voice Biometrics
Authentisierung
-> Authentifizierung
Automated Attendant (oder Auto-Attendant)
ist die Bezeichnung für einen automatischen, sprachgesteuerten Telefonvermittlungsplatz und ist der digitale "Ersatz" für einen menschlichen Telefonisten, der Anrufe (beispielsweise in einem Call Center) annimmt, Anfragen behandelt und dabei auf die Stimme des Anrufers oder Tastentöne reagiert
Avatar
Ein Avatar ist eine künstliche Person oder ein grafischer Stellvertreter einer realen Person in der virtuellen Welt. In dieser Funktion übernehmen Avatare Aufgaben im Online-Service, die auch ein realer Service-Mitarbeiter übernehmen würde: Sie beraten und informieren zu ausgewählten Themen und unterstützen den Kunden bei der Navigation. Die Interaktion findet meist per Schriftsprache statt, teilweise wird aber auch (evtl. zusätzlich) Spracherkennung und/oder TTS für die Ein- bzw. Ausgabe eingesetzt.
AWU
Auto Wrap-Up beschreibt die Funktion einer ACD-Anlage, bei der der Mitarbeiter nach Beenden des Gesprächs automatisch in einen Status gelangt, bei dem er Zeit für die Nachbearbeitung des Anrufes hat. Er steht in diesem Zeitraum nicht für die Entgegennahme weiterer Anrufe zur Verfügung und muß das Ende der Nachbearbeitungszeit der -> ACD-Anlage per Knopfdruck melden, um wieder für Gespräche verfügbar zu sein.


B - Back-End bis byPhone

Backend-Prozesse
ist der technische Begriff für die in -> Backend-Systemen stattfindenden Abläufe
Backend-Systeme
bezeichnen die physische Ebene, also die Maschinen, auf der die einer Anwendung dienenden Daten und Funktionen gespeichert sind
Barge-in
ist die Möglichkeit für Benutzer von Sprachapplikationen, Eingabeaufforderungen zu unterbrechen und eine Antwort zu geben, bevor die Eingabeaufforderung vollständig abgespielt wurde. Dazu ist Echo-Elimination erforderlich, durch die die Ausgabe der Maschine vom eingehenden Datenstrom entfernt wird. Durch Barge-in verändert sich typischerweise das Initiativverhalten der Anwendung
BHCA
Busy Hour Call Attempts Die höchste Anzahl von Anrufen, die in einer Stunde eines definierten Zeitraums (Tag/Woche) von der -> ACD-Anlage registriert wird.
BHCC
Busy Hour Call Completions die höchste Anzahl von Anrufen, die in einer Stunde eines definierten Zeitraums von der -> ACD-Anlage nicht nur registriert, sondern auch weitervermittelt und bis zum Ende des Gesprächs bearbeitet wird
Billing-Systeme
Abrechnungssysteme
Bridged Transfer
mit Bridged Transfer bezeichnet man eine Funktion in VoiceXML Applikationen, bei der der Bowser anstatt aufzulegen eine Verbindung (-> Call Transfer) zwischen dem User und einem angerufenen Dritten herstellt und hält
Bürgerportal
Ein -> Sprachportal, das vergleichbar einem Web-Portal einen zentralen Zugang zu öffentlichen Einrichtungen einer Kommune oder Stadt bietet. Anrufer können per automatisiertem Sprachdialog einen Überblick über verfügbare Leistungen erhalten und verschiedene Dienste direkt abwickeln, z.B. Auskunft zu den Bürgerbüros, Informationen zu KFZ-Zulassungen, Ausweisen und Führungszeugnissen sowie die Weiterleitung zu Abteilungen oder Sachbearbeitern der Stadt.

Bürgerportale sind in (ausgewählte) Systemprogramme der Verwaltungsinstitutionen eingebunden (wie zum Beispiel in TK-Anlagen, aber auch Terminkalender o.ä.) und im Idealfall in die automatisierte Abwicklung interner Prozesse behördlicher Dienstleistungen integriert.

Sie verbinden ununterbrochene Erreichbarkeit (24/7-Service) mit direktem Zugriff auf ausgewählte Bürgerservices. Sie entlasten Bedienstete in den Behörden von Standardanfragen und können effizienzsteigernd wirken. Unter der Rufnummer 115 soll es in Zukunft sogar zu einem bundesweit einheitlichen Zugang zu allen Einrichtungen der öffentlichen Hand kommen – doch das ist noch Zukunftsmusik.
Built-In Grammar
ist ein vordefiniertes Set verschiedener Grammatiken, die eine schnellere Entwicklung von Sprachapplikationen ermöglichen soll. VoiceXML 2.0 bietet beispielsweise folgende Standardgrammatiken: Boolean, Date, Digit, Currency, Number, Phone und Time
Business Communications Plattform (BCP)
Eine Business Communications Plattform (BCP) ist eine softwarebasierte Kommunikationsplattform für Unternehmen, die alle geschäftsbedingten Systeme, Programme und Anwendungen integriert, um Kommunikationsprozesse von Barrieren zu befreien und Informationen unternehmensweit verfügbar zu machen.

In ihrer einfachsten Form stellt die BCP eine Alternative zu traditionellen hardwarebasierten IP-PBX Anlagen dar. Dies sind im Wesentlichen Telefonanlagen, die verschiedene Endgeräte wie Telefon, Fax und Email physisch miteinander verbinden. Im Gegensatz zu diesen verfügen BCPs über softwarebasierte Programmierschnittstellen (APIs – Application Programming Interfaces), durch die die Funktionalitäten der BCPs in Geschäftsprozesse, Internetseiten oder Softwareapplikationen eingebunden werden können.

BCPs unterstützen i.d.R. die wichtigsten Programmierstandards (XML, VXML, SOAP, etc.) und ermöglichen dadurch die Verschmelzung von unternehmensinternen Systemen mit externen Anwendungen und Kommunikationspunkten wie z.B. Online-Portalen. Funktionalitäten wie z.B. Voicemail, Auto-Attendant, Automatic Call Distribution (ACD) sowie interaktive Sprachfunktionalitäten und Sprachtechnologie werden durch die flexiblen Schnittstellen auch für alle angeschlossenen Geräte anwendbar. Zudem können Informationen, wie z.B. Kundenanfragen oder Kundendaten, geräteunabhängig über das gesamte Unternehmen verteilt und abgefragt werden. Bearbeitungszeiten werden dadurch verkürzt und das Enterprise Ressource Planning (ERP) deutlich verbessert.
Business Continuity
siehe -> Disaster Recovery
Business Process Routing
ist die Anrufvorqualifizierung z.B. nach Kundenwert, Vertragsgruppe, Tarifen, Sprachen, Herkunft oder nach der Wartezeit. Basierend auf dieser Voreinteilung der Anrufer lassen sich dann im Unternehmen weitere Zuordnungen der Anrufe vollautomatisch oder per IVR vollziehen: z.B. Skill-based, sprachbasiertes oder ressourcenbasiertes Routing. Innovative Business Process Routing-Systeme beziehen auch andere Kontaktkanäle wie eMail, Fax und Brief mit in die (zumindest teil-) automatisierte Verteilung der Arbeitsschritte im Unternehmen ein. Business Process Routing eröffnet Unternehmen große Geschäftspotenziale: Medien- und Prozessbrüche in der Bearbeitung von Kundenanliegen können geschlossen werden, Mass-Calls werden besser steuer- und handhabbar und letztlich wird das Back Office der Unternehmen transparenter und lässt sich anhand der tatsächlichen Geschäftsprozesse tiefgehend rationalisieren und automatisieren. Fachleute sprechen im Zusammenhang mit Business Process Routing auch von der Industrialisierung der Verwaltung durch Wissensmanagement: Individuelle Kontakte werden in standardisierte Verfahren überführt, Bearbeitungszeiten verkürzt und so die Kundeninteraktionskosten signifikant gesenkt.
byPhone Service
bietet den Zugriff auf Webinhalte via Sprachdialogsystem


C - Call Center bis Customer Interaction Management

Call Center
Kundenservice per Telefon (durch Mitarbeiter oder ein automatisiertes System). Ob Versandhandel, Versicherungen oder Banken, als Kundendienst-Hotline oder im Telefonvertrieb – branchenübergreifend nutzen immer mehr Unternehmen ein Call Center für die Kommunikation mit ihren Kunden
Call Completion Rate
engl. für Automatisierungsrate, d.h. der Anteil der erfolgreich über das System abgeschlossenen Anrufe
Call Control
Befehlssätze im Rahmen der TK-Infrastruktur zum Aufbau, Halten und Beenden von Calls. Siehe auch ccXML
Caller Archetypes
... sind fiktive, idealisierte Anrufer, die als typische Vertreter einer bestimmten Zielgruppe deren Anrufverhalten verkörpern und mit deren Hilfe Dialog-Designer Sprachanwendungen einfacher und präziser an tatsächliche Nutzer anpassen können.

Sie übertragen das Konzept der -> Persona, dem Charakter oder auch der Stimme des Systems einer Sprachapplikation, auf die Anrufer. Sie werden meist durch eine Biografie und Statements ergänzt, die Ihre Einstellungen und Erwartungen an einen automatisierten Dialog unterstreichen. Dazu müssen für ihre Entwicklung zunächst quantitative demografische Daten (aus Call Centern, Anrufer Studien, etc.) erhoben werden, die anschließend durch qualitative Daten (Verhaltensmuster, Kenntnisse, Ziele, Lebensumstände etc. aus Einzelinterviews oder Testläufen unter Beobachtung) präzisiert werden.

Die Caller Archetypes helfen den Dialog-Designern, sich in die typischen Anrufer besser hineinzudenken und das Dialog-Design auf diese abzustimmen. Die Simulation realer Personen an denen die Dialog-Designer empathisch teilhaben können, unterstützt die fokussierte und zielgenaue Ausrichtung des Dialog-Designs auf entsprechende Nutzertypen. Ihre exakte Erfassung ermöglicht zudem eine Hierarchisierung nach Geschäftszielen oder den häufigsten Anrufern und ihren Anliegen oder auch Bedürfnissen.
Call Flow
beschreibt den Weg und die Stationen, die der Anruf (eines Kunden) im Unternehmen nimmt, bestenfalls bis zum erfolgreichen Abschluss des Gespräches
Call Resolution Rate
-> Call Completion Rate
Call Routing
engl. für Anrufweitervermittlung. Die automatische oder manuelle Vermittlung eines Anrufs zu einem Call Center-Agenten oder einem Computersystem -> Call Control
Call Steering
beschreibt eine Funktion zur automatisierten Anruferweiterleitung in Call-Centern. Da Mitarbeiter im Call-Center meist nach Fähigkeiten eingeteilt sind, hängen Wirtschaftlichkeit und Effizienz maßgeblich von der schnellen und präzisen Weiterleitung der Anrufer an den am Besten geeigneten Agenten ab. Dies wird meist durch ein Touch-Tone- oder Sprachdialogsystem erreicht, in dem der Anrufer sich durch seine Eingaben selbst vorqualifiziert und anschließend aufgrund der Eingaben weitergeleitet wird. Vorteile dieser Technik sind die Möglichkeit des Zugangs über eine einzige Nummer, Reduzierung der Kosten für die Bearbeitung der Vorqualifizierung sowie Zeitersparnisse in der Bearbeitung durch den Agenten.

Im aktuellen Geschehen wird der Begriff meist modifiziert als Natural Language Call Steering verwendet. Dies bezieht sich auf die Spracherkennungsfunktionalität des Systems, das in der Lage ist natürlichsprachliche Äußerungen zu verstehen und zu verarbeiten. Es erlaubt Anrufern, ihr Anliegen in eigenen Worten zu formulieren und umgehend mit der zuständigen Stelle im Unternehmen verbunden zu werden. Der Anrufer muss sich somit keinen fremden Menüstrukturen oder Eingabevorgaben unterwerfen. Zu den oben genannten Vorteilen des regulären Call Steering treten nun ein natürlicheres Anruferleben und weniger Frustrationserlebnisse seitens der Kunden, eine deutliche Reduzierung der Abwicklungsdauer eines Anrufes sowie eine geringere Zahl fehlgeleiteter Anrufer.
Call Transfer
-> Call Routing
Call Volume
engl. für Anrufaufkommen
CapEx
Capital Expenditure ist die Kennzahl für die Kosten beim Kauf einer Netzwerk- und Infrastrukturlösung. -> OpEx -> ImpEx
Carrier Grade-Plattformen
sind Systeme mit mehr als 500 Ports, die hohe Verfügbarkeit, Skalierbarkeit und Ausfallsicherheit für Netzbetreiber gewährleisten
ccXML
Call Control XML ist eine Programmiersprache zur Steuerung von Anruf-Funktionalität auf VoiceXML- oder ähnlichen Dialog-Plattformen. Dieser Standard wurde vom -> W3C initiiert, um insbesondere den voiceXML Standard zu ergänzen und ist noch nicht final freigegeben
CGI
Common Gateway Interface ist eine Standardschnittstelle, über die externe Applikationen mit einem Informations-Server (z.B. HTTP Server) kommunizieren können
Cloud Computing
Cloud Computing bedeutet abstrahierte IT-Infrastrukturen (Rechenkapazität, Datenspeicher, Netzwerkkapazitäten, Software) dynamisch an den Bedarf angepasst über ein Netzwerk zur Verfügung zu stellen. Die IT-Infrastruktur oder die Software wird dabei nicht mehr durch den Anwender selbst betrieben oder bereitgestellt, sondern bei externen Anbietern als Service gemietet. Die Anwendungen und Daten befinden sich nicht mehr auf lokalen Rechnern, sondern in der Wolke (engl. „cloud“). Der Zugriff erfolgt über ein Netzwerk, beispielsweise das des Internets.
Am Markt werden verschiedene Cloud-Computing-Modelle angeboten: Infrastruktur (Infrastructure-as-a-Service, IaaS), Plattform (Platform-as-a-Service, PaaS) oder Anwendungen (Software-as-a-Service, SaaS). Man unterscheidet Private und Public Clouds.
COD
Costs of Delay bezeichnen die Kosten, die in einem Call Center entstehen, während der Anrufer auf die persönliche Entgegennahme seines Anrufs wartet. Die Costs of Delay sind naturgemäß dann besonders hoch, wenn ein Unternehmen eine gebührenfreie Servicenummer anbietet.
Coding Objects
Programm-Module
Common User Interface
einheitliche Benutzerschnittstelle
Confidence Level
Das Konfidenzniveau ist in der Regel ein Wert zwischen 0 und 99 und beschreibt (hier:) die Wahrscheinlichkeit, mit der ein Spracherkenner die Eingabe eines Sprechers richtig erkannt hat.
Connector
mit Connectoren werden definierbare Schnittstellen bezeichnet, die den Umgang mit extrernen Datenquellen (-> ERP, -> CRM oder CMS) steuern
Contingency Planning
Notfall-Planung, siehe -> Disaster Recovery
Core Portal Player
Die Besonderheit der Core Portal Player ist, dass sie Zugang zu attraktiven Inhalten bieten sowie deren medienadäquate und zielgruppenspezifische Aufbereitung und Vermarktung betreiben
CPC
Costs per Call Bezeichnung für die Kosten, die dem Unternehmen pro Gespräch entstehen. Die Costs per Call berechnen sich aus der Summe der Gesamtkosten eines Call Centers (Telefongebühren, Personalkosten, Bereitstellungskosten), dividiert durch die Gesamtzahl der eingegangenen Anrufe innerhalb eines bestimmten Zeitintervalls
CPO
Costs per Order bezeichnet die Kosten, die dem Unternehmen bei einer Bestellung eines Kunden (Call, Handling, Shipping) entstehen.
CRM
mit Customer Relationship Management wird ein Software-System zur ganzheitlichen Unterstützung von Logistik, Marketing, Vertrieb und Service inklusive Call Center bezeichnet. Ein CRM-System integriert alle Kundenkontakte wie Telefonanrufe, Faxe, Emails und Internet und bietet dem Mitarbeiter einen Zugriff auf aktuelle und vollständige Kundeninformationen. Dies ist die Grundlage einer individuellen, effizienten und kompetenten Betreuung des Kunden zur Steigerung seiner Zufriedenheit und Förderung einer langfristigen, loyalen und profitablen Kundenbeziehung
Cross Media-Marketing
ist die integrierte Entwicklung aller Marketingmaßnahmen für alle Medien – indem jedem Medium die Funktion zugeteilt wird, die es besser (billiger!) als andere erfüllen kann
CSSSS
mit Conversational Speech Self-Service Systems werden Applikationen bezeichnet, die mit dem Anrufer in freier Rede Konversation führen -> say anything
CSTA
Computer Supported Telephony Applications (CSTA) sind die Schnittstelle für die komfortable Nutzung einer Telekommunikationsanlage durch Datenverarbeitungs-Ressourcen und PC-Arbeitsplätze. Zu den Aufgaben von CSTA gehört die Unterstützung von Vermittlungs- und Auswertungsprozeduren durch DV-Anwendungen wie die Auswertung der "ankommenden" ISDN-Rufnummer in einer Kundendatenbank
CTI
Computer-Telefonie-Integration
Customer Care & Billing
Customer Care & Billing (kurz CCB) ist die Kundenbetreuung und Abrechnung
Customer Experience Management
Beim Customer Experience Management (CEM) wird die Kundenwahrnehmung bzw. die Kundenerfahrung bezüglich angebotener Dienstleistungen oder Services untersucht. Die Betrachtungen zielen dabei auf die Perspektive des Kunden und dessen Erwartungen ab und ergänzen damit das Customer Relationship Management (CRM), das die kundenbezogenen Funktionen des Unternehmens aus unternehmensspezifischer Sicht betrachtet. Durch diese "Sicht von außen" - aus der Warte des Kunden - sollen die tatsächlichen Kundenansprüche in Beratungs-, Bestell- und Kaufsituationen analysiert und interpretiert und anschließend bestimmt werden, wie diese am besten erfüllt werden können. Dadurch soll die Lücke zwischen Kundeneinschätzung und Unternehmensselbstbetrachtung überwunden werden. Denn selbst mit intensiver und regelmäßiger Marktforschung gelingt es oft nicht herauszufinden, welche Aspekte für den Kunden in welcher Situation wirklich relevant sind.
Customer Interaction Management
nennt man das Management von Kundeninteraktionsprozessen im Contact Center durch die Integration der verschiedenen Kundenkontaktformen in die allgemeinen Geschäftsprozesse.

Kundeninteraktionen und damit verbundene Aktivitäten werden beim Customer Interaction Management durch entsprechende Technologien (Customer Interaction Management-Plattformen) automatisch erfasst, verarbeitet, geroutet und in das interne Berichtswesen aufgenommen, um auf Basis der spezifischen Unternehmensgeschäftsrichtlinien einen übergreifenden Blick auf jede einzelne Kundeninteraktion bezogen auf alle möglichen Interaktionsformen zu schaffen. Alle traditionellen Interaktionsformen wie Sprache, eMail und Web ebenso wie neue Kanäle (z.B. externe Medien oder Aktivitäten wie Aufgaben) können von einer Customer Interaction Management-Plattform abgewickelt und entsprechend der vom Unternehmen definierten Interaktionsprozesse und –strategien behandelt werden.

Die Customer Interaction Management-Plattform zentralisiert die Schaffung, Administration und das Management des Interaktionsprozesses, berichtet über alle Interaktionen und Aktivitäten sowohl auf dem Netzwerk- als auch an den Arbeitsplätzen und integriert dieses über die gesamte Contact Center-Infrastruktur. Die Plattform routet die verschiedenen Interaktionen innerhalb eines oder verteilter Contact Center zu dem jeweils qualifizierten Sachbearbeiter.


D - Data Mining bis Dynamic VoiceXML  

Data Mining
Im deutschen Sprachgebrauch hat sich der Begriff Data Mining ("Daten schürfen") für den gesamten Prozess der so genannten "Knowledge Discovery in Databases" etabliert und bedeutet: Extrahieren von impliziten, noch unbekannten Informationen aus Rohdaten. Hierfür werden Computer in die Lage versetzt, Datenbanken automatisch nach Gesetzmäßigkeiten und Mustern zu durchsuchen und einen Abstraktionsprozess anzustoßen, der als Ergebnis aussagekräftige Informationen liefert. Data Mining ermöglicht somit das automatische Auswerten großer Datenbestände mit Hilfe statistischer Verfahren, künstlicher neuronaler Netze, Fuzzy-Clustering-Verfahren oder genetischer Algorithmen. So lassen sich z. B. Änderungen im Verhalten von Kunden oder Kundengruppen aufspüren und Geschäftsstrategien können darauf ausgerichtet werden.
Eng verwandt ist das "Maschinelle Lernen", jedoch liegt beim Data Mining der Fokus auf dem Finden neuer Muster, während beim Maschinellen Lernen bekannte Muster in neuen Daten wiedergefunden werden sollen.

Datenerfassungsysteme
dienen primär der Erfassung von Informationen zur -> Workflow-Automatisierung, ohne dass eine weitere Interaktion möglich ist
Design Thinking
Design Thinking ist eine Methode zur Entwicklung von Innovationen und zum Lösen komplexer Aufgaben. Design Thinking wurde maßgeblich geprägt von David Kelley, Terry Winograd und Larry Leifer - allesamt Professoren der Stanford University. Anders als klassische Innovationsmethoden basiert Design Thinking auf der Annahme, dass herausragende Lösungen vor allem dann entstehen, wenn Gruppen interdisziplinär zusammenarbeiten. Die Basis bildet ein iterativer, anwendungsorientierter Prozess, mit dem die Bedürfnisse des Nutzers identifiziert und Ideen zur Systemgestaltung entwickelt, umgesetzt und getestet werden.

Device Embedded Systems
hier: die Spracherkennungskomponenten sind auf einem Chip im Endgerät integriert
Dialogflexibilität
Bewertet die Flexibilität des Systems, sich an unterschiedliche Kompetenzlevels und Dialogpräferenzen des Nutzers anzupassen. Die Dialogflexibilität steigt z.B., wenn sowohl benutzerinitiierte Dialoge als auch eine enge Führung durch das System unterstützt werden (Mixed Initiative), wenn Über- oder Unterbeantwortung ermöglicht werden und wenn zwischen verschiedenen Ästen der Navigationsstruktur quer gesprungen werden kann.

Folgende Kriterien werden zur Bewertung der Dialogflexibilität herangezogen:
Kriterium 1: Es ist möglich, schrittweise nur einen Slot zu füllen (ungeübte Nutzer werden effektiv ans Ziel geführt).
Kriterium 2: Alle Slots können in einer Äußerung gefüllt werden (Experten können effizient ihr Ziel erreichen).
Kriterium 3: Es werden Dialogabläufe zugelassen, die zwischen beiden Extremen liegen (Überbeantwortung in einzelnen Dialogschritten möglich).
Kriterium 4: Es ist möglich, innerhalb eines Dienstes, einen anderen einzubeziehen oder zu einem anderen Dienst zu wechseln.
Dialog-Flow
hält in Form von Flussdiagrammen die einzelnen Dialogschritte fest. Der Dialog-Flow regelt die Navigation durch die Anwendung und enthält sämtliche Verknüpfungen und Verzweigungen
Dialog Navigation
ermöglicht die "freie" Navigation durch ein sprachgesteuertes Angebot, unabhängig von starren Menues und unabhängig vom Initiativverhalten der Applikation -> Mixed Initiative
Dialogmanager/Dialogprozessor
ist die Kern-Komponente eines Sprachdialogsystems, die den Mensch-Maschine- Dialog steuert und zusätzlich meist die Koordination der einzelnen Systemkomponenten regelt.

Je offener und flexibler ein Dialogsystem gestaltet ist (von Systemen mit einfachen Sprachkommandos, machine driven initiative und starrem, vorgegebenen Dialogfluss bis hin zu Systemen mit freier Rede, mixed- oder user driven initiative und einem flexiblen, dem Benutzer angepassten Dialogverlauf) desto mehr spezifisches Wissen muss der Dialogmanager verwalten, um den weiteren Dialogverlauf zu steuern.
Dazu gehören bspw.:
- anwendungsspezifisches Wissen
- Benutzer-Profile: (Newbie-Experte, Bestandskunde-Neukunde ...)
- Session-Profile (Dauer des Anrufs, Anzahl erledigter Tasks ...)
- Dialoghistorie ("Wann fährt der erste Zug nach Münster?" ... "Und der nächste?")
- Sprachwissen ("Gibt es am Samstag nacht einen Zug?" "Ja, um 23 Uhr." statt "Ja.")
- Weltwissen ("vormittag" bedeutet 7-12 Uhr) usw.

Ein intelligentes Dialogmanagement ermöglicht es, die Systemreaktion dynamisch auf Basis der Dialoghistorie zu bestimmen und so für jeden Dialogschritt die möglichst beste Systemantwort zu generieren.
Bezieht der Dialogmanager Nutzerprofil und aktuelles Nutzerverhalten in seine Analysen ein, kann der Anrufer effizient und sicher an sein Ziel geführt werden - ohne überflüssige Bestätigungsdialoge, mit möglichen Abkürzungen für Experten, und unterstützender Dialogführung für Neulinge.
Dialogprozessor
-> Dialogmanager
Dialog Traversal Test (DTT)
ist eine Methode, bei dem eine Sprachanwendung auf richtiges Verhalten (besonders von Prompts/TTS) entlang aller möglichen Dialogpfade überprüft wird. Sie enthält die folgenden Schritte:
1. Ermittlung der möglichen Pfade durch die Anwendung. Dies geschieht normalerweise anhand einer Spezifikation, die den Fluss der Anwendung und die Prompttexte enthält.
2. Erstellung von Testskripten, die das erwartete Verhalten der Sprachanwendung darstellen - insbes. die Promptinhalte (Texte) und externe Abhängigkeiten (z.B. von der Tageszeit, einer Datenbank). Testskripte bestehen meist aus einer Reihe von abwechselnden Nutzereingaben und erwarteter Response des Systems. Dabei sind auch "fehlerhafte" Eingaben durch den Nutzer enthalten (z.B. Stille oder Begriffe, die das System nicht verstehen kann), um zu testen, ob das System mit solchen korrekt umgeht.
3. Testen - durch systematisches Abarbeiten der Testskripte wird das erwartete Verhalten verifiziert.
4. Nach Fehlern und Anpassung der Anwendung erfolgen dann erneute Tests.
Der Zweck eines händischen DTTs ist, eine Abdeckung möglicher Fehlerquellen zu schaffen, die konventionelle Softwaretests (z.B. Unit Tests) nicht erfassen können (um z.B. die korrekte Umsetzung von Prompttexten durch TTS oder Audioaufnahmen zu überprüfen).
(automated) Directory Assistants
bieten den sprachgesteuerten Zugriff auf persönliche Telefon- und/oder Adressbücher
Disaster Recovery
und -> Business Continuity Management oder Planning (DR & BCM/P) sind Strategien, die im Katastrophenfall (datentechnisch bei Hardwareversagen oder physisch bei Naturkatastrophen, z.B.) die Aufrechterhaltung des Callcenterbetriebs zum Ziel haben, z.B. durch entsprechende Backup- und Recovery Programme oder Off Site Ausweichmöglichkeiten
DNIS
Dialed Number Identification Service ist die Funktion im Telefonnetz, bei der die vom Anrufer gewählte Nummer automatisch an die ACD-Anlage weitergegeben wird. Die -> ACD-Anlage ist durch diese Funktion in der Lage, Anrufe zu identifizieren und zu qualifizieren, um sie bestimmten Mitarbeitergruppen zuzuordnen. Dies ist dann relevant, wenn ein Unternehmen verschiedene Rufnummern für unterschiedliche Serviceleistungen (Technische Hotline, Beschwerdenmanagement, Informationshotline) einsetzt.
DRTV
Direct Response TV - Im Fernsehen werden in Infomercials oder Werbespots Servicenummern eingeblendet, die den Zuschauer dazu bewegen sollen einen Anruf zu tätigen. Ein besonderes Merkmal von Direct Response TV-Spots ist, daß kurz nach Ausstrahlung des Spots der größte Anteil der Anrufe eingeht.
DSR
Im Distributed Speech Processing (DSR)-Modell wird die Sprachverarbeitung zwischen einer Client-Komponente und einer Server-Komponente geteilt, um die Effizienz über Daten-Netzwerke (IP, UMTS) hinweg zu steigern
DTMF
Dual Tone Multi Frequency wird auch als Touch Tone- oder Push Button-Verfahren bezeichnet. Mehrfrequenzwahlverfahren, bei dem das Telefonnetzwerk auf die vom Anrufer eingegebenen Tonsignale reagiert. DTMF ist eine gebräuchliche Schnittstelle zum Abrufen von Informationen aus automatisierten Systemen (in der Regel -> IVR-Systeme). DTMF war ursprünglich eine eingetragene Marke von AT&T
Dynamic Contact Center
Das Dynamische Contact Center beschreibt die technologische Erweiterung eines Contact Centers um die Möglichkeit, sich dynamisch und in Echtzeit auf wechselnde Anforderungen des Kundendienstes anzupassen, indem Unternehmensressourcen automatisch orchestriert und auf die Kundenanforderungen angepasst werden.

Im Gegensatz zu klassischen Contact Centern, die manuell auf z.B. Anruferspitzen (in Folge von Kundenevents, Marktkonditionen, unerwarteten Zwischenfällen o.ä.) reagieren, passt sich das Dynamische Contact Center automatisch an diese Bedingungen an. Dies ist möglich durch den Einsatz implementierter Echtzeit-Funktionalitäten, wie z.B. die Konsolidierung und Virtualisierung von Unternehmensressourcen (freie Mitarbeiter, verfügbare Leitungen, etc.), proaktive Notifikationen, Reporting und Analysen sowie die Integrierung von klassifizierten Agenten („Branch ~“, „Remote ~“ und „Expert Agents“).

Das Dynamische Contact Center kann dank dieser Funktionen den Traffic in Abhängigkeit von aktuellen Bedingungen automatisch zwischen Self Service und Assisted Service balancieren, um so -> Inbound und -> Outbound Aktivitäten zu regulieren. Außerdem können externe Events und Mehrwertangebote automatisch den Kunden mitgeteilt (proaktive Notifikationen) oder auch Cross- und Up-Selling-Aktivitäten entsprechend der Verfügbarkeit freier Mitarbeiter unmittelbar umgesetzt werden.

Das Dynamischen Contact Centers beabsichtigt Kundenerfahrungen zu verbessern, die Agentenproduktivität und -zufriedenheit zu steigern sowie Erträge zu generieren während gleichzeitig die Kundenbindung und das Cross-/Up-Selling gesteigert werden.
Dynamic Grammar
ist eine -> Grammatik, die von einer Sprachapplikation während des Betriebs erweitert und korrigiert werden kann
Dynamic VoiceXML
beschreibt eine von der -> W3C definierte Funktionalität, mit der auf einfache Weise VoiceXML Applikationen erstellt werden können


E - Earcon bis Expertenevaluation

Earcon
Kurze, prägnante Sounds mit spezifischer, unterscheidbarer Bedeutung. Vergleichbar mit Icons im visuellen Bereich
Early Adopters
Pioniere, die als erste eine neue Technik zum Einsatz bringen
Einzelworterkennung
Die sogenannte "diskrete Einzelworterkennung" identifiziert einzelne, vorgegebene Wörter. Die diskrete Einzelworterkennung wird von der kontinuierlichen (Schlüssel-) Worterkennung -> Word Spotting unterschieden, bei der Schlüsselworte aus ganzen Sätzen heraus erkannt werden
eMail Reader
liest Kunden auf Sprachbefehle hin eMails vor. Er kann sprachgesteuert auf eMails antworten, eMails löschen oder durch verschiedene eMails navigieren
Embedded ASR
Mit Embedded ASR wird die integrierte Spracherkennung (-> ASR) auf zumeist mobilen Endgeräten mit verminderter Rechenkapazität bezeichnet. Die bei Weitem häufigsten Anwendungsgebiete sind die Bereiche Automotive und Mobile.
Emotionserkennung
Gesprochene Sprache transportiert neben dem Inhalt des Gesagten auch Informationen über den Sprecher, so genannte paralinguistische Merkmale: sein Alter, sein Geschlecht, seine regionale und soziale Herkunft oder seinen emotionalen Zustand. Besonders emotionale Aspekte tragen in der zwischenmenschlichen Kommunikation entscheidend zum Verständnis bei. Sie sollten daher auch in der Interaktion mit Maschinen interpretiert werden, um diese natürlicher und intuitiver zu gestalten. Die Algorithmen und Methoden der klassischen Spracherkennung (deren Gegenstand der Inhalt des Gesagten ist) sind Vorbild und Basis für das noch recht junge Forschungsfeld der automatischen Emotionserkennung.

Paralinguistische Informationen verstecken sich an anderen Stellen des Sprachsignals als solche, die für die Spracherkennung relevant sind. Für die Emotionserkennung werden prosodische Merkmale wie Verläufe von Grundfrequenz und Energie und das Sprachtempo herangezogen. Bessere Erkennerergebnisse werden erreicht, wenn darüber hinaus semantische Merkmale wie die Wortwahl oder Wiederholungen des Sprechers ausgewertet werden.

Genutzt werden für die Emotionserkennung meist lernende Verfahren: Das Erkennungssystem wird mithilfe einer geeigneten Beispieldatenbank trainiert, wobei es aus den Trainingsdaten die Entscheidungsregeln für die Emotionserkennung selbst extrahiert. Schließlich wird das System mit unbekannten Testdaten validiert.
Emphase
bestimmte Art der Betonung/Intonation: eindringlich, mit Nachdruck. In der Literaturwissenschaft und Rhetorik wird damit eine besonders nachdrückliche, begeisterte, die eigene innere Bewegung und Zustimmung widerspiegelnde Ausdrucksweise bezeichnet. Sie ist in gewisser Weise das Gegenstück zum Pathos, in dem das eigene Mitleiden und Erschauern zum Ausdruck kommt. Intonation als Teilbereich der -> Prosodik) spielt bei der Sprachsysnthese ein größer werdende Rolle, aber auch in der Spracherkennung können so Gefühls- und Gemütszustände eines Anrufers erkannt werden
Enabling Function
hier: die Rolle, die eine Technologie oder ein Dienstleister spielt, um eine bestimmte Anwendung oder nachgelagerte (Dienst-)leistung überhaupt zu ermöglichen
Enterprise Class
hier: Sprachdialogsysteme, die von ihrem Leistungsumfang her für Unternehmens­kunden, in Abgrenzung zu -> Carrier Grade-Systemen, konfiguriert sind
Enterprise Edition
hier: Version einer Hard- bzw. Software-Lösung, die auf den Einsatz in privaten Telefonnetzen ausgerichtet ist
Erlang C-Algorithmus
Eine von A. K. Erlang entwickelte Methode, die die spezifische Verteilungsproblematik der Anrufe im Call Center berücksichtigt. Die Erlang C-Formel wird verwendet, um auf Basis bekannter Informationen wie der durchschnittlichen Gesprächsdauer und der durchschnittlichen Anzahl von Anrufen pro Tag den Personaleinsatz eines Call Centers zu planen. Die Erlang C-Formel setzt u.a. voraus, daß alle Anrufer in Spitzenzeiten endlos bis zur Entgegennahme ihres Anrufes in der Warteschleife warten - was in der Realität nicht der Fall ist. Erlang C berücksichtigt weder Aufleger noch Besetztzeichen und hat daher häufig eine Überschätzung des tatsächlichen Personalbedarfs zur Folge. Eine genauere Personaleinsatz-Formel ist die -> Hills B Methode
ERP
steht für Enterprise Resource Planning und bezeichnet ganzheitliche Softwarelösungen, die den betriebswirtschaftlichen Ablauf, sei es nun im Bereich Produktion, Vertrieb, Logistik, Finanzen, Personal, Verwaltung und anderes mehr, steuern, kontrollieren und auswerten. ERP-Software unterscheidet sich von anderen betriebswirtschaftlichen EDV-Programmen durch einen integrierenden Ansatz
Errorhandling
nennt man das Verfahren, mit dem Sprachdialogsysteme versuchen, nach Fehleingaben durch Nachfragen und/oder Hilfeinformationen die korrekte Eingabe zu bekommen
EVA
Enterprise Voice Applications sind Sprachdialogsysteme, die von ihrem Leistungsumfang her für Unternehmens­kunden, in Abgrenzung zu -> Carrier Grade-Systemen, konfiguriert sind

Expertenevaluation
Die Expertenevaluation ist ein wichtiger Bestandteil des Usability-Engineerings. Die Bedeutung des Optimierens der Benutzerfreundlichkeit ist unbestritten. Weniger bekannt aber ist, dass eine Vielzahl von Usability-Problemen schon vor den Tests mit "echten" Anwendern durch Expertentests entdeckt werden kann. Ziel einer Expertenevaluation ist das Aufspüren konzeptioneller und formaler Schwachstellen eines Systems. Hierfür werden meist kundenindividuelle Analyseraster auf Basis von Zielkriterien (ISO-Norm, Performanz usw.) erarbeitet. Anhand dieses Rasters wird die Anwendung von mehreren Experten analysiert und in einer abschließenden gemeinsamen Diskussionsrunde ausgewertet. Ergebnis einer Expertenevaluation ist eine Auflistung von Verstößen gegen die zugrunde gelegten Usability-Kriterien. Anhand dieser identifizierten Verstöße werden Optimierungsmaßnahmen und Handlungsempfehlungen erarbeitet. Expertenevaluationen lassen sich schnell und einfach umsetzen und die Ergebnisse sind innerhalb weniger Tage lieferbar.

F - Fall Back bis FX

Fall Back
bezeichnet das "Zurückgehen" einer Sprachapplikation zu einem vorher gehenden Punkt, z.B. wenn Spracheingaben an einem bestimmten Punkt nicht erkannt werden konnten
Finite State Grammar
auch reguläre Grammatik eines Spracherkenners, ist ein Grammatikmodell, welches auf der linearen Struktur der Sprache beruht. Es dient der computerbasierten Erzeugung einer unendlichen Menge von Sätzen mit Hilfe einer endlichen Menge von rekursiven Regeln über einem endlichen Wortschatz.

Die Produktion von Sätzen verläuft von links nach rechts, d.h. die Wahl des am weitesten links stehenden Elements (= erstes Wort im Satz) determiniert die Wahlmöglichkeit für das unmittelbar folgende Element usw. Die in einer Sprache gültigen Wahlmöglichkeiten können in einem Zustandsdiagramm dargestellt werden, das als Anweisung an einen Automaten zu interpretieren ist, die in der jeweiligen Sprache grammatischen Sätze zu erzeugen. Der Vorteil des Grammatikmodells liegt in seiner formalen Einfachheit.

Die Finite State Grammar ist zur Beschreibung natürlicher Sprachen jedoch nicht ausreichend, weil auch zwischen nicht unmittelbar aufeinander folgenden Elementen syntaktische Abhängigkeiten bestehen können (z.B. wenn ein Relativsatz eingeschoben wird).
First Call Resolution
Lösung eines Kundenproblems bereits beim ersten Anruf, so dass erstens der Kunde zufrieden ist und zweitens keine weiteren Follow Ups Calls nötig sind. Voraussetzung ist ein Support Agent, der die nötige Problem-Lösungs-Kompetenzen hat
Freier Dialog
Der Freie Dialog stellt den Idealfall in der Mensch-Maschine-Interaktion dar. Analog zur menschlichen Kommunikation tätigt der Nutzer nach Belieben seine Eingabe und das System reagiert entsprechend (-> User Driven Initiative):
***
System: Was kann ich für Sie tun?
Nutzer: Äh, ich hab da ne Frage zu meiner letzten Rechnung, genauer gesagt zu dem Posten vom 23. Mai.
System: Ihre letzte Rechnung, Posten vom 23. Mai: …
***
Der Freie Dialog räumt dem Nutzer zwar maximalen Gestaltungsfreiraum ein - in der Regel wirkt sich dies jedoch zulasten der Erkennungssicherheit aus. Eine eingeschränktere Form stellt der -> Mixed Initiative Dialog dar, bei dem System und Nutzer den Dialog gleichermaßen gestalten. Der -> Geführte Dialog schließlich überlässt dem Nutzer nur sehr wenig Freiraum. Freie Dialoge werden in der Regel bei der Eröffnungsfrage (z.B. „Was kann ich für Sie tun?“) eines Dialogs eingesetzt.
FTE
Full Time Equivalent bezeichnet eine Methode, die den Überblick über den Personaleinsatz im Call Center vereinfacht und die benötigten Personalstunden so aufteilt, als ob ausschließlich mit Vollzeitkräften und nicht mit Teilzeitkräften gearbeitet würde
FTP
File Transfer Protocol (FTP) ist ein Protokoll zur Übertragung von Dateien. Im Gegensatz zum HTTP-Protokoll kann man mit FTP neben dem Vorgang des Downloads auch auf einfache Weise Dateien auf Serversysteme hochladen (Upload)
FX
sprich: effex - steht im Bereich Akustik für "Effects" z.B. Phaser, Ver- oder Entzerrer, Compressor o.Ä. - im Finanzbereich wird mit FX auch der Term "Foreign Exchange", also Fremdwährungen, bezeichnet


G - Geführter Dialog bis GUI

Geführter Dialog
Der Geführte Dialog bildet den Gegensatz zum -> Freien Dialog. Alle benötigten Angaben werden vom System schrittweise abgefragt, d.h. der Nutzer muss sich an die Vorgaben des Systems anpassen und hat nur sehr wenige aktive Gestaltungsmöglichkeiten (-> Machine Driven Initiative vs. User Driven Initiative). Durch einen Geführten Dialog werden Nutzeräußerungen vorhersehbarer. Dies trägt einerseits zur Verbesserung der Erkennerleistung bei, andererseits wird der Dialog jedoch länger und vom Nutzer meist als „starr“ empfunden. Dem kann jedoch mit entsprechenden Methoden des Dialog-Designs entgegengewirkt werden. Bei einer großen Anzahl von Handlungsoptionen resultiert ein geführter Dialog meist entweder in einer zu breiten oder zu tiefen Auswahlpalette.
***
System: Bitte nennen Sie zunächst den Ort, von dem Sie abfahren möchten.
Nutzer: Berlin.
System: Und an welcher Haltestelle möchten Sie einsteigen?
Nutzer: Friedrichstraße.
System: Gut. Bitte nennen Sie jetzt den Zielort.
Nutzer: Leipzig.
System: Und an welcher Haltestelle möchten Sie aussteigen?
Nutzer: Hauptbahnhof.
System: An welchem Tag möchten Sie abfahren?
Nutzer: Heute.
System: Zu welcher Uhrzeit?
Nutzer: So gegen drei.
Generative Semantik
Von G. Lakoff, J. Mc Cawley, J. Ross u.a. seit Ende der 60er Jahre in den USA vertretene Gegenposition zu N. Chomskys Semantik-Konzept im Rahmen seiner 1965 entwickelten »Standardtheorie« der generativen Transformationsgrammatik.
Grammar
engl. für Grammatik. Beschreibt eine Auswahl an Äusserungen, die von einem Spracherkenner erkannt werden sollen
GUI
steht für Graphical User Interface und wird mit Graphische Benutzer Oberfläche übersetzt. Ist verwandt mit dem -> VUI (Voice User Interface)


H - Handschrifterkennung bis Hybride Sprachverarbeitung

Handschrifterkennung
Wird gelegentlich auch als ICR (Intelligent Character Recognition = Intelligente Zeichenerkennung) bezeichnet - ist die automatische Erkennung handgeschriebener Zeichen. Dabei wird zwischen der Erkennung vektorbasierter Handschriften (Tablet-PCs und PDAs) und der Erkennung rasterbasierter Handschriften unterschieden. -> OCR
Hear and Feel
ist in Analogie zum "Look and Feel" das akustische Erscheinungsbild einer Anwendung
Help Desk
bezeichnet die Abteilung, an die sich Anwender richten können, wenn sie technische Hilfe brauchen. Um Call Center zu spezifizieren, die ausschließlich eigene Mitarbeiter betreuen, verwendet man den Begriff "interner Helpdesk"
Hidden Markov Modell
Das akustische Modell beschreibt die Zusammenhänge zwischen den Merkmalsvektoren und den Wörtern des Vokabulars. Dies geschieht in der Regel in zwei Schritten. Zunächst werden die Wörter als Ketten von Grundeinheiten, zum Beispiel -> Phonemen, dargestellt. In der Regel werden für die deutsche Sprache ca. 40 Einzelphoneme verwendet. Koartikulationseffekte können durch kontextabhängige Phonemmodelle besser berücksichtigt werden. Im zweiten Schritt wird dann die Verbindung zwischen Merkmalsvektoren und Phonemen durch Wahrscheinlichkeitsverteilungen beschrieben. Jedes Phonem wird wiederum durch ein Hidden-Markov-Modell (HMM) dargestellt. Dadurch werden die stark variierenden Sprechgeschwindigkeiten in die Berechnung einbezogen
Hills B
Ein von Dr. Michael Hills entwickeltes Verfahren zur Planung der Personalkapazität (hier: im Call Center). Die Ergebnisse dieses Verfahrens können vor allem bei kleineren und mittleren Verkehrsaufkommen realitätsnäher sein als eine entsprechende Berechnung mit -> Erlang-Algorithmen. Hills B berücksichtigt im Gegensatz zu Erlang auch die Wiederanruferquote.
Home Shopping
-> Teleshopping
Hosting
hier: das Betreiben einer Sprachdialogplattform für Dritte -> voiceASP
Hosting Platform
Eine Plattform, die das technische Vorhalten von Anwendungen und Inhalten auf Internetservern ermöglicht
Hot Stand by
Ein Hot Stand by-System steht voll angeschlossen neben dem aktiven (Live-) System und kann im Notfall automatisch und ohne für den Nutzer merkliche Unterbrechung dessen Tätigkeiten übernehmen
Hot Swapable
nennt man die Einsatzweise technischer Bauteile, wenn sie während des laufenden Betriebes ohne Funktionseinbußen ausgetauscht werden können
Hot Word Recognition
engl. für Schlüsselworterkennung. Spezielle Form der Spracherkennung, bei der ein System die Äusserung eines Anrufers auf bestimmte Schlüsselworte (oder Schlüsselphrasen) überprüft und erst nach deren Vorkommen aktiv wird
Hot Link
ist ein spezieller VoiceXML Ausdruck für ein -> Universal Command. Mit einem Hot Link kann der Anrufer per Spracheingabe direkt zu einem Punkt im Angebot gelangen, ohne sich vorher durch eine komplizierte Menuestruktur zu arbeiten
HTML
Hyper Text Markup Language ist eine Programmmiersprache, die für die Erstellung von Internet-Seiten genutzt wird
HTTP
Hyper Text Transfer Protocol ist das Übertragungsprotokoll im Internet zur Übertragung von Seiteninhalten zwischen Computern
Human Factor
Im allgemeinen dient der Ausdruck der Beschreibung eines Designs, das an den Menschen angepasst wird und die Leistung des Menschen in Bezug auf die Maschine unterstützt oder sogar verbessert. Das Gegenteil davon ist ein Design, bei dem der Benutzer besondere Leistungen erbringen muss, um erfolgreich mit der Oberfläche oder dem Gerät zu interagieren (da er andernfalls den Vorgang abbrechen muss). Bei Sprachapplikationen müssen bei der Erstellung des -> VUI und beim Dialogdesign die den Benutzer betreffenden Faktoren berücksichtigt werden
Hybride Sprachverarbeitung
beschreibt die Verteilung von Prozessen der Sprachverarbeitung auf sowohl „embedded“ Komponenten als auch auf netzbasierte. Somit wird lediglich die Spracherfassung am Endgerät vollzogen, die Ergebnisse werden als Datenstream an den Server gesendet, wo die eigentliche Verarbeitung geschieht. Das Resultat der serverbasierten Sprachverarbeitung geht anschließend zurück an das Endgerät und kann in Sprache, Text oder Grafik ausgegeben werden. Die Vorteile dieser Aufteilung liegen einerseits in der sprecherunabhängigen Eingabe auf dem Endgerät und der gleichzeitig möglichen Nutzung riesiger Grammatiken, da diese auf leistungsstarken Webservern und nicht auf den sehr begrenzten Endgerätespeichern liegen.

I - IDE bis IVR-Anbieter

IDE
Integrated Development Environment ist ein Begriff der Kelsey Group für Entwicklungswerkzeuge für Sprachapplikationen (Development Tools), die in der Regel integraler Bestandteil einer “Laufzeit-Umgebung” (von -> ASR-, -> IVR- oder auch -> VXML Gateway-Anbietern) sind
Identity Management
Ziel des Identity Managements ist die zentrale Verwaltung von Identitäten und den mit ihnen verknüpften Attributen, z. B. Namen, Telefonnummern, Rollen etc. Basis sind Verzeichnisdienste, die den gespeicherten Identitäten und ihren Attributen so genannte Identifikatoren zuordnen (und umgekehrt), also bestimmte individuelle Merkmale wie Zugriffsberechtigungen. Das ermöglicht eine eindeutige Authentifizierung über mehrere Systeme hinweg (Single Sign-On) und die Verifikation von Identitäten durch automatisierte Authentifizierungen. Diese können z. B. durch Wissen (ein Passwort für alle Systeme), Besitz (eine Keycard) oder auch biometrische Merkmale (Fingerabdruck, Iris, Gesichts- und
Sprechererkennung) durchgeführt werden. Aufsetzend darauf ist eine Zertifizierung von Identitäten möglich, die samt ihrer Merkmale und Berechtigungen durch eine digitale Signatur verschlüsselt werden (Personal-Key-Infrastruktur).
Bei Voice Ident-Lösungen geschieht die Erkennung eines Sprechers durch Vergleich einer Äußerung (Utterance) mit bestehenden Stimmprofilen (Voice Prints).
ImpEx
Implementation Expenditure ist die Kennzahl für die Implementierungskosten einer Lösung -> CapEx -> OpEx
Inbound Calls
Auch Incoming Calls genannt. Bezeichnung für eingehende Anrufe
IN-Dienste
sind auf Basis "intelligenter" Netze angebotene Dienstleistungen
Information Architecture
Information Architecture bezeichnet die Konzeption und Definition der Struktur eines Informationssystems (z.B. von Software) sowie der für den Nutzer des Systems möglichen Interaktionen. In Abgrenzung zu den Nachbardisziplinen wie dem Interaction-Design oder dem Usability-Engineering beschäftigt sich die IA mit der Basisstruktur eines Systems.
Informationssysteme
hier: Sprachapplikationen, die primär dem Angebot und Abfragen von Informationen (Produktinformationen, FAQs, Fahrpläne, etc.) dienen
Infotainment Services
Dienste, die sowohl informierenden als auch unterhaltenden Inhalts sind
IN-Routing-Funktionen
z.B. das herkunfts- und zeitabhängige Weiterleiten von Anrufen auf unterschiedliche Rufnummern (Festnetz, Mobilfunk, etc.) und die integrierte Mailbox zur Aufnahme von Kundendaten mit automatischer Weiterleitung der Daten per e-Mail
Intelligent Contact Routing
-> ACD und -> Call Routing
Intelligentes Netz
Ein Intelligente Netz (IN) ist kein physikalisches Netz, sondern ein diensteorientiertes System, das auf einer vorhandenen Netzwerk-Infrastruktur (z.B. Telefonnetz) aufsetzt. Es erweitert das Telefonnetz um intelligente Komponenten und zusätzliche Leistungsmerkmale, v.a. Mehrwertdienste für Festnetztelefonie, Mobilfunk und Telefax.
Intelligentes Wohnen
Das Konzept des intelligenten Wohnens bzw. des intelligenten Hauses (Engl. Smart Home) beschreibt die vollständige Vernetzung und Steuerung von Wohnungen bzw. Häusern einschließlich aller inbegriffenen Systeme und Geräte mit dem Ziel, den Wohnkomfort, die Sicherheit und die Ressourcenverwendung für seine Bewohner zu optimieren.

Die Vernetzung des intelligenten Hauses umfasst einerseits die Vernetzung aller Geräte bzw. Anlagen im Haus (Intranet) sowie die Anbindung dieser an Datenbanken und Steuerungseinrichtungen außerhalb des Hauses (via Internet). Grundlage einer solchen vernetzten Steuerung sind standardisierte Steuerungsnetzwerke (z.B. KNX) und einheitliche Kommunikationsprotokolle (z.B. TCP/IP). Ziel der Vernetzung ist eine einheitliche Bedieneroberfläche, von der aus alle Geräte (Computer, Stereoanlage, Kühlschrank, etc.) bzw. Anlagen (Licht, Heizung, Eingangs- und Anwesenheitskontrolle, etc.) wahlweise automatisch oder durch Eingreifen der Bewohner gesteuert werden. Eine zentrale Stellung kommt hier der Sprachtechnologie zu, die eine intuitive und barrierefreie Mensch-Maschine-Interaktion ermöglicht. Der Bewohner kann dann seinem Haus in natürlicher Sprache sagen, was er möchte.

In Verbindung mit künstlicher Intelligenz kann das intelligente Haus aus der Interaktion mit seinen Bewohnern lernen und seine Steuerung möglichst optimal auf ihre Bedürfnisse anpassen. Anwendungsbereiche für diese Art der Vernetzung sind z.B. effiziente Energieversorgung nur nach Anwesenheit, Haussicherheit durch biometrische Verfahren, das virtuelle Heimbüro und die Gesundheitsfürsorge (Ferndiagnose durch den Arzt) sowie Assistenzfunktionen in den Lebensräumen von Senioren (Ambient Assisted Living).
Interaction Design
Beim Interaction Design (Interaktionsgestaltung) geht es um die Gestaltung der Funktion und des Verhaltens von Produkten und Systemen. Ein Interaction Designer gestaltet all das, was ein Benutzer sieht, hört und fühlt, wenn er mit einer Anwendung oder einem Endgerät interagiert. Dabei legt er während des Designprozesses auf eine benutzerzentrierte Gestaltung besonderen Wert.
Dabei ist Interaktivität nicht an neue Technologien gebunden. Menschen interagieren seit jeher miteinander. Deshalb kann unter Interaction Design auch die Entwicklung von Lösungen für Dienstleistungen gesehen werden.
Internet der Dinge - Web of Things
"Web of Things" oder "Internet der Dinge" bezeichnet die Vernetzung von Objekten mit dem Internet mit dem Ziel einer selbständigen, selbstorganisierten Interaktion der Objekte. Auf diese Weise lassen sich komplexe Prozesse und Entscheidungen vollautomatisch erfassen und abbilden. Schlüsseltechnologie ist die RFID (Radiofrequenz-Identifikation): Dabei sind Gegenstände mit einem Chip ausgestattet, der Informationen einholt und per Radiowellen an externe Lesestationen überträgt. Typische Anwendungsszenarien finden sich im Bereich Home-Automation: Der Sensor übermittelt hier etwa die Information, welche Lebensmittel in Kürze fehlen werden und aufgefüllt werden müssen.
IP-Technologie
ermöglicht auf Basis des Internet Protocols, Datenpakete von einem Sender über mehrere Netze hinweg zu einem Empfänger zu transportieren. Die Übertragung ist paketorientiert, verbindungslos und nicht garantiert. Die Datenpakete werden vom IP als voneinander unabhängige (auch bei identischen Sendern und Empfängern) Pakete an das Zielnetzwerk und die Station transportiert. Anschließend werden die Pakete im Zielnetzwerk wieder zum ursprünglichen Format zusammengestellt
ISDN
Integrated Services Digital Network ist das öffentliche Digitalnetz für den Transfer von Daten, Text, Sprache und Bild über eine einzelne Telefonleitung (Amtsleitung). Ein digitaler Teilnehmeranschluss besteht aus einem Steuerkanal (D-Kanal mit 16 KBit/s) und zwei Basiskanälen (B-Kanal mit jeweils 64 KBit/s). Mit diesem Basisanschluss können zwei Dienste gleichzeitig bedient werden, z.B. Telefonieren und Faxempfang. Neben dem Basisanschluss gibt es noch den "Primärmultiplexanschluss"; dieser besteht aus 30 B-Kanälen und einem D-Kanal und stellt etwa 2 Mbit/s zur Verfügung
ISP
Internet Service Provider
IVR
Interactive Voice Response bietet dem Telefonkunden die Dienstleistungen und Angebote in einem Sprachdialog an. IVR führt den Anrufer durch ein Sprachmenü und kann sowohl die Anworten der Anrufer aufzeichnen als auch interaktiv auf Eingaben der Telefontastatur (Tonwahl) reagieren. Interaktive Voice Response-Systeme wurden erstmals als -> DTMF basierte Applikationen implementiert. Der Anrufer wird mit Hilfe einer aufgenommenen oder künstlichen Sprachausgabe aufgefordert, Informationen bereitzustellen. Bei alten -> IVR-Systemen können Anrufer nicht mündlich antworten, wenn die Hersteller die alten Umgebungen nicht mit Hilfe von -> ASR-Funktionalitäten aktualisieren
IVR-Anbieter
insb. Anbieter aus dem Telefonanlagengeschäft und Call Center Software Business, die -> DTMF (und neuerdings auch -> ASR)-Funktionalität mit -> Call Routing und -> CTI in einem proprietären Hard- und Softwarepakte vermarkten. Im Call Center-Umfeld wird der Einsatz von Voice Self Service nach wie vor von IVR-Anbietern getrieben, die über die weitaus größte installierte Basis an „large scale“ Anwendungen verfügen (z.B. Nortel, Aspect, u.a.)


J - JSGF bis JVM  

JSGF
Java Speech Grammar Format -> Grammar
Junk Calls
Sogenannte »Spaß-Anrufe« von Personen, die an den Dienstleistungen oder Produkten des Unternehmens nicht interessiert sind, sondern sich mit diesen Anrufen die Zeit vertreiben. Die Anzahl der Junk Calls ist bei gebührenfreien Rufnummern besonders hoch und kann zu erheblichen Mehrkosten führen
JVM
Java Virtual Machine. Eine plattformunabhängige Programmiersprache


K - Kano-Modell bis Konsistenz

Kano-Modell
… ist ein Modell zur Bewertung von Kundenwünschen, das 1978 von Dr. Noriaki Kano an der Universität von Tokyo entwickelt wurde. Es unterscheidet vereinfacht drei Qualitätsebenen von Produktmerkmalen (Features): Basisfaktoren, die bei Vorhandensein keine besondere Zufriedenheit schaffen, bei Nichtvorhandensein jedoch großen Unmut erzeugen (Beispiel Auto: Rostschutz, Sicherheit); Leistungsfaktoren, die dem Kunden bekannt sind und deren Vorhandensein je nach Ausmaß Unzufriedenheit beseitigt oder Zufriedenheit schafft (Beispiel Auto: Beschleunigung, Lebensdauer); sowie Begeisterungsfaktoren, die nicht unbedingt erwartet, aber sehr goutiert werden (Beispiel Auto: Sonderausstattung, Design). Beide, Leistungs- wie auch Begeisterungsfaktoren wirken sich ebenfalls auf die Akzeptanz beim Kunden aus. Im Zeitverlauf verändern sich die Eigenschaften: Begeisterungsfaktoren können zu Leistungsfaktoren und diese wiederum zu Basisfaktoren werden. Das Modell erlaubt, die Wünsche von Kunden besser zu qualifizieren und herauszufinden, welche Investitionen in welche Funktionen welche Wirkung auf die Kundenzufriedenheit zeitigen und deshalb priorisiert werden sollten.
Ein Beispiel für die Untersuchung der Kundenzufriedenheit bei Sprachdialogsystemen mithilfe des Kano-Modells finden Sie hier!
Kommunikationssystem
Unter dem Stichwort Kommunikationssystem werden Funktionen zur Steuerung von Tele­kommunikationsdiensten via Sprache subsummiert (wie Sprachwahl, Abhören von eMails etc.)
Konkatenation
Konkatenation bzw. Audiokonkatenation nennt man im Zusammenhang mit Sprachaufnahmen für Sprachdialogsysteme das geschickte Zusammenfügen von -> Voice Prompts zu natürlichsprachlich klingenden Äußerungen. Vor allem für variable Daten und bei Verzicht auf eine TTS wird von der Verkettung von Audiofiles zur Systemlaufzeit Gebrauch gemacht. Soll in einem System ein variables Datum wiedergegeben werden, wäre es ein enormer Aufwand alle möglichen Datenvariationen vorher mit einem Sprecher aufzunehmen. Man beschränkt sich daher auf die Aufnahme der einzelnen Variablen wie Tag, Monat und Jahr. Diese werden dann vom System zusammengesetzt und nacheinander abgespielt. Die Datumsausgabe "1.Januar 2010" z.B. entsteht aus der Verkettung der Einzeldateien "Erster.wav" + "Januar.wav" + "Zweitausendzehn.wav".
Konsistenz
Eine Technik der IVR, spezifische Wünsche / Anforderungen des Anrufers zu erkennen und den Dialog dahingehend zu verbessern


L - Landmark bis Location Based Service

Landmark
ein systemgeneriertes Feedback (Info) für den Anrufer, an welcher Stelle im Dialog er sich gerade befindet
Language Guesser
erkennt anhand von bestimmten Buchstabenfolgen die Sprache, in der ein Wort ausgesprochen werden soll. Wird in -> TTS Anwendungen verwendet
Least Cost Routing
Automatische Anrufweiterleitung über die ACD-Anlage unter Berücksichtigung der verschiedenen Kosten für einen Anruf je nach Uhrzeit und Standort. Bei Call Centern mit verschiedenen Standorten kann die ACD-Anlage beispielsweise so programmiert werden, daß sie an das am nächsten liegende Call Center weitergeleitet werden.
Location Based Service
Ortung eines Mobiltelefons anhand der Funkzelle, in der es angemeldet ist. Weniger genau als das satellitengestützte Global Positioning System (GPS), dafür aber mit jedem Mobiltelefon möglich. Daraus ergeben sich standortbezogene Mobilfunkangebote wie z.B. "Restaurantangebote in der Nähe Ihres aktuellen Standortes".


M - Machine Driven Initiative bis Music on Demand  

Machine Driven Initiative
beschreibt einen Dialogverlauf. Hier geht die Initiative im Dialog von der Maschine aus, d.h. es werden Angebote zur Auswahl gestellt, aus denen der User per Spracheingabe wählen kann
Managed Service
hier: Komplett-Dienstleistung, die alle Aspekte des Betriebs einer Sprachapplikation umfasst, inkl. der kontinuierlichen Pflege und Weiterentwicklung auf Basis eines von Miete und Verbrauch abhängigen Abrechnungsmodells
Mehrsprachigkeit
ist dann gegeben, wenn sich die Sprachapplikation nicht nur über die deutsche, sondern auch über weitere Sprachen bedienen lässt
Mehrwertdienste
Im Allgemeinen Bezeichnung für Dienstleistungen der Anbieter, die über die reine Übertragungsleistung hinausgehen. Im Telefondienst z.B. eine im Netz angebotene Sprachbox oder ein Informationsdienst im Rufnummernbereich (0)900 ggf. bis hin zum kompletten Call-Center
Mentales Modell
Der Anrufer baut sich ein inneres Bild der Applikation auf und erwartet vom System (dem Bild) entsprechende Reaktionen. Durch das Dialogdesign beeinflußbar. Siehe -> Persona
Micro Content Payment
ist die elektronische Bezahlung von kleinen Beträgen. Neben einer einmaligen Zahlung sind auch aggregierte Zahlungen möglich. Das heisst, der Kunde lädt ein Guthaben für solche micro payments auf sein Konto. Man spricht von „prepaid“ („ticker systems“) und „postpaid“ („micro billing“) bzw. von „Aggregation Systems“ oder „Metering Systems“
Middleware
ist ein zwischen verschiedenen IT- und TK-Komponenten angesiedeltes System, das eine beidseitige Kommunikation gewährleistet (z.B. als -> CTI-Middleware zwischen Telefonanlage und Computer)
Mixed Initiative
Mit Mixed Intiative bezeichnet man einen Dialogablauf, der sich dynamisch an die Bedürfnisse des Anrufers anpasst und zwischen -> user driven und -> machine driven angesiedelt ist
Mixed Language Capability
macht in einer -> TTS Anwendung die korrekte Aussprache von Fremdwörtern möglich, ohne die gewählte Stimme oder Sprache zu wechseln. Das Benutzerwörterbuch stellt sicher, dass alle speziellen Ausdrücke, Abkürzungen, Kurzwörter und sogar regionale Aussprachevarianten genau so klingen, wie es sich der Entwickler vorstellt. Durch einen -> Language Guesser kann dieser Vorgang automatisiert werden
Mobile Customer Relationship Management
Das mobile Customer Relationship Management (mCRM) beschreibt einen kundenorientierten Managementansatz, der eine langfristige und profitable Beziehung zwischen Kunden und Unternehmen zum Ziel hat. Dazu erweitert das mCRM die Maßnahmen des klassischen Customer Relationship Managements (-> CRM) um die technischen Möglichkeiten mobiler Kommunikation.

Das Herz eines erfolgreichen mCRM ist wie beim klassischen CRM ein Datenbanksystem, dass die Daten von Kunden und Transaktionen mit diesen Kunden speichert, aufbereitet und bereitstellt, um die Kommunikation im Kundenprozess mit verlässlichen Zahlen, Informationen und Fakten zu unterstützen. Aufgrund der technischen Ausgestaltung mobiler Kommunikation ergeben sich allerdings Änderungen u. a. auf Organisations- und Prozessebene.

Wesentlicher Unterschied ist die Standortunabhängigkeit dieses Prozesses im mCRM. So kann auf Unternehmensseite z.B. ein Vertriebsmitarbeiter vor Ort beim Kunden „live“ durch Informations- und Kommunikationstechnologien unterstützt werden (mobile Endgeräte wie Notebook, PDA, Mobiltelefon etc., über die Informationen zum Kundenwert und der Kundenhistorie abrufbar sind oder neue Kundendaten direkt erfasst werden können). Das strafft den Vertriebsprozess und erhöht die Kundenzufriedenheit.

Aus Sicht der Kunden wird der Kontakt mit dem Unternehmen noch stärker individualisiert. Nicht nur Serviceangebote sondern auch Mehrwert- und Transaktionsservices werden jederzeit vom persönlichen Handheld erreichbar. Eine Ausweitung dieses Ansatzes repräsentieren halb-autonome Dienste, die je nach Standort selbständig eine Individualisierungen vornehmen (Location Based Services). Die instantan erfassten Daten können dann in 24/7 Self Service Angebote eingebunden werden (Billing bei Transportmitteln, ortsabhängige Branchen und Info-Dienste, Social Networks etc.).
Mobile Music Solution
ermöglicht das Hören und den Vertrieb von Musik an mobile Endgeräte. Sprachportale, die mit einer Mobile Music Solution Software ausgestattet sind, ermöglichen den Nutzern z.B. das Herunterladen von Klingeltönen oder das Versenden von Musikstücken an Freunde
Mobile Parking and Ticketing
darunter versteht man das Kaufen und Reservieren von Karten für Museen, Theater, Ausstellungen oder das Bezahlen der Parkgebühren mit einem mobilen Endgerät
MRCP
Das Media Resource Control Protocol (MRCP) ist ein Standard, der den Zugriff auf Sprachsoftware in verteilten Systemen und im Internet regelt. Konkret bearbeitet das MRCP Anfragen, die von externen Clients in Form von Transportprotokollen an den Sprachserver gestellt werden.
MSP
Managed Service Provider sorgt für die Bereitstellung und das Management einer technischen Infrastruktur und der Applikationen im Auftrag von Unternehmen
Multichannel
Unter dem Begriff Multichannel wird der kanalunabhängige Zugriff auf ein System oder Datenbasis verstanden. Der Kanal ist dabei in der Regel ein Web-, Voice- oder Mobile- Interface. Pro Interaktion kann jeweils nur ein Kanal genutzt werden. Die Nutzung mehrer Kanäle pro Interaktion wird als multimodal bezeichnet.
Multichannel CRM
nennt man die Bündelung unterschiedlicher Kundenanlaufpunkte in einem (IT-) System
Multichannel Service Delivery
ist die Bereitstellung verschiedener Services oder Infodienste (Nachrichten, Wetter, etc.) über verschiedene Medien (Handy, Telefon, Internet etc.)
Multi Slot Eingaben
erlauben bei Sprachdialogsystemen durch geeignete Entwicklung der verwendeten Grammatiken, die häufigsten Eingaben des Anrufers zu verstehen
Multi Slot Model
wird auch Semantic Slot Model genannt. Äusserungen des Anrufers werden in einem semantischen Modell erfasst und zugeordnet (vergl. -> Wortfeldtheorie). Bestimmte Schlüsselworte (z.B. from, to, date, time) können so mit weiteren Eingaben kombiniert werden, ohne dass diese in einer bestimmten Reihenfolge gesprochen werden müssen. Das Multi Slot Modell wird beim -> Mixed Initiative Ansatz verwendet
Multi Persona Design
mit Multi Persona Design bezeichnet man einen Ansatz im Dialog Design, der nicht nur eine -> Persona im System bereitstellt, sondern dem Anrufer gleich mehrere virtuelle Persönlichkeiten anbietet, ggf gleichzeitig. Eine gelungene Applikation mit Multi Persona Design ist der Sieger des VOICE Contest 2004 (01805 - 212 031-4)
Music on Demand
Musik auf Bestellung: Die Möglichkeit, bei einem entfernten Anbieter bestimmte Musik auszuwählen und sie auf einem lokalen Endgerät abzuspielen


N - N-Best List bis No Match  

N-Best List
gehört zum -> Error Handling einer Applikation. Dabei werden mögliche Lösungen mit der N-Best Liste verglichen. Die höchste Trefferwahrscheinlichkeit (N=1) ist meist die korrekte Antwort auf eine vom Anrufer gestellte Frage. Allerdings kann das System im Rahmen des Semantischen Modells feststellen, ob die "beste" Lösung unlogisch oder ausserhalb des Kontextes liegt. In diesem Fall werden nachfolgende Vorschläge aus der N-Best List verglichen und auf deren Plausibilität geprüft, bevor die Antwort gegeben wird.
Net Promoter Score
Der Net Promoter Score (NPS) dient zur unmittelbaren Messung der Wahrscheinlichkeit, mit der Kunden ein Produkt, eine Dienstleistung oder ein Unternehmen weiterempfehlen. Dabei wird die Differenz zwischen Promotoren und Kritikern des Produktes (bzw. der Dienstleistung oder des Unternehmens) berechnet. Promotoren und Kritiker lassen sich über die Frage: "Wie wahrscheinlich ist es, dass Sie XY einem Freund oder Kollegen weiterempfehlen werden?" ermitteln. Gemessen werden die entsprechenden Antworten auf einer Skala von 0 = unwahrscheinlich bis 10 = äußerst wahrscheinlich. Promotoren sind Kunden, die mit 9 oder 10 antworten, Kritiker, diejenigen, die mit 0 bis 6 antworten. Kunden, die mit 7 oder 8 antworten, gelten als "passiv Zufriedene" und fließen nicht in die Berechnung des NPS ein. Mittelbar misst der Net Promoter Score damit die Kundenzufriedenheit und die Loyalität des Kunden, denn Analysen haben gezeigt, dass ein sehr starker Zusammenhang zwischen Weiterempfehlung, Kundenzufriedenheit und Kundenloyalität besteht.
Netzwerk basiert
-> Server Based
NLU
Natural Language Understanding ermöglicht dem Anrufenden, in ganzen Sätzen mit der Sprachapplikation zu sprechen. Dabei werden nicht nur die einzelnen Worte erkannt, sondern auch ihre eventuell unterschiedliche Bedeutung in Abhängigkeit von ihrer Stellung im Satz
No Input
Ein Zustand, der eintritt, wenn ein Anrufer vom System zu einer Eingabe aufgefordert wird und keine Eingabe erfolgt
Noise Reduction
Nebengeräusche stellen für die automatische Spracherkennung eine große Herausforderung dar, weil sie von gerichteten Spracheingaben unterschieden werden müssen. Nebengeräusche sind beispielsweise Umgebungslärm und sogenannte Side-Speech (Sprache des Nutzers ist an eine nebenstehende Person und nicht an das System gerichtet).
Die hier nötige Noise Reduction wird in zwei Systemkomponenten realisiert: Zum einen erlaubt der Einsatz spezieller Mikrofone mit entsprechender Richtcharakteristik ein Fokussieren auf Schallereignisse, die vom Sprecher direkt an das System gerichtet sind. Zum anderen wird der verbleibende Störschall in der Vorverarbeitung des Spracherkenners weiter herausgefiltert. Ist der Umgebungslärm z.B. relativ konstant, kann dieser aufgezeichnet und anschließend aus dem Eingangssignal "herausgerechnet" werden. Auf diese Weise empfängt das akustische Modell des Erkenners, welches der Vorverarbeitung nachgeschaltet ist, ein (nahezu) reines Sprachsignal.
No Match
Ein Zustand, der eintritt, wenn ein Anrufer vom System zu einer Eingabe aufgefordert wird und eine unlogische oder kontextuell unpassende Eingabe erfolgt (die von der hinterlegten -> Grammatik nicht erkannt wird)


O - OCR bis Outbound Calling

OCR
Optical Character Recognition - Optische Zeichenerkennung bzw. Texterkennung - ist die automatische Erkennung gedruckter Zeichen. Erste OCR-Anwendungen gab es bereits in den 1960er Jahren. Damals konnten allerdings nur speziell für die automatische Erkennung entworfene Schriftarten erkannt werden. Mittlerweile arbeiten OCR-Systeme schriftenunabhängig und mit großer Genauigkeit.
Die Erkennung gedruckter Zeichen besteht aus folgenden Schritten: Scannen, Layout-Analyse, Segmentierung, Zeichenerkennung und Wörterbuchabgleich.
-> Handschrifterkennung
ODBC
Open Data Base Connectivity ist ein Standard für den Zugang zu verschiedenen Datanbanksystemen. Es gibt Schnittstellen für "Visual Basic", "Visual C++", "SQL", zudem umfasst das ODBC Driver-Paket Treiber für Access-, Paradox-, dBase-, Text-, Excel- und Btrieve-Datenbanken
OEM
Original Equipment Manufacturer
Off-Peak-Hours
Die Stunden mit dem geringsten Anrufaufkommen (vgl. -> Peak)
Open-Source-Software
Bei Open-Source-Software handelt es sich um Software mit öffentlich zugänglichem Quellcode (in einer für den Menschen lesbaren und verständlichen Form), bei der durch eine entsprechende Lizenzierung die öffentliche Weiterentwicklung gefördert wird. Open-Source-Software kann in der Regel für beliebige Zwecke und ohne Limitierungen kopiert, verbreitet und genutzt werden. Die Verwaltung und Koordination von Open-Source-Softwareprojekten findet über eine zentrale Instanz statt (meist Projektgründer).
Operator-Unterstützung
Eine Hilfestellung durch einen (menschlichen) Operator ist dann möglich, wenn der Anrufer sich direkt aus der Sprachapplikation bei Bedarf mit einem Menschen verbinden lassen kann
OpEx
Operating Expenditure sind die Kosten für Betrieb und Wartung einer IT-Infrastruktur -> CapEx -> ImpEx
O-Töne
hier: Aufnahme und originalgetreue Wiedergabe von telefonischen Nachrichten, z.B. die besten Witze oder Zuschauersprüche
Outbound Calling
Telefonmarketing, abgehende Calls - im Gegensatz zu -> Inbound Calls, eingehende Calls


P - PABX bis Push-Dienste

PABX
Private Automated Branch Exchange ist ein automatisches Telefon-Umschaltsystem in einem privaten Betrieb. Ursprünglich benötigten diese sogenannten -> Private Branch Exchange (PBX)-Systeme einen menschlichen Operator. Seit fast alle -> PBX-Systeme automatisch funktionieren, meint die Abkürzung PBX normalerweise PABX-Anlagen
Packaged Solutions
Packaged Solutions sind Standardlösungen, die aus vorgegebenen Einzelmodulen „zusammengeschnürte“ Softwarebündel darstellen.
Die meisten Sprachanwendungen wickeln Prozesse oder Business-Logiken ab, die auch an anderer Stelle zum Einsatz kommen: So fragen sie Postleitzahlen ab, nehmen Kontonummern auf oder erfassen Straßennahmen. Diese Prozesse werden von Modulen innerhalb des Gesamtsystems durchgeführt, die die Grammatik, die Prompts und die Dialogführung für den behandelten Prozess beinhalten und so in eine Anwendung integriert werden, wie sie das betreibende Unternehmen benötigt. Für den Anrufer auf einem solchen System ist nicht zu erkennen, dass er in einer bestimmten Dialogphase ein eigenständiges Modul bedient; er empfindet die Anwendung als monolitisch.
Eine Wiederverwendung von Anwendungsmodulen, die für eine bestimmte Aufgabe entwickelt wurden, trägt natürlich dazu bei, dass das „Rad nicht immer wieder neu erfunden“ werden muss, sie spart Entwicklungsaufwand und Kosten und schafft einen höheren Reifegrad und eine robustere Performance, da bereits entwickelte und im Betrieb optimierte Module den Debuggingaufwand reduzieren und etsprechend höhere Betriebssicherheit bieten.
Eine Packaged Solution ist meist plattformunabhängig, bietet zusätzliche Konfigurationsmöglichkeiten, ist standardkompatibel und beinhaltet das Voice User Interface.
Parser
Programm welches Texte syntaktisch analysiert und für die weitere Verarbeitung aufbearbeitet
Password Reset
ist das Zurücksetzen bzw. die Neuvergabe von Passworten
pay as you go
Man bezahlt nur die tatsächlich in Anspruch genommenen Dienstleistungen
PBX
-> PABX
Peak
Englische Bezeichnung für Spitzen bzw. Spitzenwerte. In einem Call Center wird das maximale Anrufaufkommen innerhalb eines bestimmten Zeitintervalls Peak genannt
Persona
Die Persona – der "Charakter" oder die "Persönlichkeit" – einer Sprachapplikation könnte als "die Stimme des Systems" beschrieben werden. Anrufer können allein anhand der Stimme genaue Schätzungen über soziale Parameter machen. Die Auswahl eines bestimmten Sprachtalents und die Beschreibung der sozialen Eigenschaften und des Lebenstiles der Persona sind daher nötig, um ein konsistentes Design auch im Hinblick auf die "Corporate Identity" zu ermöglichen
Personal Assistant
-> Virtual Assistant
Personal Information Management
Organisation der persönlichen Aufgaben, Arbeiten und Kontakte durch Einsatz von unterschiedlichen Kommunikationskanälen (eMail, Telefon), Kalender und Adressbuch. Anwendungen im Bereich Personal Information Management können zum Beispiel in die Ressourcenplanung integriert werden, um Mitarbeitern neue Aufgaben, Projekte und Termine mitzuteilen
Personalisierung
Personalisierungsfunktionen sind zum Beispiel dann gegeben, wenn man den Sprachdialog der Anwendung individuell gestalten kann, z.B. mit -> Shortcuts oder -> Hotlinks für -> Power User oder mit zuvor gespeicherten Konto-Informationen z.B. bei -> Telebanking-Anwendungen
Phoneme
Phoneme sind die kleinsten bedeutungsunterscheidenden Lauteinheiten einer Sprache.
Pick-by-Voice
… bezeichnet ein Kommissionierverfahren in der Logistik, bei dem der Kommissionierer über ein -> Sprachdialogsystem in direktem Kontakt zum Kommissioniersystem (Organisationssystem, das den Prozess der Kommissionierung steuert und kontrolliert) steht.

Beim Kommissionieren (Picking) entnimmt der Lagermitarbeiter gemäß seinem Auftrag Artikel aus dem (Gesamt-)Sortiment und stellt diese zu einer Lieferung zusammen. Der Kommissionierer trägt dabei ein Handheld-Terminal mit Headset bei sich, über das das Kommissioniersystem den Entnahmeprozess unmittelbar per Sprachmitteilung vorgibt. Die Abwicklung des Auftrages kann der Kommissionierer dann ebenfalls per Sprache protokollieren, so dass die gesamte Abwicklung inklusive der Aktualisierung des Warenbestandes beleglos und in Echtzeit nachgeführt wird.

Die Vorteile des Pick-by-Voice liegen zunächst in der „Hands-free, eyes-free“ Arbeitsweise des Kommissionierers. Er hat Hände und Augen frei für seine eigentliche Aufgabe, die physische Entnahme der Artikel, anstatt sie für die Bedienung eines Handgerätes einzusetzen. Pick-by-Voice erleichtert zudem den Informationsaustausch zwischen Kommissionierer und Kommissioniersystem. Notwendige Fragen über die Abwicklung von Aufträgen, das Suchen, Entnehmen und Befüllen von Artikeln können jederzeit gestellt und beantwortet werden. Leerlauf- und Wartezeiten reduzieren sich, die Kommissionierleistung steigt und Fehler durch inkorrekte Auftragszettel werden vermieden.
PIM - Service
-> Personal Information Management
PIN
engl. Personal Identification Number: Authentifizierungscode
Plan and Build
-> Process Outsourcing
Plattform Hosting & Content Billing
ist die skalierbare Bereitstellung von -> Ports (Sprachverarbeitung und -erkennung) mit Zugang zum Netz eines oder mehrer Netzbetreiber und der Möglichkeit, die Nutzung verbrauchsgerecht abzurechnen
Plug & Play
ist ein Industriestandard, der die Installations- und Konfigurationsaufgaben ohne Eingreifen des Anwenders selbsttätig löst. Bedeutet laut Brockhaus: "anschließen und loslegen"
Points of Information
hier: Zentrale Anlaufpunkte zur interaktiven Informationsauskunft
POP3
Post Office Protocol Version 3 (POP3) ist ein Protokoll zum Empfangen von eMails über das Internet. Nachrichten werden in einer Art "Briefkasten" zwischengespeichert, bis der Empfänger, der sich durch ein Passwort ausweisen muss, sie abholt
Port
Ressource, die zur Verarbeitung eines Anrufs benötigt wird. Ein System mit 30 Ports kann 30 gleichzeitige Anrufe verarbeiten
Power User
ist ein User, der eine Applikation häufig nutzt und weiss, welche Befehle (-> Shortcuts) schnell zum Ziel führen
Predictive Dialing
kommt zum Einsatz beim -> Outbound Calling, wo ein System den Verbindungs­aufbau im voraus plant, indem es mit Hilfe statistischer Modelle auf Basis des Anrufaufkommens die Zahl der aufzubauenden Verbindungen ermittelt. Ziel ist, Leerlaufzeiten bei den Call Center-Agenten zu minimieren
Prepaid Kunden
Diese Kunden entrichten vor der ersten Transaktion eine Vorauszahlung, die dann für Zahlungen verwendet werden kann
Prerecorded Voice Files
bezeichnen Dateien, die aufgezeichnete Sprach-Antworten enthalten. Diese Antworten wurden von Sprechern oder Sprecherinnen vorgelesen und aufgezeichnet und werden im Dialog von der Sprachapplikation an der entsprechenden Stelle eingespielt. Beim Einsatz dieser Technik für die Sprachapplikation ergibt sich allerdings nur eine begrenzte Anzahl von Möglichkeiten, auf den Anrufer einzugehen
Process Outsourcing
ist die Komplett-Dienstleistungen eines Lösungsanbieters, der die kundengetriebene Entwicklung von Sprachapplikationen („Plan and Build“), Betrieb und Wartung bis hin zur Übernahme der Sprachdialogplattform und der über sie gemanagten Leistungsprozesse („Run and Maintain“) umfasst und bis hin zur Rückübereignung der Sprachdialogplattform an den Betreiber und der Abrechnung der Leistung nach gemanagten Leistungsprozessen („process outsourcing“) gehen kann
Professional Services
hier: alle Beratungs- und kundenspezifischen Systemintegrationsleistungen
Prompt
Gesprochene Maschinenausgabe, die dem Benutzer signalisiert, dass er seine Eingabe machen kann. Bei Eingabeaufforderungen handelt es sich um Hinweise, durch die der Benutzer dazu veranlasst wird, zu sprechen oder eine Eingabe zu machen. Sie können auch Informationen darüber enthalten, welche Eingabe bei diesen Zuständen zulässig ist. Es gibt bestimmte Arten von Eingabeaufforderungen, die gesondert behandelt werden: Anweisungen – Informationen zu Funktionen der Applikation. Hilfe – Ein separater Zustand zur Unterstützung des Benutzers. Feedback – Informationen für den Benutzer zum Zustand eines direkt folgenden Ereignisses. -> Dialogzustand
Prosodik
auch Prosodie: Gesamtheit sprachlicher Eigenschaften wie Akzent, Intonation, Quantität und Sprechpausen. Sie beziehen sich im allgemeinen auf Einheiten, die größer sind als ein einzelnes -> Phonem. Zur Prosodie zählt auch die Untersuchung von Sprechgeschwindigkeit, Rhythmus und Sprechpausen
Prototyping
-> Rapid Prototyping
PSTN
Private Switch Telephone Network. Das öffentliche Telefonnetzwerk
Push - Dienste
sind Dienste, bei denen der Diensteanbieter einem Kunden, der dafür vorher sein Einverständnis gegeben haben muss, aktiv Daten (per eMail oder SMS) schicken kann, ohne dass dieser eine Abfrage starten muss


Q - Qualität der Spracherkennung bis Quittierung  

Qualität der Spracherkennung
Darunter ist die Sprecherunabhängigkeit, die Geräuschtoleranz, sowie die Anzahl der erkannten Worte zu verstehen
Quittierung
implizit: Quittierung ohne Nennung der Eingabe ("Vielen Dank für Ihre Eingabe")
explizit: Quittierung durch erneute Nennung der Eingabe ("Sie haben XY gesagt, ist das richtig?")


R - Randomised Prompting bis Run and Maintain

Randomised Prompting
ist die z.B. im -> Errorhandling eingesetzte Methode, bei sich wiederholenden -> Prompts wechselnde Formulierungen zu verwenden.
Rapid Prototyping
ist ein Verfahren und eine Methode zur schnellen Herstellung von Modellen und Grundtypen. Der Begriff stammt eigentlich aus der industriellen Fertigung mit CAD-Systemen
Rate Shopper
Schnäppchenjäger
RCI
Mit Hilfe des Routing Configuration Interface können professionelle Anwender ihre vorhandene Callcenter-Technik zur Steuerung des Intelligenten Netzes nutzen
Reprompting
ist die (ggf. mehrfache) Wiederholung des gleichen -> Prompts bei fehlerhafter Eingabe
Revenue Sharing
Gewinnbeteiligung
ROI - Treiber
nennt man die Faktoren, die maßgeblich die Amortisierungsdauer beeinflussen. ROI steht für Return On Investment
Run and Maintain
-> Process Outsourcing


S - S0 bis Synonym  

S0
Standardisierte Teilnehmeranschlussschnittstelle für den ISDN-Basisanschluss der Telekom mit 2 Basis-Kanälen
S2M
Schnittstelle für ISDN-Primärmultiplexanschluß, stellt 30 Basis-Kanäle mit jeweils 64 Kbit/s und einen D-Kanal mit 64 Kbit/s zur Verfügung
SALT
Speech Application Language Tags ist eine Markup-Sprache mit der Aufgabe, multimodale Interaktionen zu unterstützen. SALT wurde durch das SALT-Forum (www.salt-forum.org) spezifiziert, einem Industriekonsortium, das im Oktober 2001 gegründet wurde. Das Forum hat sich zur Aufgabe gesetzt, Standards für sprachaktiviertes -> HTML und XHTML zu entwickeln. SALT wird möglicherweise auch einen Beitrag zur Arbeit des -> W3C in Bezug auf die multimodale Interaktion leisten
SAPI
Microsoft Speech Application Programming Interface ist ein Set von Befehlen, Routinen und Protokollen, das Programmierern erlaubt, sprachgesteuerte Applikationen für Microsoft Windows-Plattformen zu entwickeln
Say Anything
Ein Nuance-spezifischer Ausdruck für eine Technologie, bei der stochastische Sprachmodelle für die Anrufweitervermittlung genutzt werden bzw. ein NLU-System, das auch auf stark variierende Eingaben zu reagieren vermag
Selbstbeschreibungsfähigkeit
Selbstbeschreibungsfähigkeit ist ein Gestaltungskriterium für die ergonomische Gestaltung von Benutzeroberflächen. Die Berücksichtigung dieses Grundsatzes der Dialoggestaltung im User-Interface-Design soll die intuitive Bedienbarkeit durch den Nutzer fördern. Das Kriterium gilt als erfüllt, wenn für den Nutzer jederzeit offensichtlich ist, an welcher Stelle er sich befindet, welche Aktionen unternommen, wie diese ausgeführt werden können und wenn zum jeweiligen Dialogschritt Hilfe verfügbar ist.
Selbstbeschreibungsfähigkeit wird in der DIN-ISO 9241-110 Norm definiert: Ein Dialog ist selbstbeschreibungsfähig, wenn jeder einzelne Dialogschritt durch Rückmeldung des Dialogsystems unmittelbar verständlich ist oder dem Benutzer auf Anfrage erklärt wird.
Self Service-Sprachapplikationen
ist die Kundenselbstverwaltung mittels Sprachdialogsystem
serielle Schnittstelle
nennt man die PC-Schnittstelle, bei der die zu übertragenden Daten im "bitseriellen" Format übertragen werden, so dass lediglich ein Sende- und ein Empfangskanal notwendig ist
Server
Ein Rechner innerhalb eines Netzwerkes, der spezielle Aufgaben übernimmt und auf den andere Rechner im Netzwerk zugreifen (z.B. dient in einem Unternehmen oft ein "File Server" als zentrale Datenbank)
Server basiert
nennt man eine Anwendung, wenn sie wie eine Datenbank oder eine Organisationsanwendung, basierend auf Internet oder Intranet, authorisierten Nutzern Zugriff bietet
Service Automation
Automatisierung eines kompletten Service-Prozesses oder eines Teilprozesses. Meist bezieht sich der Begriff auf Automatisierungen an der Kunden-Schnittstelle, den sogenenannten "Touchpoints" - z.B. mithilfe von Web-Technologie oder Sprachdialogsystemen. Durch Service-Automatisierung ergeben sich langfristig gesehen mitunter hohe Einsparpotentiale. Zugleich kann, bei kundengerechter Gestaltung der Automatisierung, die Service-Qualität gesteigert werden.
Service Blueprint
Um Dienstleistungsprozesse visuell darzustellen, transparent zu machen, zu analysieren und zu optimieren wird beim Service-Design auf das Werkzeug des Service Blueprinting (deutsch etwa: "Dienstleistungs-Blaupause") zurückgegriffen.
Dabei wird der Service mit all seinen Arbeitsabläufen in Form eines Ablaufdiagramms beschrieben. Mit einem Service Blueprint lässt sich sowohl die Sicht des Kunden auf den Prozess als auch die Sichtweise des Anbieters darstellen.
Der Service Blueprint wird v.a. bei der detaillierten Gestaltung von innovativen Dienstleistungsprozessen eingesetzt, mit dem Ziel der Verbesserung der Kundenzufriedenheit und einer Erhöhung von Effektivität und Effizienz des Dienstleistungsprozesses
Service Design
Service Design ist der Prozess zur Gestaltung von Dienstleistungen, bei dem Methoden aus dem User Experience Design zum Einsatz kommen. Im Mittelpunkt des Design-Prozesses steht dabei immer der Nutzer bzw. der Kunde. Wichtige Kernbestandteile des Service Designs sind eine gründliche Nutzeranalyse und die ggf. mehrfach durchgeführte Evaluation von Service-Prototypen.
Service-Grad
Im Englischen als »Grade of Service« (GOS) bezeichnet. Der Service-Grad eines Call Centers gibt die Wahrscheinlichkeit an, mit der der Anrufer bei starker Auslastung des Call Centers ein Besetztzeichen hört. Der Service-Grad wird als Dezimalzahl ausgedrückt. Ein Service-Grad von p = 0,01 beispielsweise indiziert, daß ein Prozent der Anrufer auf ein Besetztzeichen trifft
Service-Level
Bezeichnung für den Parameter, der die persönliche Erreichbarkeit eines Call Centers mißt. Der Service-Level setzt sich aus zwei Faktoren zusammen: dem prozentualen Anteil von Anrufern, die einen Call Center-Mitarbeiter persönlich erreichen, und einem Zeitintervall – normalerweise in Sekunden gemessen – in dem diese Anrufe persönlich entgegengenommen werden. So impliziert ein Service-Level von 90/20, daß 90 Prozent der eingehenden Anrufe innerhalb von höchstens 20 Sekunden entgegengenommen werden
Service Provisioning-System
Unter Service Provisioning werden alle Bereitstellungsaufgaben zusammengefasst, die zur technischen Einrichtung eines Dienstes und des Zugangs für seine Benutzer erforderlich sind. Dazu zählt unter anderem die Bereitstellung der entsprechenden Geräte, eines Netzwerkes und der Nutzerdaten
Service Touch-Point
Der Service Touch-Point (STP) ist die Schnittstelle zwischen Kunde und Unternehmen. STPs treten in verschiedensten Formen auf, z.B. als Service-Agent, Web-Interface, IVR, Anschreiben oder Rechnung. Weil STPs entscheidend zum Service-Erlebnis des Kunden beitragen, müssen sie konsistent und exakt designed werden. Das Standard-Messverfahren SERVQUAL sieht STPs als eine von fünf Haupt-Dimensionen der Service-Qualität vor.
Session
engl. für Sitzung - ist eine Verbindung zwischen Anrufer und Sprachplattform
SFA Application
Sales Force Automation-Anwendungen dienen der Automatisierung der Verkaufsabwicklungen von Vertretern, unterstützt von einer sprachgesteuerten Datenbank
Shortcuts
auch -> Hotlinks genannt. Ermöglichen dem Anrufer einen schnellen Zugriff per ausgewähltem Sprachbefehl (z.B. "weiter" oder "hilfe" oder "gehe zu...")
SIP
Session Initiation Protocol. Ein IP Telefonie Protocol. Alternative zu H.323 / VoIP protocol.
Skill Based Routing
Funktion einer -> ACD-Anlage, bei der die eingehenden Anrufe an bestimmte Agents bzw. Mitarbeitergruppen - basierend auf dem jeweiligen Know-how (Sprachkenntnisse, Spezialisierung auf bestimmte Themen) der Mitarbeiter - verteilt werden.
Slot
Bei Sprachdialogsystemen eingesetztes Modell, bei dem bestimmte Schlüsselworte in einem Slot zusammengefasst werden, so dass diese Begriffe leichter als miteinander in Kontext stehend erkannt werden (z.B. im Telebanking: Name, Kontonummer, Betrag)
SMS Notifikation
SMS-Benachrichtung
Social Media Monitoring
Unter Social-Media-Monitoring (Beobachtung Sozialer Medien) wird die Identifikation, Beobachtung und Analyse von benutzergenerierten Inhalten in sozialen Netzwerken zu Marktforschungszwecken verstanden. Im Unterschied zum Webmonitoring wird beim Social-Media-Monitoring nur User Generated Content ausgewertet. Kommerzielle Berichte oder News werden nicht berücksichtigt.
Im Bereich des professionellen Social-Media-Monitorings bedienen sich die Unternehmen bei der Identifikation und Analyse verschiedener Methoden: Beim automatischen Monitoring werden Inhalte mit Hilfe einer Software identifiziert und semantisch analysiert. Beim halbautomatischen Montoring werden die unterschiedlichen Quellen per Software zunächst automatisch zur Verfügung gestellt und im Anschluss mit Hilfe von Experten, die relevante Suchanfragen erstellen, analysiert und ausgewertet. Mittlerweile haben sich zahlreiche Dienstleister auf Social-Media-Monitoring spezialisiert und für den professionellen wie privaten Gebrauch steht eine Vielzahl von Tools zum Social-Media-Monitoring bereit.
Soft IVR
Soft steht hier für Software: Soft IVRs basieren auf Standard-Industrie-PCs und entsprechenden Telefonie-Boards der gängigen Hersteller
SP
Abkürzung für -> Speech Platform
Speaker Verification
Erkennung des Sprecher anhand eines biometrischen Sprachabgleiches -> Voice Biometrics oder -> Authentifizierung
Speech2Text
Ursprünglich als Synonym für Spracherkennung (ASR) gebraucht, bedeutet Speech2Text heute allgemein die Verschriftung längerer, gesprochener Textpassagen. Dabei beschränkt sich der Gebrauch des Begriffs auf spezielle Anwendungsbereiche wie die Verschriftung von Sprachnachrichten, von Gesprächen zwischen Menschen oder von ähnlichen "natürlichen" Sprechsituationen. Eher ungebräuchlich ist "Speech2Text" in Verbindung mit Dialog- und klassischen Diktiersystemen. Unklarheit besteht darüber, ob "Speech2Text" lediglich eine vollautomatische Verschriftung bezeichnet oder auch im Rahmen einer teilautomatisierten oder vollkommen manuellen Verarbeitung gebraucht werden kann.
Speech Analytics
... beschreibt eine Methode zur automatischen Generierung von Informationen aus gesprochener Sprache und zwar sowohl über den Inhalt als auch über die beteiligten Sprecher. Speech Analytics verwenden Spracherkennungstechnologie, um Konversationen zu strukturieren, implizite Bedürfnisse bzw. Belange aufzuspüren und so Erkenntnisse über die Ursachen von Anrufen zu generieren.

Speech Analytics erfassen Konversationen mit Kunden und transformieren diese in Metadaten. Dazu werden die gesprochenen Inhalte erfasst, transkribiert und indiziert, damit sie anschließend nach bestimmten Informationen analysiert werden können (z.B. Schlüsselworte, Phrasen, Kontexte). Viele Informationen, die Unternehmen aus Kundeninteraktionen gewinnen könnten, bleiben meist unberücksichtigt, da den Agenten entsprechende Prozesse zur Erfassung und Weitergabe fehlen. Speech Analytics bieten hier die Möglichkeit, die Vorteile von Anruf-Nachbereitungssystemen mit dem Erkenntnisgewinn moderner CRM-Applikationen zu verbinden und die Business Intelligence zu maximieren.

Die Analyse der Gesprächsprotokolle bietet sich an, wenn ein Unternehmen mehr über die eigenen Produkte, den Wettbewerb und das Marketing erfahren möchte – aus den Äußerungen der Kunden lassen sich wertvolle Rückschlüsse für die Produktentwicklung ebenso wie für das Marketing ziehen. Zudem kann durch die Analyse der Häufigkeit bestimmter Worte auf die Zufriedenheit oder den Verärgerungsgrad der Anrufer geschlossen werden.
Speech Platform
bezeichnet ein System, auf dem Sprachapplikationen bereit gestellt werden. Mit Schnittstelle für Programmiersprachen wie z.B. -> VoiceXML oder -> SALT. Anbieter von Speech Platforms sind z.B. Comverse, IBM, Genesys, HP, Nuance, VoiceGenie und andere
Speech Recognition
engl. für Spracherkennung. Technologie für die Umwandlung von Sprachsignalen in Text (vgl. -> ASR)
Speech Spot
ist ein Werbespot, der audiophon auf einem Sprachdienst läuft
Sprachapplikation
ist eine Applikation, die in Dialogen und Interaktionen auf eine bestimmte Aufgabe oder bestimmte Arbeitsabläufe abzielt. Die Interaktion zwischen Benutzer und System erfolgt dabei i.d.R. über das Telefon. Ein solches System nutzt Spracherkennung für das "Verstehen" der Instruktionen des Benutzers. Sprachapplikationen benötigen ein bestimmtes Dialogdesign für die effiziente Interaktion über ein -> VUI
Sprachdialogsystem
... ist ein automatisierter Telefondienst, bei dem Anrufer mit ihrer natürlichen Sprache mit einem, heute meist netzbasierten, Computersystem interagieren können. Das Sprachdialogsystem besteht je nach Komplexität aus verschiedenen Komponenten und kann zudem in weitere Systeme eingebunden sein (Geschäftsprogramme, Backend-Anwendungen, etc.). Die grundlegenden Systemkomponenten sind eine Telefonieplattform – die notwendige Infrastruktur zur Abwicklung von Telefonaten, ein Spracherkenner - quasi der Übersetzer von menschlicher Sprache in Maschinensprache und umgekehrt (-> ASR, -> TTS), die Sprachapplikation – eine Anwendung, die Dialoge und Interaktionen auf eine bestimmte Aufgabe oder bestimmte Arbeitsabläufe bearbeitet, sowie ein Voice User Interface (-> VUI) - die Schnittstelle des Anwenders zum Sprachdialogsystem.

Dank der Fortschritte bei Spracherkennungstechnologie finden Sprachdialogsysteme heute Anwendung in vielerlei Bereichen. Zusammenfassend lassen sie sich jedoch in zwei Kategorien einteilen. Voice Automation (-> Voice Automatisierung) bezeichnet Sprachdialogsysteme als Unternehmens-Dienst mit Fokus auf (Service)-Automatisierung als wesentlichem Treiber: Sie dienen als Zugang zu Customer Service Leistungen, internen Auskunfts- und Vermittlungsdiensten und der -> Workflow-Automatisierung. -> Voice Business dagegen meint Sprachdialogsysteme als -> Mehrwertdienst mit dem Fokus auf Umsatz und Kundenwert. Sie dienen hier als Zugang zu Bezahldiensten, der Produktdifferenzierung und Neukundengewinnung.

Ihre Vorteile sind vor allem die ständige Verfügbarkeit und Erreichbarkeit (24/7-Dienste), ihre kontrollierte Steuerung und Einbindung in Geschäftsprozesse sowie ihre geringen Kosten im Vergleich zu Call Center Agenten.
Sprachbiometrie
-> Voice Biometrics
Sprachportale
Sprachportale ähneln den Web-Portalen und bieten dem Anrufer unter einer Telefonnummer eine größere Auswahl an Sprachapplikationen. Sprachportale sind anfangs weitestgehend auf einen Zweck ausgerichtet, der seine Stärke in der Informationsbandbreite hat: Sprachportale bieten synergetische Informationsdienste und Commerce-Anwendungen. Dabei stehen die Aspekte Unterhaltung, Service und persönliches Zeitmanagement im Vordergrund
Sprachsynthese (Text to Speech, TTS)
erfolgen die Antworten über Sprachsynthesesoftware, beziehungsweise durch Text to Speech, können auch nicht vorgegebene Inhalte wiedergegeben werden. Zum Beispiel kommt diese Technik zum Einsatz, wenn es sich um Abfragen aus großen Datenbanken handelt. Die Ergebnisse der Abfrage werden dann von der Sprachsynthesesoftware vorgelesen. Ein Einsatz von -> Prerecorded Voice Files ist in diesem Fall nicht möglich, da dies nicht nur zu aufwendig wäre, sondern auch weil der Inhalt der Datenbanken sich ständig ändert
sprecherabhängig
reagieren Spracherkenner, die die gesprochenen Eingaben eines bestimmten Benutzers erkennen, auf den sie "trainiert" wurden. Der Benutzer muss Wörter und Ausdrücke im Allgemeinen mehrmals wiederholen, damit das System sie lernt. Typische sprecherabhängige Anwendungen sind das sprachgesteuerte Wählen bei modernen Mobiltelefonen und bestimmte Diktiersoftware für PCs
sprecherunabhängig
verhalten sich Spracherkenner, deren Vokabular von jeder beliebigen Person ohne Training verwendet werden kann. Es gibt drei Arten: Einzelworterkenner, kon­tinuier­liche Spracherkenner und Phonem basierte Spracherkennung
Sprecherverifikation
Ein System zur Überprüfung der Identität eines Anrufers auf der Grundlage der charakteristischen Merkmale seiner Sprache -> Verifier -> Voice Print
SQL
Structured Query Language (SQL) ist eine "strukturierte" Abfragesprache für relationale Datenbanken
SRGS
Speech Recognition Grammar Specification. Vorschlag des -> W3C für die Spezifikation von -> Grammatiken. Die SRGS betrifft sowohl -> DTMF als auch Sprachsteuerung und damit die Programmiersprachen -> VoiceXML und -> SALT
SS7
Signalling System No. 7 (SS7), auch CCSS7 (Common Channel Signalling System No. 7) genannt. CCSS 7 ist das zentrale Zeicheneingabesystem für den Einsatz in digitalen Netzen und wird z.B. zur "Signalisierung" im ISDN genutzt
SSML
Speech Synthesis Markup Language. Ist eine XML-Sprache welche die Art der Sprachsynthese bestimmt (darunter auch -> Prosodik und Betonung [-> Emphasis])
Stand Alone IVR-Lösungen
sind eigenständige, oft auch proprietäre IVR-Lösungen, bei der alle notwendigen Komponenten zu einem Gesamtsystem zusammengefasst sind und die nicht in die TK-Infrastruktur integriert sind
Standardanwendungen
Unter Standardanwendungen versteht man vorgefertigte, per Web-Interface konfigurierbare, Plattform unabhängige, out-of-the-box-Sprachanwendungen mit einem integrierten Voice User Interface, die üblicherweise als Hosted Solution von Unternehmen bei einem Voice Hosting Provider „angemietet“ werden. Beispiele sind PIN/Password Reset, Bezahlmodule oder die Anlage von Stammdaten.
Diese modular aufgebauten Standardanwendungen bringen für Unternehmen eine massive Senkung der Entwicklungskosten (hierunter fällt bei Standardanwendungen z.B. die Anpassungen der Dialoge oder der Weiterleitungsziele) und der Time-to-Market. Dafür sind Sie aber auch starr und haben einen begrenzten Funktionalitätsumfang. Unternehmen, die Standardanwendungen nutzen, gehen daher einen Kompromiss bezüglich niedrigerer Flexibilität der Anwendungen und der Möglichkeit, eine günstige Anwendung für einen bestimmten Zweck nutzen zu können, ein.
S.T.E.P Online - Speech Technology Enhancement Programme
Begriff der Woche: S.T.E.P Online - Speech Technology Enhancement Programme

Die S.T.E.P Online Anwendung ist ein Tool, mit dem Nuance in Zusammenarbeit mit Kunden bzw. Interessenten die geeignete Sprachstrategie identifiziert. S.T.E.P Online führt den Kunden durch ein erprobtes Speech Strategy Framework, das für jeden Kunden angepasst und individuell ist. Gründend auf über 200 Anwendungsidentifizierungen, 230 ROI Berechnungen und mehr als 50 Markttreiber-Programmen bündelt S.T.E.P. Online strategische Erkenntnisse aus vier Jahren Sprachanwendungsentwicklung und packt diese Erkenntnisse in ein branchenspezifisches online Tool, das es Unternehmen leicht macht, zur Sprachautomatisierung geeignete Prozesse zu analysieren und zu identifizieren.

S.T.E.P. Online liefert:
· Top Anwendungen aus über 30 Branchen und Anwendungserfahrungen mit Relevanz für Ihre Branche
· Belastbare User Interface Design Best Practice, inclusive diverser Audio Demonstrationen
· Benchmark-Vergleiche zwischen Ihrem Contact Center und dem Branchendurchschnitt
· Einen Speech Report, der das Framework für eine Roadmap zu Ihrer Sprachapplikation darstellt

S.T.E.P. Online Vorgehensweise:
Teilnehmer:
· Verantwortliche aus den Abteilungen Call Center, IT, Web, Marketing Manager des Sprachprojekts und/oder Business-Entscheider. Typische Teilnehmer sind Verantwortliche oder Direktoren/Geschäftsführer.
Prozess Aufbau:
· Der Kunde benennt Projektteilnehmer
· Nuance richtet das maßgeschneiderte S.T.E.P. Online Tool ein
· Alle Projektteilnehmer erhalten Ihre Zugangscodes und können an allen Dokumenten arbeiten
Anwendungsidentifizierung:
· Workshop mit Nuance und den Projektbeteiligten des Kunden zur Faktenerhebung
· Eingabe der Informationen in das online Tool
Informationskomplettierung:
· Das Kundenteam vervollständigt die Infos, die bei dem Workshop nicht verfügbar waren
· Die Daten werden abgeschickt und der erste Speech Report generiert
· Nuance erstellt den finalen Speech Report
· Bei einem weiteren face-to-face Meeting wird der Speech Report präsentiert und seine Schlussfolgerungen und Empfehlungen werden diskutiert

Die S.T.E.P. Online Services werden kostenlos und unverbindlich angeboten!
... mehr
Stock Quote
Kursinformationen von Börsenwerten
Story Board
legt den Einsatz einzelner Dialog-Funktionen fest wie "Psychologisches Prompting" (etwa der gezielte Einsatz von Pausen), -> Random Prompting (zufällig wechselnde Texte mit gleichem Inhalt), -> Konkatenation von Text-Schnipseln, "Inkrementelles Prompting" (je nach erwartetem Anrufer beginnend mit wenig Information, die nach und nach ansteigt oder eben anders herum) etc.
Synonym
Ein Wort, das trotz unterschiedlicher Benennung mit einem anderen Wort die gleiche Bedeutung hat (z.B. Arzt vs. Mediziner)


T - TAPI bis Turn taking

TAPI
Telephony Application Programming Interface ist die Programmier-Schnittstelle von Microsoft für PC-Telefon-Anwendungen: Für DFÜ über Modem sowie zur Nutzung verschiedener -> ISDN-Leistungsmerkmale
Tastaturwahl
-> DTMF
TCO
mit Total Cost of Ownership bezeichnet man eine Kennzahl, die Auskunft über die kompletten Kosten einer Lösung für den Zeitraum ihres Einsatzes gibt, also inklusive Kosten für Hardware, Software, Implemetierung, Integration, Wartung, notwendige Upgrades, aber auch Training der Mitarbeiter, Support und ggf Entsorgung.
TCP/IP
Transmission Control Protocol/Internet Protocol ist die Standard-Anbindung an das Internet. Es handelt sich hierbei nicht um ein einzelnes Protokoll, sondern um eine Ansammlung von Protokollen, die im Verbund die gesamte Funktionalität des Internets zur Verfügung stellen
Telefon Banking
Bezeichnung für Bankgeschäfte die über das Telefon abgewickelt werden (z.B. Kontostandsabfrage, Überweisungen ausführen, Daueraufträge einrichten)
Telefon Brokerage
ist die Abwicklung von Börsengeschäften über das Telefon. Der Service umfasst z.B. Kursinformation, Wertpapierkäufe und -verkäufe, Orderauskünfte und Orderstatus, Zeichnungen, Orderänderungen und -streichungen, Depotauskünfte
Teleshopping
Einkaufen am Fernseher: In einer speziellen Sendung dargebotene Produkte können telefonisch bestellt werden und gehen postalisch dem Käufer zu. Auch Home Shopping genannt
Televoting
nennt man Abstimmungen via Telefon oder SMS
Third Party Content
Inhalte dritter Anbieter
TIM
Telephone Interface Manager
Timeout Interval
wird auch Recognition Timeout genannt: bezeichnet ein Zeit-Interval nach der Eingabeaufforderung, in der ein Sprachsignal erwartet wird. Wenn in diesem Zeitraum keine Eingabe erfolgt, meldet das System einen -> No Input Zustand
TK
Abkürzung für Telekommunikation
Touch Tone
-> DTMF oder -> Tastaturwahl
Transaction Completion Rate
gibt den Wert der automatisiert erfolgreich abgewickelten und zu Ende gebrachten Gespräche und Transaktionen an
Transaktionssystem
ermöglicht das Auslösen von Transaktionen (Bestellen, Makeln, Reservieren) durch Sprachbefehle
Triple Play
nennt man geschäftliche Strategien, die auf drei Säulen gründen
TTS
engl. Text-to-Speech, -> Sprachsynthese
Turn taking
beschreibt den Sprecherwechsel in einem Gespräch/Dialog. Im Bereich der Sprachdialogsysteme signalisieren sowohl System als auch Sprecher durch z.B. eine Pause oder ein Rückversicherungssignal (nicht wahr? stimmts?), dass dem Partner nun ein Turn angeboten wird, bei dem er eine Eingabe oder die Initiative im Gespräch übernehmen kann/soll.


U - Unified Communications bis Utterance  

Unified Communications
sind Bündel aus Sprachportal, Applikationen, Intelligentem Netz und TK-Diensten, die es dem Anwender unabhängig von verwendeten Endgeräten (Laptop, Handy, Festnetztelefon etc.) oder Kommunikationsformen (Text, Sprache, Grafik) über eine einzelne Schnittstelle ermöglichen, Ordnung in das Nummern- und Gerätechaos des heutigen Geschäftslebens zu bringen.
Eine Schlüsselstellung nehmen bei diesen Bestrebungen Voice Portale ein, die eine Directory Assitance bieten, eMails und Kalendereinträge von jedem Endgerät ermöglichen und die ständige Synchronisation von Daten auf verschiedenen Endgeräten obsolet machen.
Unified Messaging-Anwendungen
sind universelle Mailboxen, die dem Nutzer erlauben, Voice-, Fax und eMail-Nachrichten mit Sprachbefehlen zu managen
Unique User
Ist die Anzahl der Menschen, die eine Sprachapplikation zumindest einmal benutzt haben
Unit Selection
Bei TTS Anwendungen eingesetzte Technologie. Man unterscheidet drei Strategien: Non-uniform unit selection: Aus einer sehr großen Datenbasis werden die am besten passenden Sprachteile (units) miteinander verkettet, mit variabler Länge (non-uniform). Dabei wird eine doppelte Kostenfunktion minimiert: die Stücke sollen gut aneinander passen (Verkettungs-Kosten) und die Vorgaben der Ziel-Prosodie erfüllen (Target-Kosten). Klingt sehr natürlich (ähnlich dem Original Sprecher), ist aber unflexibel bzgl. Situationen, die nicht in der Datenbasis abgebildet sind und erfordert hohe Ressourcen (wird meist bei server-basierten Anwendungen eingesetzt).
Diphon Synthese: Das Sprachsignal wird durch Verkettung von Diphonen (Nachbar-Laut Kombinationen) erzeugt, die Prosodie-Anpassung (Rythmus und Melodie) geschieht durch Signal-Manipulation (Abhängig von der Kodierung der Diphone). Braucht weniger Ressourcen und eignet sich damit auch für embedded Anwendungen, klingt aber nicht sehr natürlich.
Formant Synthese: Das Sprachsignal wird anhand physikalischer Modelle berechnet (-> Formanten nennt man die Resonanz-Frequenzen im Sprechtrackt). Ist sehr flexibel und hat geringste Ressourcen-Anforderung, klingt aber bislang noch sehr unnatürlich.
Universal Command
ist (hier:) ein Sprachbefehl, der vom Benutzer einer Anwendung zu jeder Zeit und in jeder Ebene gegeben werden kann, um ohne Umwege zu einem bestimmten Punkt der Applikaiton zu gelangen (z.B. "Bundesliga-Ergebnisse" in einem Nachrichten-Portal). Vgl. -> Hot Link
URL
Uniform Resource Locator heisst der Mechanismus, der für das Aufspüren von Webadressen verwendet wird. URLs werden bei Web-Browsern zur Ermittlung der Position einer bestimmten Web-Seite verwendet
Usability
hier: Benutzerfreundlichkeit der Dialogführung
Usability Test
In Usability Tests bearbeiten potenzielle Benutzer typische Aufgaben im Dialog mit der Applikation. Die Interaktion wird beobachtet und für spätere Analysen auf Videokassetten aufgezeichnet (Bild und Ton). Die Auswertung der Testsitzungen zielt besonders auf die Identifikation von Bedienproblemen und auf die Messung wichtiger Parameter der Aufgabenbearbeitung, wie Lösungshäufigkeiten, Bearbeitungsdauer, Performanz der automatischen Spracherkennung, etc. ab. Die Testung erfolgt an dem implementierten System.
user centered (auch: centric) dialog-design
Nutzer zentriertes Dialog-Design
User Driven Initiative
im Gegensatz zur -> Machine Driven Initiative bestimmt hier der User aktiv den Dialogverlauf, um schnell und ohne Umwege zum gewünschten Ergenis zu gelangen
Utterance
Linguistischer Ausdruck für "Äußerung". Dies kann ein oder mehrere Worte oder ein (Teil-)Satz sein


V - VAD bis VUI

VAD
Voice Acivated Dialing bedeutet "Sprachwahl". Die Möglichkeit, Personen oder Unternehmen durch Nennen der Nummer oder des Namens anzuwählen. Bei der Sprachwahl greift das System auf vorher hinterlegte Adressbücher zurück und stellt die Verbindung automatisch her.
VAF
Voice Application Framework ist ein Begriff der Kelsey Group für Management Systeme, die Middleware-Funktionalität (zu Web-Servern und anderen Datenbank-Systemen), Integration von 3rd Party Applikationen mittels VXML und die „Treiber“ für die Ansteuerung unterschiedlicher ASR, TTS und Authentifizierungs Software bieten
VAMS
ein Voice Application Management System ist ein System, in dem verschiedene Sprachdialog-Objekte (z.B. der VoiceXML-Code, Audio Daten, Grammatik Dateien, etc.) zusammengefasst werden, um sie dann, z.B. mit einer graphischen Oberfläche (-> GUI), bearbeiten zu können
VAS
Voice Application Server ist eine Management Software, die Middleware-Funktionalität zu Webservern und anderen Datenbank-Systemen, die Integration von 3rd Party-Applikationen mittels voiceXML und die „Treiber“ für die Ansteuerung unterschiedlicher ASR, TTS sowie Authentifizierungssoftware bietet
VCC
Das Virtual Communication Center beschreibt eine virtuelle, medien- und standortübergreifende Vernetzung von Kundenkontakt-Centern zur dynamischen Kontaktverteilung.

Grundlage eines VCC ist ein intelligenter, netzbasierter Router, der eingehende Kontaktanfragen entgegennimmt und nach bestimmten Routinen IP-basiert weiterleitet (Routing). Routing-Möglichkeiten sind z.B. medienneutrales Routing (Warteschlangen zur gleichberechtigten Abarbeitung eingehender Kontakte, unabhängig von verwendetem Kontaktkanal – z.B. Email, SMS, Telefon, etc.), Skill-based Routing (Weiterleitung entsprechend Anfragen an den am besten qualifizierten Agenten) oder datenbasiertes Routing (nach Identifizierung des Kunden können durch Abgleich mit seinem Datensatz definierte Parameter Berücksichtigung finden, wie z. B. die bevorzugte Bearbeitung von A-Kunden, Durchstellung englischsprachiger Kunden an eben solche Agenten oder die standortübergreifende Vermittlung des stets gleichen Agenten, um die persönliche Kundenbindung zu festigen).

Die Vorteile eines VCC liegen in der gleichmäßigen und optimalen Ausnutzung vorhandener Ressourcen. Anruflasten werden durch dynamisches Routing verteilt, Leerlaufzeiten bei Agenten sowie Wartezeiten bei Kunden möglichst vermieden. Eine zusätzliche Effizienzsteigerung lässt sich durch das barrierefreie Einbinden zusätzlicher Module erreichen, da bereits die Weiterleitung wie auch z.B. Kundendatenbanken und evtl. Analyseprogramme computerbasiert abgewickelt wird.
v-Commerce
Sprachgesteuerter eCommerce oder Mobile Commerce per Telefon. Beim vCommerce werden die Anwendungsserver und Geschäftsregeln sowie die Datenbanken vorhandener Systeme genutzt, um Anrufern die gleichen Möglichkeiten einzuräumen wie PC-Benutzern
Verifier
ist das Programm innerhalb einer -> Voice Authentification, welches einen Anrufer anhand seines abgespeicherten -> Voice Prints erkennt -> Sprachbiometrie
Virtueller Assistent
nennt man eine besondere Kategorie von meist telefonbasierten Applikationen, die den Benutzer mit einer Reihe persönlicher und beruflicher Informationen unterstützen. Dazu zählen z.B. Zeitplanung, Termine, Anrufumleitung, Sprachausgabe von eMails, Benachrichtigung über Anrufe oder Weiterleitung dieser, Message- und Memo-Management sowie weitere Funktionen aus dem Personal Information Management.

Viele virtuelle Assistenten werden mit sprachfähigen Applikationen zu einem -> Personal Assistant entwickelt. Meist in Verbindung mit einer Personifizierung durch Charaktere oder Symbole wickelt dieser die Funktionen des virtuellen Assistenten relativ autonom oder per Sprachkommando ab.

Die Ergänzung des Personal Assistant um Technologien aus der künstlichen Intelligenz (KI) stellt das Konzept des -> Virtual Companion dar. Dieser repräsentiert einen langjährigen virtuellen Begleiter, der aus den verwalteten Informationen und Interaktionen seines Nutzers lernt und diesen autonom mit Hilfestellungen im täglichen Leben unterstützen kann. Einen möglichen Einsatz findet dieses Konzept in der Unterstützung alter und behinderter Menschen bei der Bewältigung moderner Anforderungen der Informationsgesellschaft.
Virtual Companion
-> Virtueller Assistent
VIS
Voice Infrastructure Software ist ein Begriff der Kelsey Group für die Gruppe von Entwicklungs- und Management-Systemen für Sprachapplikationen wie -> IDE, -> VAF
Vocabulary
bezeichnet das in einem Sprachdienst hinterlegte Vokabular, das von einem Spracherkenner erkannt wird und mit Hilfe der -> Grammar (Grammatik) strukturiert in einen Kontext gebracht wird. Eine sprachgesteuerte Fahrplanauskunft bspw. erkennt bei der Nennung der Worte "Frankfurt" und "München" diese anhand des Vokabulars als Bahnhöfe und aufgrund der Grammatik (hier: die Reihenfolge) auch die Fahrtrichtung.
Voice Analytics
... ist die Analyse von Kundenkontakten mit dem Ziel des Informationsgewinns und der Leistungsoptimierung. Man unterscheidet zwei Bereiche: -> Application Analytics für die Analyse der Anwendungsperformance und -> Speech Analytics für die Analyse des Anruferverhaltens.

Mit Application Analytics werden Anwendungen auf die Richtigkeit und Effizienz ihrer Abläufe sowie ihre Übereinstimmung mit Unternehmenszielen untersucht. Application Analytics Tools liefern eine Vielzahl von Parametern und Werten zur Bewertung der Performance und des Anruferverhaltens. Dadurch erschließen sich wertvolle Erkenntnisse für das Tuning und die Effizienz von Sprachdialogsystemen.

Bei Speech Analytics, die erst in ihren Anfängen stehen, geht es um die Analyse von Kundengesprächen auf Basis einer automatisierten Transkription. Die Gespräche werden laufend aufgezeichnet und transkribiert, die entstehenden Texte mithilfe entsprechender Algorithmen analysiert: So kann ein Unternehmen z.B. schnell herausfinden, welcher Konkurrent von den Anrufern besonders oft genannt wird. Die Analyse der Gesprächsprotokolle bietet sich an, wenn ein Unternehmen mehr über die eigenen Produkte, den Wettbewerb und das Marketing erfahren möchte – aus den Äußerungen der Kunden lassen sich wertvolle Rückschlüsse für die Produktentwicklung ebenso wie für das Marketing ziehen. Zudem kann durch die Analyse der Häufigkeit bestimmter Worte auf die Zufriedenheit oder den Verärgerungsgrad der Anrufer geschlossen werden.
Voice Application
-> Sprachapplikation
Voice Application Development Tools
basieren auf offenen Standards, ermöglichen Hardware unabhängige Anwendungs­entwicklung und sind auch in heteregonen IT-Umfeldern einsetzbar -> IDE
Voice Application Management
-> voiceASP
Voice Application Service Provider
-> voiceASP
voiceASP
Voice Application Service Provider nennt man eine besondere Form von -> ASP, also Unternehmen, die eine Sprachinfrastruktur für andere Unternehmen bereitstellen und ggf betreiben. VoiceASPs ermöglichen Unternehmen und Netzbetreibern eine beschleunigte Markteinführung von Sprachdiensten oder -> Voice-Portalen
Voice Authentification
ist die -> Authentifizierung eines Anrufers über einen sogenannten -> Voice Print, mit dessen Hilfe sich der Anrufer ohne eine Kundennummer o.ä. in das System einloggt
Voice Automation
Sprachapplikationen als Unternehmens-Dienste mit Fokus auf (Service-) Automatisierung als wesentlichem Treiber: Sprachapplikationen dienen als Zugang zu Customer Service Leistungen, internen Auskunfts- und Vermittlungsdiensten und der Workflow-Automatisierung
Voice Biometrics
Voice Biometrics (dt. -> Stimmbiometrie) bezeichnet im Allgemeinen die automatisierte Erkennung von Individuen durch den Abgleich ihrer stimmlichen Charakteristika mit einem zuvor hinterlegten Stimmprofil (-> Voice Print).

Da die menschliche Stimme von anatomischen und physiognomischen Eigenarten abhängt, ist sie ebenso unverwechselbar wie ein Fingerabdruck. Bei den Verfahren der Voice Biometrics werden die Verifikation und die Identifikation unterschieden.

Die Verifikation vergleicht die Stimme einer Person mit einem auf ihre Identität hinterlegten Stimmprofil (1:1-Abgleich). Hierzu muss sich die Person zuerst identifizieren, damit das System dann das zu verifizierende Stimmprofil auswählt und eine -> Authentifizierung vornehmen kann. Mit diesem Verfahren können sich z.B. Anrufer nach Angabe ihrer Kundendaten in Unternehmensdatenbanken authentifizieren, um dann Transaktionen durchzuführen oder sensible Informationen abzurufen.

Die Identifikation vergleicht die Stimme einer Person mit einer unbestimmten Menge an hinterlegten Stimmprofilen und kann so die zugehörige Identität ermitteln (1:n-Abgleich). Eine vorherige Identifikation der Person ist nicht notwendig. Dieses Verfahren eignet sich weniger zur Legitimierung von Rechten als zum Erkennen von Individuen. Eingesetzt werden kann es daher z.B. zur Erfassung der Anwesenheit, dem automatischen Zuordnen von Kundeninformationen oder zur Bewegungsverfolgung im Zuge polizeilicher Ermittlung.
Voice Browser
nutzen die primäre Eingabe von Sprachbefehlen zur Navigation
Voice Business
sind als Mehrwert-Dienste mit dem Fokus auf Umsatz und Kundenwert angelegte Sprachapplikationen. Diese sprachaktivierten Mehrwertdienste dienen als Zugang zu Bezahldiensten, der Produktdifferenzierung und Neukundengewinnung. Beide Anwendungsgebiete von Sprachapplikationen unterscheiden sich heute noch zumeist in technischer Hinsicht: Während Lösungen für Unternehmen meist über lokal installierte Sprachintelligenz verfügen (-> PABX, -> Server), liegt die Sprachverarbeitung bei Mehrwertdiensten im Netz!
Voice Business Intelligence
Innovative Analysetechnologien für Voice Streams sind vergleichbar der Click Stream-Analyse im Internet. Die im System laufend erhobenen Daten werden strukturiert in einer Datenbankanwendung gespeichert und aufbereitet. In Verbindung mit Business Intelligence Tools entsteht eine Senkung des Personalaufwands für Monitoring, Reporting und Tuning von Sprachdialgsystemen von bis zu 80%, weil die strukturierte Erfassung der Dialogdaten auf der Sprachplattform laufend Echtzeitdaten über bis zu 50 Key Performance Indikatoren liefert.
Voice Codec
Der Voice Codec ist eine auf Sprachverarbeitung spezialisierte Form eines Codec (Abkürzung für Codierer / Decodierer) und bezeichnet eine Hard- oder Software zur Codierung und Decodierung von Audio-Signalen (Stimmen). Hierbei werden mittels Algorithmen analoge Signale in digitale codiert bzw. digitale Signale in analoge decodiert. Da die Codierung meist mit einer Dynamikreduktion der analogen Signale einhergeht, kommt es je nach Ausmaß bei der Decodierung zu einem Qualitätsverlust. Daher werden in Abhängigkeit des verwendeten Algorithmus verlustfreie Kompressionen (mit einer geringen Kompressionsrate) von solchen mit Verlusten (aber hoher Kompressionsrate) unterschieden.

Ihre zentralen Funktionen bestehen einerseits in der Umsetzung von realer Sprache in Maschinensprache (Digitalisierung) sowie andererseits in der Kompression der benötigten Datenmenge zur Übertragung eines Signals. Vorhandene Bandbreiten können dadurch besser ausgelastet werden, Verständlichkeit und Effizienz der Kommunikation verbessern sich. Eine Optimierung sowie parametrische Veränderungen von Voice Codecs sollten stets in Einklang mit psychoakustischen Untersuchungen vorgenommen werden, da das Empfinden guter oder schlechter Kommunikationsbedingungen maßgeblich von der Wahrnehmung des menschlichen Ohres abhängig ist.

Anwendung finden Voice-Codecs in internationalen Telefonnetzen (Festnetz- und Mobiltelefonie), aber auch in Conferencing-Lösungen, Mobilgeräten, -> Unified Communications und -> Unified Messaging-Anwendungen, mobilen und kabellosen Anwendungen, dem Internet oder auch bei Voice over IP (VoIP). Um eine Kommunikation zwischen Teilnehmern zu ermöglichen, deren Endgeräte mit unterschiedlichen Codecs arbeiten, ist eine Umsetzung ins jeweils andere Format, eine Transcodierung erforderlich. Für IP-Telefonie, Unified Messaging und andere vereinheitlichende Anwendungen spielt daher die Standardisierung von Voice Codecs eine wesentliche Rolle.
Voice Dialer
-> VAD
Voice Hosting
-> Hosting
Voice Messages
sind Sprach-Nachrichten, die wie eMails versandt werden können.
Voice Operation Systems
sind Funktions- und Leistungsbausteine für die Implementierung einer kompletten Sprachapplikation.
Voice Portal
ein Sprachportal ist eine sprachgesteuerte Plattform, die einen Zugang auf verschiedene Anwendungen und/oder Services bietet.
Voice Presence
in Abgrenzung zur Web Presence, als Darstellung des Unternehmens und seiner Leistungen über die via Telefon erreichbaren Dienste (Call Center, Telefonzentrale etc.)
Voice Print
engl.: Stimmabdruck, -> Verifier
Voice Prompt
-> Prompt
Voice Recognition
ist ein Spracherkennertypus, der darauf ausgelegt ist, definierte Wörter (sogenannte -> Schlüsselwörter) aus einem kontinuierlichen Sprachfluß zu filtern und zu erkennen.
Voice Response Unit
Eine Voice Response Unit (VRU)beschreibt ein globales System zur automatischen verbalen Begrüßung des Anrufers und schließt ein IVR-System mit ein.
Voice Search
bezeichnet den sprachaktivierten Zugriff von z.B. mobilen Endgeräten auf dafür speziell konfigurierte Internet-Suchdienste.

Herzstück dieser Technologie sind softwarebasierte Applikationen, die auf dem Endgerät mittels Programmierschnittstellen in die Gerätesoftware implementiert werden. Der Nutzer kann nach Aktivierung der Applikation (z.B. durch Drücken einer konfigurierten Taste) seine Suchanfrage in das Endgerät einsprechen, welches die Anfrage als Sprachdatensatz über gängige Mobilfunknetze zu den Servern des Suchdienstes sendet. Dort verarbeitet ein Spracherkenner die Sprachdaten zu Textdaten, die dann wie von anderen Internet-Suchmaschinen bearbeitet werden können. Die gefundenen Ergebnisse werden anschließend wahlweise als Text- oder (nach erneuter Sprachverarbeitung) als Sprachdaten zurück auf das Endgerät des Nutzers gesendet.

Mit der steigenden Zahl von Funktionalitäten und Diensten für Endgeräte wächst für Anwender auch die Menge verschiedener Interfaces. Die Vorteile von Voice Search liegen neben ihrer (mobilen) Verfügbarkeit auch in der Vereinheitlichung der erforderlichen Interfaces.
Voice Service Plattform
Begriff der Kelsey Group in Abgrenzung zu -> VIS: Es handelt sich um "the hardware engines and middleware that take calls, support ASR and TTS resources and interact with applications servers." Zwei Klassen werden unterschieden: Carrier Grade- und Enterprise Class-Solutions
Voice Tone
die Sprach-Analogie zum Freizeichen
Voice Trading
engl. für Handel, der über Sprachsteuerung abgewickelt wird
Voice Web
nennt man ein Netzwerk von Sprachapplikationen und Sprachportalen, das Nutzer von jedem Telefon aus anrufen können, um Informationen zu bekommen oder Aktionen ausführen zu lassen. Ähnlich dem Internet wird sich auch das Voice Web Schritt für Schritt entwickeln
voiceXML
Voice eXtendable Markup Language ist eine "vereinfachte" Version der Standard Generalized Markup Language (SGML) -> XML
VoiceXML Interpreter
ist ein Programm, dass VoiceXML Dokumente "interpretiert" und damit eine Sprachplattform steuert, damit Benutzer mit dem System interagieren können. Nicht zu verwechseln mit einem -> Voice Browser
VoIP
Unter Voice over IP versteht man das Telefonieren über ein bestehendes Datennetz. Das kann zum einen über ein eigenes lokales Netzwerk oder mit entfernten Netzwerken und Telefonsystemen stattfinden. Dabei wird die Sprache komprimiert, in Pakete aufgeteilt und mit Hilfe von Protokollen (IP - Internet Protocol) zusammen mit Daten über das Netzwerk oder das Internet transportiert. Beim Übergang zwischen paket- (IP-Netz) und leitungsorientierten (Telefon-) Netzwerken werden sogenannte Gateways eingesetzt. Dies sind die Schnittstellen, die das Signal verständlich ins andere Netz leiten
VUI
Voice User Interface nennt man das Audioäquivalent zum GUI (Graphical User Interface) im visuellen Bereich. Ein VUI implementiert die gesprochenen Interaktionen zwischen Personen und Computern über ein (Telefon-) Netzwerk mit Hilfe von Spracherkennung, Sprachsynthese und Sprachauthentifizierung


W - von W3C bis Wortfeld

W3C
World Wide Web Consortium (W3C) ist eine Organisation zur Festlegung von Internetstandards, die für viele der derzeit wichtigsten Standards im World Wide Web verantwortlich ist. Das W3C befasst sich auch mit Aspekten im Zusammenhang mit Spracherweiterungen für Web-Inhalte. Weitere Informationen finden Sie unter www.w3c.org/voice
Wearable Computing
Wearable Computing ist ein Forschungsfeld der Informatik und beschäftigt sich mit der Entwicklung tragbarer Computersystemen, die der Anwender während der Anwendung mit sich am Körper trägt. Im Wesentlichen unterstützt das System den Anwender in seiner Tätigkeit (zusätzliche oder benötigte Informationen, Umsetzen von Handlungsanweisungen des Anwenders, Warnhinweise), die Anwendung des Systems selber tritt dabei in den Hintergrund. Damit dies optimal ablaufen kann, muss das System gleichermaßen kontextsensitiv funktionieren und barrierefrei zu bedienen sein. Benutzungsschnittstellen, die die Aufmerksamkeit des Benutzers vollständig binden, sind daher wenig sinnvoll und Konzepte eines tragbaren Computersystems gehen in der Regel von sprachbasierter Interaktion mit dem System aus.

Beispiele für den Einsatz solcher Systeme sind z.B. Krankenhäuser oder auch Industriearbeiten. Bei erstgenanntem können Ärzte direkt bei Betreten des Zimmers mit den Patienteninformationen der Bewohner versorgen. Befunde kann der Arzt direkt dem System diktieren, das sie in die textbasierte Patientendatenbank umsetzt. In Notfallsituationen hat der Arzt beide Hände und Augen frei und kann über das System zusätzliche Maßnahmen anfordern bzw. einleiten. Auch bei Industriearbeiten profitieren Anwender in Hands-Free-Umgebungen bzw. in Situationen, die besonders hohe Aufmerksamkeit und Vorsicht oder die Ausführung gleichzeitiger Tätigkeiten erfordern.
Web 2.0
Web 2.0 ist der Oberbegriff für eine neue Breitenwahrnehmung des Internets, die auf einer Reihe neuer Techniken und Dienste beruht, welche weitestgehend bereits Ende der 90er Jahre vorhanden waren, aber erst mit Verbreitung breitbandiger Anschlüsse in den letzten Jahren massenhaft Nutzer fanden. Technologien wie CMS, Ajax und Abonnement-Dienste (RSS) ermöglichten zwei basale Neuerungen: Mitwirkung – die Grenze zwischen ehemaligen ‚Editoren’ und reinen ‚Benutzern’ verwischt, Anwendungen und Datenspeicher wandern ins Netz, User-generated Content, soziale Netze und Wikis entstehen - und Standardisierung – die Trennung von Form und Inhalt ermöglicht Web-Standards sowie offene Schnittstellen und macht Daten austauschbar und medienübergreifend verwendbar. Diese neuen Nutzungsmöglichkeiten haben dazu geführt, dass sich die Wahrnehmung des Internets seit etwa 2005 zu verändern beginnt.
Kritiker wie Tim Berners-Lee werfen dem Begriff, der dem O´Reilly Verlag zugeschrieben wird, eine derartige Unklarheit vor, dass niemand seine eigentliche Bedeutung benennen könne, und verweisen darauf, dass Web 2.0 lediglich eine Rückkehr zum ursprüngliche Netzverständnis des Web 1.0 bedeute.
Wizard-of-Oz-Test
Ein Wizard-of-Oz-Test ist die Simulation einer Mensch-Maschine Schnittstelle, welche die Interaktion mit dem zu erstellenden Voice User Interface ermöglicht. Dies geschieht in einem frühen Projektstadium, vor der Implementierung. Wizard-of-Oz-Tests dienen häufig der Sammlung von Daten, auf deren Grundlage Erkennungsgrammatiken erstellt werden. Zusätzlich können auch Erkenntnisse für die Optimierung des Dialogverlaufs gesammelt werden. Aus Sicht des Dialogdesigns kann ein Wizard-of-Oz-Test als Alternative oder Ergänzung zu einem Rapid Prototyping Ansatz angesehen werden, der "echte" Usability Tests in einem frühen Projektstadium ermöglicht.
Word Accuracy
Die durchschnittliche Wortgenauigkeit für einen Testtext (in Prozent). Neben Größe und Wartezeit der wichtigste Aspekt im Zusammenhang mit der -> ASR-Leistung. Formel: 100 – (100*[Einfügefehler + Ersetzungungsfehler + Löschfehler] / Anzahl der Worte)
Word Spotting
Word Spotting ist eine Möglichkeit, bestimmte Worte oder Sätze innerhalb einer beliebigen Äußerung zu identifizieren. Dadurch wird eine natürlichere Form der Sprache erzielt. Beispiel: Wenn der Benutzer einer -> Telebanking-Applikation aufgefordert wird, eine der Optionen "Ein-" oder "Auszahlung" zu wählen, wird er möglicherweise sagen: "Ich möchte Geld einzahlen" bzw. "Ich möchte Geld abheben." Durch das Word Spotting werden die entscheidenden Worte innerhalb dieser Aussage identifiziert
Workflow Automatisierung
bezeichnet die Automatisierung von Arbeitsprozessen wie Zeiterfassung, Bedarfs­meld­ungen u.ä
Wort-Fehler-Quote
Diese Quote (engl: Word Error Rate) ist ein Parameter, um die Qualität eines Spracherkenners zu beschreiben
Wortfeld
Die Wortfeldtheorie geht davon aus, daß Wortbedeutungen im Sprachsystem nicht isoliert, sondern in vielfältigen Verbindungen zu Bedeutungen anderer Wörter stehen. Aufgrund dieser Verbindungen lassen sich Wörter sogenannten Wortfeldern (Synonyme: semantische Felder/Bedeutungsfelder) zuordnen. Bsp.: rot, blau, grün, gelb gehören zum Wortfeld der Farbbegriffe. Es gibt auch heterogene Wortfelder, in denen Wörter, die nicht zu einer Wortklasse gehören, aber dennoch eng miteinander verknüpft werden, gespeichert werden. Bsp.: Hund-bellen, Augen-blau, Radio-hören


X - von X.25 bis XML

X.25
ist ein international genormter Standard für die paketorientierte Datenübertragung
xHMI
Extensibe Human Machine Interface ist eine offene, auf XML-basierende Programmiersprache für die Dialog-Konfiguration
XML
Die Entwicklung von eXtensible Markup Language begann 1996, seit Februar 1998 ist XML ein Standard. An der Entwicklung haben sich unter anderem Adobe, Hewlett-Packard, Microsoft, Netscape und Sun beteiligt. XML soll es den Web Site-Programmierern erleichtern, Anwendungen zu schreiben und dabei eigene Dokumententypen festzulegen. XML bietet viele Mechanismen, die u.a. die Datenverwaltung im Netz erleichtern sollen und die XML auch als Datenbankoberfläche in Intranets tauglich machen können. So dient die XML als speziell auf Internet-Suchmaschinen zugeschnittene Internet-Sprache dem Austausch von Daten. Die neue Internet-Sprache ist zwar komplizierter als -> HTML, sie erlaubt es aber, kompakte Datenfiles aus einer Datenbank mit anderen Web-Seiten so auszutauschen, dass diese damit weiterarbeiten können. XML ist eine Methode, um strukturierte Daten – z.B. Kalkulationstabellen, Adressbücher, Konfigurations­parameter, finanzielle Transaktionen, technische Zeichnungen usw. – in einer Text­datei darzustellen


Z

zero out-Rate
meint die Anzahl der Fälle, in denen der Nutzer durch Wählen der Null einen Agenten zu Hilfe ruft
Name:
Kennwort:
Anmeldung speichern
jetzt registrieren!
Begriff gesucht
...und nicht gefunden?
... mehr
| | | |
© VOICE Community 2004 bis 2017 - Alle Rechte vorbehalten