Home  >  News  >  Technologie & Produkte


Deutsche Allianz für vernetztes Haus der Zukunft
03.09.2011, heise online
Eine deutsche Industrie-Allianz unternimmt einen neuen Anlauf für das vernetzte Haus der Zukunft. Die Deutsche Telekom, Eon, EnBW und Miele stellten auf der IFA in Berlin die Plattform "Smart Connect" vor, über die Haushaltsgeräte und Gebäudetechnik wie Heizung oder Jalousien gesteuert werden können. Ein Ziel der Partnerschaft ist es, einen Standard zu etablieren, der auch international durchsetzbar ist.
Von Mitte 2012 an will die Telekom die Plattform in Deutschland anbieten. Unabhängig vom Telekommunikationsanbieter soll sie an jedem Breitband-Anschluss funktionieren. Zentrale Komponente des Systems ist die "Smart Connect Box" im Haus des Kunden. Über sie werden lokale Anschlüsse mit Internet-Diensten verbunden.
Eine Schlüsselfrage sind dabei jedoch die Standards. Aktuell gibt es zwar schon diverse Anbieter von Lösungen für Heimautomation, aber viele Systeme sind nicht miteinander kompatibel. Die Kooperation der Industrieschwergewichte könnte jetzt helfen, einen Standard zu etablieren.
Dass die Plattform zuerst in Deutschland eingeführt wird, habe auch gute Gründe. "Der Deutsche Markt ist ideal, um zu starten", betonte Urban Keussen von Eon. Insbesondere nach der Entscheidung für den Atomausstieg sei Deutschland eine Art "Showroom für die Zukunft". Zudem sei hierzulande die Bereitschaft der Bürger, sich mit Themen wie Energiesparen und Umweltschutz auseinanderzusetzen, höher als in vielen anderen europäischen Ländern.
... mehr
Universal-App für iPhone und iPad präsentiert einen Web-Browser mit Sprachausgabe
02.09.2011, Pressearbeit
Ein Web-Browser sollte mehr können, als nur durch die zahllosen Online-Seiten zu scrollen. Voice Reader Web ist ein Universal-Browser für die drei mobilen Apple-Plattformen iPhone, iPod touch und iPad. Dabei bietet er drei wichtige Zusatzfunktionen: Er kann zuvor gespeicherte Web-Seiten offline laden, im Textmodus störende Bilder und Werbebanner ausblenden und alle Texte laut vorlesen – in 21 Sprachen und mit 32 Stimmen. Beim Autofahren, im Zug oder beim gemütlichen Dösen spart man sich so das mitunter anstrengende Lesen am kleinen Bildschirm und lauscht der glasklaren Sprachausgabe in professioneller Qualität.
Die App lässt sich genau auf die Bedürfnisse der Benutzer anpassen. So kann man sich entweder die ganze Website vorlesen lassen oder nur einzelne Abschnitte. Es gibt sogar eine Pausentaste. Die Anwender können auch die Vorlesegeschwindigkeit, die Tonhöhe und die Lautstärke für die Sprachausgabe frei wählen. Wer möchte, speichert die gelesene Sequenz in einer Audiodatei (M4A, CAF oder WAV), die sich im Gerät verwalten oder per E-Mail versenden lässt.
Voice Reader Web 1.0 ist ab sofort im Apple AppStore verfügbar und kostet 1,59 Euro.
... mehr
Lernen aus Krankenakten
02.09.2011, Technology Review
In den USA flossen bereits Milliarden in Projekte zur Einführung elektronischer Krankenakten. Die Versorgungsqualität hat sich dadurch allerdings noch nicht wie erwartet erhöht. Eines der Probleme: Die Daten lassen sich bislang nur schwer automatisiert analysieren. Eine neue Studie zeigt nun, dass Verfahren aus der Computerlinguistik beim Verarbeiten von Patienteninformationen helfen könnten.
In den USA wird bereits bei der Erstellung von Rezepten mit solchen Analysemethoden gearbeitet. Weil Rezeptdaten bereits hochstrukturiert vorliegen, ist das technisch kein großes Problem. Dagegen ist das, was ein Arzt in die Krankenakte schreibt, zumeist wenig strukturiert – Ärzte haben hier ein freies Textfeld, in das sie den Zustand, die Krankengeschichte und andere Aspekte hineinschreiben können, die sie für wichtig halten. Kollegen verstehen das, was es dort zu lesen gibt zwar problemlos – ein Computer und sein Suchalgorithmus hingegen nicht.
Eine normale, unintelligente Volltextsuche findet zwar das Wort "Lungenentzündung" in einer Krankenakte. Das Vanderbilt-System kann aber beispielsweise solche Ergebnisse ausfiltern, die keine Relevanz haben, etwa, wenn vor "Lungenentzündung" ein "keine Anzeichen von" steht.
... mehr
Start-up will beste Preise für Hardware vorhersagen
01.09.2011, heise online
Es ist eine klassische Frage, die sich jeder Freund neuer Produkte aus dem Techniksektor stellt: Wann ist der richtige Zeitpunkt, zuzuschlagen? Wer früh kauft, kann zwar damit angeben, zu den "Early Adoptern" zu gehören und ein neues Gerät länger genießen. Doch dabei zahlt man oft drauf.
"Die Leute haben ständig das Gefühl, über den Tisch gezogen zu werden", meint Oren Etzioni, Technikchef und Mitbegründer des Start-ups Decide, einer US-Internet-Firma, die versucht, Kunden die Entscheidung abzunehmen. Decide hat dazu Vorhersagemodelle entwickelt, bei denen Preistrends ebenso berücksichtigt werden wie Nachrichten, Gerüchte und aktuelle technische Spezifikationen.
Die Vorhersage von Preisen für Unterhaltungselektronik ist komplex. Gadgets werden über viele Monate behalten und genutzt. Die Leute wollten nicht zu lange warten, damit sie nicht mit veralteten Geräten vorlieb nehmen müssen, sagt Etzioni. "Da geht es oft weniger um den Preis. Wir glauben, dass nur eine beschränkte Anzahl an Kunden wirklich warten will." Aus diesem Grund berechnen die Decide-Algorithmen nicht nur neue Modelle und bereits erschienene Geräte mit ein. Es werden auch Sonderfälle berücksichtigt. "Es kommt manchmal vor, dass neue Geräte sogar billiger sind als ihre Vorgänger", sagt Etzioni.
... mehr
Chatbots - Die automatischen Gesprächspartner
22.08.2011, DRWissen
Er muss ziemlich von den Socken gewesen sein, der US-amerikanische Psychologe Dr. Robert Epstein. Zwei Monate lang hatte er romantische E-Mails ausgetauscht mit seiner russischen E-Mail-Dating-Affäre Ivana. Aber die Frage, ob er sie an einem bestimmten Tag in Moskau besuchen dürfe, ignorierte sie wochenlang. Als Ivana dann immer wieder die gleichen langweiligen Geschichten wiederholte, dämmerte ihrem Verehrer: Ivana ist gar keine attraktive, junge Dame mit schlechtem Englisch, sondern ein Chatbot.
Das war 2007. Epstein begann die Welt der Chatbots zu erforschen und wurde einer der weltweit führenden Experten in Sachen künstliche Intelligenz.
Was Epstein passiert ist, ist nicht ungewöhnlich. Im Internet werden so genannte Chatbots eingesetzt, um den Kontakt zu einem Menschen zu suggerieren und so an Informationen über die Chattenden zu gelangen, etwa Kreditkartendaten oder Passwörter. Und diese Software wird besser und besser.
DRadio Wissen präsentiert einen spannenden Hör-Beitrag über die automatischen Gesprächspartner, bei dem sogar zwei der Chat-Computer zu einem romantischen Gespräch verkuppelt werden.
... mehr
Der Touchscreen stupst zurück
12.07.2011, golem.de
Künftig könnten sich mobile Geräte durch die Vivitouch-Technik von Artificial Muscle von Wettbewerbern abheben. Vivitouch basiert auf elektroaktiven Polymeren, die taktile Rückkopplung mit Frequenzen von 50 bis 300 Hz erzeugen können. Die künstlichen Muskeln sollen sehr schnell reagieren, innerhalb von 5 ms spürbar sein und wenig Strom verbrauchen.
Die Vivitouch-Aktuatoren sollen sehr präzise sein und die Touchscreen-Oberfläche selbst bewegen und so den Fingern ein feines taktiles Feedback geben können. "Der Sprung von traditionellem Rütteln zu Vivitouch ist wie der Sprung vom Schwarz-Weiß- zum Farbfernsehen", wirbt Artificial Muscle in einer Pressemitteilung.
Eines der ersten Geräte mit Vivitouch wird Mophies Pulse-Gehäuse für den iPod touch. Es soll die Hände des Spielers kräftig durchschütteln können und Spielen durch die zusätzlichen Lautsprecher auch zu satterem Stereosound verhelfen. Bei nicht angepassten Spielen oder Anwendungen wird der Sound dazu verwendet, Bewegungen auszulösen. Ein Pulse-Prototyp wurde bereits im Januar 2011 auf der CES in Las Vegas präsentiert, das fertige Produkt lässt aber weiter auf sich warten.
... mehr
Theseus-Teilprojekt Alexandria soll Ende des Jahres online gehen
12.07.2011, heise online
Der IT-Dienstleister Neofonie hat nach eigenen Angaben die Entwicklung der Wissensplattform Alexandria abgeschlossen, die Teil des semantischen Suchprojekts Theseus ist. Das Besondere an Alexandria ist das dahinterstehende Metamodell, das an die Semantik der menschlichen Sprache angelehnt ist. Damit kann nicht nur nach Schlagwörtern gesucht werden, es ist auch möglich, sich komplette Fragen wie "Welche Künstler wurden 1970 in Berlin geboren" beantworten zu lassen, erläuterte der Projektmanager Florian Kuhlmann.
Die Wissensbasis, aus der das Projekt schöpft, werde aus drei Quellen gefüttert. Dabei handle es sich um bereits strukturierte und mit "Tags" versehene Informationen aus dem Internet. Dazu kämen Daten, die per semi-automatischer Textanalyse erstellt würden und komplexe Beziehungen abbilden könnten sowie Einträge aus der derzeit noch auf Beta-Tester begrenzten Nutzergemeinde.
Alexandria ist Kuhlmann zufolge modular angelegt und besteht aus der eigentlichen Wissensbasis, dem Frage-Antworten-System sowie Komponenten für Textanalyse, Empfehlungen und Community.
... mehr
myAudi mobile assistant hilft weiter
08.07.2011, elektroniknet.de
Der neue myAudi mobile assistant macht die aktuelle Verkehrslage immer und überall verfügbar. Dank neuester Technik meldet die App Staus und Behinderungen in Echtzeit auf dem Smartphone und hilft so, die günstigste Abfahrtszeit zu wählen. Mit dem integrierten Fahrten- und Tankbuch kann der Nutzer seine Fahrleistungen und Ausgaben für Kraftstoff jederzeit erfassen und auswerten – ganz komfortabel auch direkt an der Zapfsäule. Weitere praktische Funktionen der neuen App sind die kartenbasierte Händlersuche, die die nächstgelegenen Audi-Partner im Umkreis anzeigt und der Parkplatzfinder: Er speichert auf Wunsch den aktuellen Standort des eigenen Fahrzeugs und markiert ihn in der Kartenansicht.
Die umfassende Vernetzung mit den mobilen Endgeräten des Kunden ist eine Säule der Audi-connect-Strategie. Das System nutzt unter anderem anonymisierte Bewegungsprofile, die hunderttausende Handys in anderen Fahrzeugen erzeugen. So arbeitet es schneller und gleichzeitig exakter als bisher bekannte Verkehrsinformationsdienste.
Der myAudi mobile assistant ist für das iPhone, iPod touch und iPad erhältlich und kann kostenlos im Apple App-Store heruntergeladen werden.
... mehr
Bing-Suchmaschine - Ohne Tippen suchen
07.07.2011, golem.de
Eine Suchfunktion, die auf die Besonderheiten von Tablets Rücksicht nimmt, soll die App von Microsofts Suchmaschine Bing sein, die auf Apples iPad läuft. Mangels Hardwaretastatur fällt das Tippen schwerer als bei Notebooks und so hat Bing eine neue Suchmöglichkeit erhalten, die auf das berührempfindliche Display zurückgreift.
Der Anwender markiert das Suchwort mit dem Finger, indem er eine Ellipse darum zeichnet. Diese Funktion nennt Microsoft Lasso. Sie ersetzt das Tippen und auch das etwas umständliche Markieren von Textstellen mit den iOS-Funktionen.
Derzeit ist die iPad-Anwendung von Bing nur im US-App-Store von Apple erhältlich. Wann die deutschsprachige Lokalisierung folgt, ist nicht bekannt.
... mehr
iPad-App für Gebäudeautomation
07.07.2011, Elektronik Praxis
Die ELV/eQ-3-Gruppe nutzt das iPad als mobile Kommandozentrale zur Steuerung für die Hausautomation. Für eine schnelle Übersicht ist das Programm an die spezifische iPad-Anzeige angepasst und bietet die Möglichkeit, individuelle Oberflächen zur Steuerung einzelner Home-Control-Geräte oder ganzer Szenarien einzurichten.
Mittels der neuen Funktion zur Einbindung von Webcams kann der Haus- oder Wohnungsbesitzer seine vier Wände immer und überall im Blick behalten. So kann er z.B. seine IP-Überwachungskameras in die pocket Home-App integrieren und deren Aufnahmen direkt und live aus der Applikation heraus abrufen.
Via iPad lassen sich einzelne Räume komfortabel überwachen. Der Anwender kann die zu steuernden Aktoren, etwa Heizungsthermostate in verschiedenen Räumen, frei definieren bzw. festlegen. Darüber hinaus ermöglicht pocket Home HD mittels Listen- oder Bildansichten die Einrichtung eines individuellen Steuerungs-Interfaces.
... mehr
MyVoice App gibt Sprachbeeinträchtigten eine Stimme
13.04.2011, macnews.de
Per Klick lassen sich Vokabeln und Phrasen miteinander kombinieren und vom Smartphone vorlesen. Die Wort- und Phrasenbausteine sind nach Themen geordnet und lassen sich als Wörterbücher herunterladen. Über die zusätzliche Lokalisierungsfunktion macht die App automatisch passende Vorschläge, abhängig davon, wo man sich gerade befindet. Im Menüpunkt "Places" kann der Nutzer Orte speichern und dafür passende Vokabeln festlegen. Befindet er sich dann beispielsweise im Café, in einem Geschäft oder in der Bank, kann die Anwendung das erkennen und automatisch passende Phrasen wie "Kaffee mit Zucker und Milch bitte", "Ich zahle mit Karte" oder "Ich möchte Geld abheben" ausgeben.
Die Anwendung kann also in gewissen Maße einen Sprachcomputer ersetzen, wie ihn zum Beispiel Stephen Hawking nutzt - mit dem Vorteil weniger klobig und eher unfauffällig und günstiger zu sein.
Die App ist in englischer Sprache verfügbar. Gesprochen werden die Phrasen von "Dave", einer männlichen, US-amerikanischen Stimme. Für 4,99 Euro können weitere Stimmen erworben werden.
... mehr
Apps für alle Endgeräte – erste Forschungsergebnisse veröffentlicht
07.04.2011, Informationsdienst Wissenschaft
Applikationen, kurz „Apps“ genannt, dominieren derzeit den Smartphone-Markt. In Zukunft sollen Apps nicht nur auf Smartphones, sondern auch plattformübergreifend eingesetzt werden: auf internetfähigen Fernsehern, Tablet- und Desktop-PCs, Spielkonsolen und sogar in Autos. Dafür entwickeln derzeit 20 Partner aus Industrie und Forschung in dem Projekt "webinos" eine Open-Source-Plattform sowie Software-Komponenten.
"Mit der von uns angestrebten Technologie wollen wir die Programmierung und Entwicklung von Apps ermöglichen, die sich benutzerfreundlich, sicher und nahtlos auf einem breiten Spektrum an Endgeräten einsetzen lassen", erläutert Projektleiter Dr. Stephan Steglich, Fraunhofer FOKUS.
Ende März 2011 hat das Projekt-Konsortium die ersten Forschungsergebnisse veröffentlicht. Berichte zu den Themen Anwendungsfälle, Sicherheit, technische Anforderungen und Branchenumfeld stehen zum Download bereit. Das von der Europäischen Union mit zehn Millionen Euro geförderte Projekt startete im September 2010 und läuft bis 2013. Ein erster Protoyp der Technologie wird für Ende 2011 erwartet.
... mehr
Kaffeevollautomat Jura IMPRESSA Z7 One Touch mit Spracherkennung
30.03.2011, Essen & Trinken
Ab Juli 2011 liefert die IMPRESSA Z7 One Touch Voice von JURA Kaffeespezialitäten per Spracheingabe, die sich einfach über die so genannte Rotary Switch-Taste einschalten lässt. Sobald das blaue Lämpchen leuchtet, nimmt der neue Kaffeevollautomat innerhalb einer Minute Bestellungen für Ristretto, Espresso, Kaffee, Cappuccino, Latte macchiato, Heißwasser oder Milch auf - nur noch Glas oder Tasse unter den höhenverstellbaren Kaffeeauslauf stellen und fertig ist der Lieblingskaffee. Möglich machen das integrierte Lautsprecher, Mikrofon und eine ausgeklügelte Technik.
Die Sprachausgabe lässt sich abstellen, die Lautstärke ist regulierbar. Und neben dem freundlichen "Wie bitte?" hat die IMPRESSA Z7 One Touch Voice sprachlich noch einiges mehr zu bieten: Die sanfte Stimme erinnert daran, den Wassertank oder Milchbehälter oder die Bohnen aufzufüllen, den Kaffeesatzbehälter oder die Restwasserschale zu leeren und den Aromaschutzdeckel aufzusetzen.
... mehr
Itenos präsentiert den Dienst "Voice-Ident"
29.03.2011, Funkschau
Erhebungen des Statistischen Bundesamtes zufolge muss sich jeder Bundesbürger im Schnitt rund sechs PIN-Nummern merken. Datenschutzexperten sehen die Grenzen der Merkfähigkeit bereits erreicht. Im Extremfall wird die Geheimzahl sogar schon auf die EC-Karte geschrieben, damit man sie beim Abheben am Geldautomaten gleich zur Hand hat. Mit dem Einsatz von so genannten "Voice-Prints" könnte dieses Sicherheitsrisiko sehr schnell beseitigt werden.
Der Bonner Sicherheitsspezialist Itenos bietet mit "Voice-Ident" ein Verfahren an, mit dem sich Nutzer anhand der eigenen Stimme authentifizieren können. Das Programm erlaubt den Zugriff auf verschiedene Funktionen. Die Stimme wird als Datensatz erfasst und dient als Schlüssel beispielsweise für Online-Banking oder Bestellungen.
Das Bundesamt für Sicherheit in der Informationstechnik (BSI) hat die Zuverlässigkeit von "Voice-Ident" bestätigt und für den Authentifizierungsdienst ein Sicherheitszertifikat ausgestellt.
... mehr
MIA- ein Cloudbasierter Marktplatz für Informationen und Analysen
16.03.2011, Pressebox
Die Analyse von frei verfügbaren Daten ist ein wachsendes Marktsegment. Mithilfe von Sprachtechnologien und statistischen Verfahren können Milliarden von Webseiten ausgewertet werden. Das Forschungsprojekt MIA hat das Ziel die Verarbeitung dieser Daten auch kleinen und mittelständischen Unternehmen mittels Cloud Computing zu ermöglichen.
MIA wird einen Marktplatz entwickeln, der den nachhaltigen Betrieb einer zuverlässigen und vertrauenswürdigen Plattform zur Gewinnung, Vorhaltung und Nutzung des Datenbestands des deutschsprachigen Webs und anderer freier Informationsquellen sichert.
Das BMWi fördert durch "Trusted Cloud" die Entwicklung und Erprobung von innovativen, sicheren und rechtskonformen Cloud Computing-Diensten mit insgesamt rund 50 Mio. Euro. Hinzu kommen Eigenmittel der Projektbeteiligten in etwa gleicher Höhe, so dass insgesamt rund 100 Mio. Euro zur Verfügung stehen. Das BMWi-Technologieprogramm "Trusted Cloud" ist Teil des Aktionsprogramms Cloud Computing, das das BMWi im Oktober 2010 gemeinsam mit Partnern aus Wirtschaft und Wissenschaft gestartet hat.
... mehr
Java Speech API 0.3 macht sich für Windows 7 und Mac OSX bereit
29.11.2010, JAXenter
Das Open Source verfügbare Projekt Java Speech API (JSAPI) ist in Version 0.3 erschienen. Das Projekt bietet eine Basisbibliothek für den JSR-113 und soll das Entwickeln von Spracherkenner und -synthesizern erleichtern, die mit dem JSR-113 kompatibel sind. Die neue Version lässt Spracherkenner nun auch von den Betriebssystemen Windows Vista und 7 nutzen, außerdem gibt es erste Gehversuche in Richtung Mac OSX. Mehr Informationen gibt es auf der Projektseite. Mehr zum Thema finden sich auch im ausführlichen JAXenter-Artikel.
... mehr
Clipsuche nutzt Spracherkennung
25.11.2010, heise online
Durch Filme lässt sich bislang nur verhältnismäßig mühsam navigieren: Dem Zuseher bleibt nichts anderes übrig, als den gewünschten Abschnitt über die Vor- und Rückspulfunktion anzusteuern oder darauf zu hoffen, dass der Videoproduzent passende Kapitelmarkierungen an den interessantesten Stellen gesetzt hat.
Forscher am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS) in Sankt Augustin wollen das Problem nun über das sogenannte Audio-Mining lösen. Dabei wird die Tonspur eines Videos über ein Spracherkennungssystem automatisch in Text umgewandelt. Gleichzeitig wird in einer Datenbank abgelegt, wann genau welches Wort im Film gefallen ist.
Die IAIS-Forscher haben ihre Technik mittlerweile auch praktisch umgesetzt - bei einem Projekt in Zusammenarbeit mit der Pro Sieben-Sendung "Galileo". Aus dem Bildberichts-Bestand von über 12 Jahren wurden insgesamt 5000 Werke indexiert. Diese sind nun im Internet verfüg- und durchsuchbar.
... mehr
Multi-Channel-Voice of the Customer Textanalyse jetzt auch in Deutsch erhältlich
23.11.2010, Attensity Pressestelle
Attensity veröffentlichte die deutschsprachige Variante seiner Textanalyse-Applikation Attensity Analyze. Mit Attensity Analyze for German können wertvolle Informationen nun auch aus deutschsprachigen Kundenkonversationen aus den unterschiedlichsten Quellen wie Social Media, Callcenter-Aufzeichnungen, E-Mails oder Kundenumfragen in Real-Time extrahiert und zusammengeführt werden.
Dies versetzt deutsche Unternehmen in die Lage, tiefgreifende Einblicke in die Kundenstimmung und in die Ursachen von Meinungen, Empfehlungen oder Problemen zu gewinnen. Sogar Gründe für Kundenabwanderungen und Betrugsfälle lassen sich so aufdecken und wichtige Informationen hinsichtlich Kundenzufriedenheit, -loyalität oder Stimmungslage gewinnen.
Die Basis von Attensity Analyze bilden semantische Technologien im Bereich des Natural Language Processing (NLP), die eine tiefgreifende Analyse ermöglichen. Attensity Analyze wandelt Texte in verwertbare Informationen um und ermöglicht damit Einblicke in aggregierte Kundendaten.
... mehr
Swype für Symbian: Deutsche Sprachversion der Texteingabe verfügbar
23.11.2010, golem.de
Auf Bildschirmtastaturen tippt der Anwender normalerweise jeden Buchstaben einzeln. Bei Swype erfolgt die Eingabe, indem die einzelnen Buchstaben eines Wortes quasi auf dem Bildschirm gezeichnet werden. Damit soll Swype die Eingabegeschwindigkeit erhöhen.
Das in Swype enthaltene Wörterbuch hilft außerdem bei der Eingabe. Vor allem, wenn eine Eingabe nicht eindeutig erkennbar ist, zeigt die Software eine passende Auswahl an. Zudem sollen mit dem Wörterbuch gepaart mit der Swype-Eingabetechnik Tippfehler vermieden werden. Die Leertaste ist bei Swype oft überflüssig, weil die Wörter in einer Bewegung eingegeben werden und das Absetzen als Wortende erkannt wird.
Nokia bietet die Betaversion von Swype für eine Reihe von Touchscreen-Smartphones mit der Symbian S60 5th Edition im Bereich Nokia Beta Labs an.
... mehr
Preise vergleichen mit dem iPhone
23.11.2010, SpeechTechMag
Amazon.com bietet eine neue iPhone-App zum direkten Preisvergleich im lokalen Einzelhandel. US-Kunden sollen damit noch am Regal entscheiden können, ob sie lieber bei Amazon oder anderswo online bestellen.
Mit der iOS-App "Price Check by Amazon" kann das zu vergleichende Produkt automatisch über den Barcode oder ein Bild der ganzen Verpackung erkannt werden. Alternativ kann der Produktname auch mittels Spracherkennung oder Eintippen übermittelt werden.
Amazon.com versucht darauf hin das Produkt in seiner eigenen Datenbank und bei anderen Onlinehändlern zu finden. Bei Interesse kann dann bei auf Amazon angebotenen Produkten direkt über die App bestellt werden.
Eine deutsche Version der Anwendung wurde noch nicht angekündigt.
... mehr
Facebook verschmilzt E-Mail, SMS, Chat und Instant Messaging
15.11.2010, golem.de
Facebook Messages ist kein Google-Mail-Killer, betont Facebook-Gründer Mark Zuckerberg anlässlich der Vorstellung des Dienstes. Dabei können Nutzer die Kommunikationskanäle selbst bestimmen, ganz gleich ob SMS, Chat, E-Mail oder Facebook-Messages. Die Nachrichten erreichen den Empfänger auf dem Weg, den er gewählt hat, so dass sich der Absender keine Gedanken darüber machen muss, welchen Kommunikationskanal der Empfänger bevorzugt. Dennoch soll gewährleistet sein, dass alle Kommunikation in Echtzeit abläuft.
Im Rahmen des neuen Dienstes stellt Facebook seinen Nutzern auch eine E-Mail-Adresse zur Verfügung, die dem Schema Benutzername@facebook.com entspricht. Klassische E-Mails bietet Facebook aber bewusst nicht an: Die Nachrichten haben keinen Betreff und sie können auch nicht per CC oder BCC an mehrere Empfänger gesendet werden. Sie werden zudem mit Drücken der Enter-Taste abgeschickt.
... mehr
Dichtung und Wahrheit - Google will Poesie übersetzen
10.11.2010, Der Westen
Gott der falschen Fährten, erlöse uns von den Namensvettern.” Ein Gedanke aus dem Gedicht „Goooogle“ des englischen Autors Adam O’Riordan. Er beschreibt die Suchmanöver einsamer Männer, die nachts im fahlen Bildschirmlicht nach früheren Bekannten forschen. Übersetzung: von Menschenhirn und -hand. Das bereits bestehende, reguläre Übersetzungsangebot "Google Transite" macht aus demselben Satz: "Gott falsche Fährten, erlöse uns aus dem Namensvetter." Nah dran, und komplett daneben. Aber genau das soll sich ja ändern.
In einer wissenschaftlichen Analyse haben drei von Googles Experten deshalb aufgedröselt, worauf es bei Dichtung alles ankommt: Zunächst einmal Reim, Versmaß, Silbenzahl. Wie sorgt man dafür, dass maschinelle Übersetzungen auch nur diesen Anfangskriterien genügen? Google setzt auf Masse. "Weil es sehr viele mögliche Übersetzungen gibt, darf man erwarten, dass einige von ihnen den vorgegebenen Regeln entsprechen", schreiben die drei Fachleute. Aber auch sie haben sich schon zusammengereimt, dass das eine schwierige Aufgabe wird, "vielleicht die schwerste der Computerlinguistik."
... mehr
Roboter lernt lesen wie der Mensch
08.11.2010, Informationsdienst Wissenschaft
Im Fachbereich Informatik der Fachhochschule Gelsenkirchen hat ein Roboter lesen gelernt, damit er sich in Gebäuden anhand von Türschildern orientieren kann. "Die Aufgabe war durchaus innovativ", so Prof. Dr. Hartmut Surmann, "bisher orientierten sich Roboter nämlich durchweg über Koordinatensysteme und nicht, indem sie dieselben Systeme nutzen wie wir Menschen.“
Dabei durchläuft der Roboter die gleichen Lernschritte wie der Mensch, wenn er durch Schule und Leben die Orientierung in Gebäuden lernt. Als erstes musste der Roboter speichern, woran er ein Türschild erkennt. Dann brauchte er eine Routine, mit der er beim Abfahren eines Flures die Türschilder findet. Im dritten Schritt zoomt er mit seiner Kamera auf das Türschild in Großaufnahme und fotografiert es. Als letztes kommt das eigentliche Lesen, wobei auf Standard-OCR-Programme zurückgegriffen wurde, die aus dem Bild eines Buchstabens das Verstehen eines Buchstabens und damit das Verstehen ganzer Wörter ableiten. "Anders liest auch der Mensch nicht", vergleicht Surmann, "Buchstaben sehen, Buchstaben verstehen, Buchstaben zu Wörtern zusammensetzen, Sinn ableiten, Inhalt anwenden."
... mehr
AT&T lauscht auf das Twitter-Volk
05.11.2010, heise online
Viele Firmen gehen inzwischen dazu über, die Tweets der weltweit rund 175 Millionen Nutzer systematischer auszuwerten. Meist geht es ihnen aber nur darum, wie Verbraucher über Produktmarken denken. AT&T hingegen will mit seiner selbstentwickelten Software die Stimmung in der "Tweetosphäre" möglichst exakt vermessen.
Zwar überwacht AT&T softwaregesteuert die Verbindungsqualität in seinem Netzwerk, und Kunden können Probleme einer Hotline melden. Mit dem neuen Ansatz bekomme man aber in Echtzeit wichtige Zusatzinformationen, anhand derer Wartungsarbeiten besser priorisiert werden könnten, sagt Jia Wang vom Internet and Systems Networking Research Center von AT&T. "Wir versuchen drei Dinge herauszufinden: Wo treten Probleme auf, welcher Art sind sie, und wann sind sie passiert?" sagt Wang.
... mehr
Das Netz bezahlt Rechnungen und reserviert im Restaurant
04.11.2010, golem.de
Ein Forscherteam unter Leitung von IBM hat untersucht, wie das Web in Zukunft das alltägliche Leben erleichtern kann. Ihre Ergebnisse haben die Forscher unter dem Titel "The Smart Internet" veröffentlicht.
In einer zunehmend vernetzten Welt, die durch Cloud-Dienste geprägt ist, ergeben sich neue Möglichkeiten, wie das Internet den Alltag vereinfachen kann, indem Informationen automatisch zusammengeführt und im Kontext ausgewertet werden. Die Forscher beschreiben, wie das konkret aussehen könnte. Angeführt wird beispielsweise das Bezahlen von Rechnungen oder das Filtern von Nachrichten.
Im nächsten Schritt wollen die Forscher prüfen, wie sich die Technologien kommerzialisieren lassen.
... mehr
Microsoft verstärkt sich bei Bewegungssteuerung
30.10.2010, heise online
Microsoft hat das US-Unternehmen Canesta, das sich auf die Herstellung von Chips für bewegungsempfindliche Steuerungen spezialisiert hat, gekauft. Canesta-Chef Jim Spare zeigte sich überzeugt, dass die Technologie künftig in vielen Geräten Einsatz finden werde.
Microsoft bringt gerade für seine Spielekonsole Xbox die Steuerung Kinect auf den Markt, bei der man den Spielverlauf nur mit Körperbewegungen bestimmt. Der Windows-Konzern will das Konzept in Zukunft breiter einsetzen, beispielsweise zur Steuerung von Unterhaltungsgeräten im Wohnzimmer.
Nicht nur Microsoft sieht das Potenzial der Bewegungssteuerung. Schon vor Jahren hatte Canesta die Technologie für Sonys Playstation-Kamerazusatz EyeToy geliefert. Eine Referenz für die Vision lieferte 2002 Steven Spielbergs Zukunfts-Film "Minority Report", in dem Computer mit Gesten der Hand gesteuert wurden. Der Entwickler John Underkoffler, der damals das Konzept für den Film mitentworfen hatte, versucht nun, die Technologie mit einer Firma Namens Oblong praxisfähig zu machen.
... mehr
Texterkennung - iPhone liest Texte
29.10.2010, golem.de
Mit dem OCRKit Mobile hat das Berliner Unternehmen Exactcode eine Texterkennung vorgestellt, mit der Apples iPhone zu einem Textscanner wird. Die Texterkennungs-App ist nach Angaben der Entwickler am iPhone 4 mit seiner 5-Megapixel-Kamera besser einzusetzen als bei den älteren Geräten. Aber auch am iPhone 3GS soll sie funktionieren.
Die Fotos werden direkt auf dem iPhone der Texterkennung zugeführt und nicht etwa auf den Server des Anbieters geschoben. Das sorgt dafür, dass volumenbasierte Datentarife nicht überstrapaziert werden und die Privatsphäre gewahrt bleibt. Die Texterkennung ist an Wörterbücher gekoppelt, um die Genauigkeit zu verbessern.
Die App funktioniert in angepasster Auflösung auch auf dem iPad, das mangels Kamera nur Bilder behandeln kann, die zuvor via iTunes auf das Gerät gespielt wurden.
OCRKit Mobile kann ab sofort im iTunes-App-Store für 3,99 Euro erworben werden.
... mehr
Volkswagen und SVOX entwickeln In-Car-Voice-System mit NLU
27.10.2010, SpeechTechMag
SVOX und Volkswagen wollen im gemeinsamen Forschungsprojekt "Voile Control" natürlichsprachliche Interfaces im Auto wahr werden lassen. Ziel des ambitionierten Projektes ist es, klassische Sprachbefehle und strenge Menüführungen für die Steuerung der In-Car-Funktionen durch NLU-Systeme zu ersetzen.
"Ziel unserer Bemühungen ist es, Sprachdialogsysteme einfacher und nutzerfreundlicher zu machen. Der Nutzer soll in Zukunft keine speziellen Sprachbefehle mehr erlernen müssen," erklärt Peter Oel von VW. Stattdessen sollen freie Eingaben, wie: "Ähm, ich möchte jetzt Clara Schumann anrufen" möglich sein.
Gordon Seitz, "Voice Control"-Projektleiter bei der VW, erklärt: "Natural Language Understanding wird durch eine wissensbasierte Auswertung der Benutzereingaben ermöglicht." Das System filtert die relevanten Informationen aus einer Äußerung, unabhängig vom exakten Wortlaut und der Wortstellung. Und ein Frame-basiertes Dialogsystem unterstützt den Anwender optimal, indem es nur nachfragt, wenn Informationen fehlen und zusätzliche Informationen gibt. wem das erforderlich sein sollte. Nutzer sollen damit ihre Eingaben auch frei korrigieren bzw. ändern können: "Ich möchte Clara Schumann im Büro anrufen - äh nein, ich schicke ihr lieber eine Mail."
... mehr
Neue App verbindet Social Media und Voicemail-Platform
26.10.2010, SpeechTechMag
Anana und Alcatel-Lucent haben eine Anwendung entwickelt, die traditionelle Voicemail-Plattformen mit Web 2.0 und Social Media kombiniert, so dass Anrufer nicht mehr den üblichen Voicemail-Spruch, sondern aktuelle Statusmeldungen des Angerufenen von Twitter oder Facebook zu hören bekommen. Statt: "Max Meier ist im Moment nicht erreichbar. Bitte hinterlassen Sie eine Nachricht nach dem Ton." hört der Anrufer etwas wie: "Willkommen bei Its4u. Sie können gleich eine Nachricht hinterlassen, lassen Sie uns nur kurz Twitter und Facebook checken. Twitter: 'Hallo, ich bin bis 15:30 bei einem Meeting in der Stadt' und Facebook: 'Entspannen mit der Familie am Strand' ..."
Der Angerufene muss sich somit nicht mehr um die Aktualisierung seiner Voicemail-Ansage kümmern. Per TTS können einfach Status-Updates von Facebook, MySpace, Twitter, LinkedIn und anderen Social-Networking-Seiten als Teil der Voicemail-Ansage ausgegeben werden.
Its4u nutzt die Genesys Voice Platform und das Converged Messaging System (CMS) von Alcatel-Lucent. Es unterstützt alle Kombinationen von Spracherkennungs- und TTS-Systemen führender Hersteller wie Nuance, Loquendo, AT & T oder IBM.
... mehr
Übersetzungsprogramm und mehr Transparenz für Wikipedia
22.10.2010, golem.de + Informationsdienst Wissenschaft
Microsoft hat ein browsergestütztes Übersetzungsprogramm entwickelt, das Google Translate ähnelt. Das Übersetzungswerkzeug heißt WikiBhasha und ist dafür gedacht, Artikel aus der Onlineenzyklopädie Wikipedia in andere Sprachen zu übersetzen. Das soll es ermöglichen, kleinere Ausgaben mit Inhalten zu füllen. Um einen Wikipedia-Artikel zu übersetzen, öffnet der Nutzer die Wikipedia und das Übersetzungswerkzeug. Es öffnet sich ein doppeltes Fenster - der englische Artikel und eine Übersetzung. Die kann der Nutzer nun bearbeiten: Er kann Inhalte, die in den Artikel aufgenommen werden sollen, markieren sowie die maschinell angefertigte Übersetzung sprachlich bearbeiten. Außerdem hilft WikiBhasha ihm dabei, den Artikel nach Wikipedia-Art zu gestalten.
Mit "Wiki-Watch.de" ging am 22. Oktober ein Portal für mehr Transparenz in Wikipedia online. Die von Medienrechtlern der Europa-Universität Viadrina Frankfurt (Oder) entwickelte Plattform bietet jedermann die Möglichkeit, die Verlässlichkeit von einzelnen Artikeln in Wikipedia zu überprüfen. Für eine Prüfung etwa auf Änderungen, Löschungen und Quellenbasis genügt die Eingabe des Stichwortes auf Wiki-Watch.de. Zusätzlich macht Wiki-Watch transparent, welche Artikel am meisten nachgefragt, am stärksten umkämpft oder gerade von Löschung bedroht sind. "Wikipedia ist mit mehr als 1,1 Millionen deutschsprachigen Artikeln die wichtigste Wissensressource. Zwischen 25 und 35 Millionen Mal wird sie täglich allein im deutschen Sprachraum benutzt. Da ist es für jeden Nutzer, aber auch für die Gesellschaft wichtig zu wissen, welcher der Artikel nicht der Qualität entspricht, die wir insgesamt von Wikipedia gewohnt sind, sagen die Medienrechtler Prof. Dr. Wolfgang Stock und Prof. Dr. Johannes Weberling von der Europa-Universität Viadrina, Initiatoren von „Wiki-Watch”.
... mehr
Peugeot-Fahrzeuge erhalten mobiles Internet
20.10.2010, sueddeutsche.de
Viele Peugeot-Fahrer können demnächst in ihrem Wagen mobil im Internet surfen. Der französische Autohersteller stattet zahlreiche Modelle mit einer optionalen Wifi-Box aus, die den Zugriff aufs Web ermöglicht. Damit können vier Geräte gleichzeitig online gehen. Der mobile Hotspot funktioniert sowohl im Stand und während der Fahrt. Beifahrer können so zum Beispiel auf Reisen mit einem Laptop oder Smartphone im Netz surfen.
Die Wifi-Box wird dabei je nach Modell im Gepäck- oder Innenraum montiert. Dazu gehört ein USB-Stick, den der Fahrer mit der SIM-Karte seines Internetanbieters ausstattet und über den er online geht. Wird der Internetzugang außerhalb des Wagens gebraucht, kann der Fahrer die Karte dann einfach mitnehmen.
... mehr
IBM will Social-Media-Wildwuchs lichten
19.10.2010, heise online
RSS-Reader sollten dabei helfen, einen Überblick über all das zu behalten, was täglich im Netz veröffentlicht wird. Schon bald jedoch stapelten sich tausende ungelesener Einträge. Twitter versprach dieses Problem zu lösen, indem man sich auf die Empfehlungen anderer verlassen sollte, welche Inhalte wirklich wichtig sind – doch schon bald explodierte auch die Zahl der interessanten Tweets. Nun unternimmt IBM einen neuen Anlauf, den Informationswust zu lichten: mit der Software "Sozial Lenz".
Dabei handelt es sich zunächst um ein Plug-in für das firmeninterne Netzwerk des IT-Konzerns. Es filtert aus aktuellen Einträgen die individuell wichtigen Neuigkeiten heraus. Dazu muss ein Nutzer zunächst eine "Linse" anlegen: Er listet Themen, Menschen oder Links auf, die als Filterkriterium dienen sollen. Dabei kann er auch beliebig viele solcher Filterlinsen anlegen. Social Lens listet dann die Ergebnisse auf und berücksichtigt dabei, in welcher Beziehung Inhalte und Quellen zu den Kriterien stehen.
Die Software umgehe dabei bekannte Schwächen von anderen Filtern, sagt Elisabeth Daly, die an der Entwicklung von Social Lens beteiligt war. Sie orientiere sich ganz bewusst an den vorgegebenen Themen und nicht an den Dokumenten, die ein Nutzer im Laufe der Zeit tatsächlich lese. Denn eine solche fortschreitende Personalisierung führe häufig dazu, dass sich der Filter zu stark auf einen Aspekt verenge.
... mehr
Verint bietet Tool zur Beobachtung von Social Media
18.10.2010, acquisa
Mit einem neuen Tool des Softwareanbieters Verint Systems können Unternehmen verfolgen, was im Internet über sie geschrieben wird. Impact 360 analysiert Web-Inhalte aus E-Mails, Chats und Blogs.
Die Ergebnisse des Analyse-Tools liefern Hinweise über Trends, das Verhalten der Kunden und erfasst Meinungen und Kritik zu eigenen Produkten. Damit kann es Unternehmen als eine Art Frühwarnsystem dienen, wenn es darum geht, Produkte und Dienstleistungen zu verbessern. Das Tool funktioniert proaktiv, klassifiziert die Inhalte und archiviert sie.
... mehr
Coupons auf das Smartphone
18.10.2010, Handelsblatt
Wenn es ums Sparen geht, sind die Deutschen Weltmeister. Seit 2001 das Rabattgesetz gefallen ist, ist Couponing das am schnellsten wachsende Marketinginstrument. Ob McDonalds oder Kaufhof - vor allem große Anbieter locken mit den Papierschnipseln die Kunden in ihre Läden. "Wir haben uns gedacht, von einem mobilen System, das die Coupons unterwegs auf die Handys bringt, könnten neben großen Händlern auch die kleinen Anbieter um die Ecke profitieren", sagt Frank Schleimer, Geschäftsführer von Coupies. Sie können Menschen in Nähe mit Preisnachlässen auf sich aufmerksam machen.
"Im Gegensatz zu Papier-Gutscheinen sparen die Firmen beim Einsatz unserer elektronischen Coupons nicht nur die Druck- und Vertriebskosten, sondern sie können ihre Zielgruppen wesentlich genauer ansprechen", sagt Schleimer, der sich bei Coupies um den Vertrieb kümmert.
Ein Stadtplan auf dem Display zeigt alle Rabattaktionen in der unmittelbaren Nähe. Alternativ kann der Nutzer aber auch gezielt nach Angeboten suchen. Um einen Rabatt einzulösen, zeigt man den Coupon auf dem Smartphone an der Kasse des beteiligten Händlers oder Restaurants vor und erhält anschließend den vergünstigten Preis.
... mehr
Lernsystem Babbel: Aussprachetraining jetzt auch auf dem iPhone
12.10.2010, ptext.de
Das Online-Lernsystem Babbel bringt die Spracherkennung jetzt auch für die eigenen Sprach-Apps für iPhone, iPod touch und iPad. Mit dem Babbel Mobile - Vokabeltrainer können die Nutzer ihre Aussprache nun bequem überall testen und trainieren. Technologisch steckt hinter dem neuen Audio-Tool eine Echtzeit-Analyse der Aussprache. Alle Facetten des Sprechens werden ausgewertet und der Nutzer erhält sofort eine Rückmeldung, wie gut seine Aussprache ist. Die sieben Babbel Sprach-Apps sowie ab sofort auch der gesamte Grund- und Aufbauwortschatz von 3.000 Vokabeln mit Bildern und Beispielsätzen stehen kostenlos zum Download im App Store zur Verfügung.
Und so funktioniert die Spracherkennung: Der Sprachlerner spricht einzelne Wörter oder ganze Sätze nach. Der von Babbel entwickelte Algorithmus gleicht die Aussprache des Benutzers mit der Vorlage des Muttersprachlers ab. Der Nutzer erhält sofort eine Bewertung.
"Die Spracherkennung als mobile Anwendung ist ein weiterer technologischer Meilenstein für unser Lernsystem", so Markus Witte, Geschäftsführer von Babbel. "Wir achten nicht nur inhaltlich auf höchste Qualität, sondern auch technisch. Bei aller Raffinesse bleibt die Nutzung aber immer einfach - schließlich soll man möglichst schnell und einfach eine Sprache lernen."
... mehr
Fußgängernavigation mit LEDs
04.10.2010, heise online
Forscher der University of Electro-Communications in Tokio haben ein neuartiges Navigationsgerät entwickelt, das der Nutzer aufsetzen kann. Das sogenannte Wearable Personal Navigation System (WSNS) soll Fußgängern den Weg weisen und steckt komplett in einer regulären Brille.
Das System beinhaltet einen GPS-Empfänger zur Positionsbestimmung, einen kleinen Richtungssensor mit Kompass, einen Miniaturcomputer und eine Batterie. Auf einen vollwertigen Bildschirm verzichtete die Forschergruppe allerdings, stattdessen sind um die Gläser herum ringförmig einfache LED-Lichter angebracht.
Um das WSNS zu nutzen, gibt der Träger zunächst sein Ziel ein. Dazu nutzt er beispielsweise ein Smartphone, das drahtlos mit der Brille in Verbindung steht. Das System bestimmt dann nicht nur den aktuellen Ort des Benutzers, sondern auch die Richtung, in die er seinen Kopf hält. Geführt wird er anschließend allein über rote und grüne LEDs, die er über sein peripheres Sehen wahrnimmt.
... mehr
Tablet-Rückseite als Eingabefläche
30.09.2010, heise online
So schön neue elektronische Lesegeräte wie Apples iPad oder Samsungs Galaxy Tab zum Medienkonsum auch sein mögen – wenn es darum geht, Texte einzugeben, wird es im Vergleich zu regulären Laptops mit der Tastatur schnell schwierig. Kann man sich bei Smartphones mit Touchscreen aufgrund der geringen Größe noch ans Tippen "ins Nichts" gewöhnen, sind Tablet-Rechner schlicht zu groß, um nur mit den Daumen ein virtuelles Keyboard zu bedienen. Forscher bei Microsoft Research arbeiten an einer neuen Methode zur Texteingabe bei Tablet-Computern. "Reartype" genannt, nutzt die Technik jenen Bereich der Hardware, der bislang noch brachliegt: Die Rückseite des Displays. Die umklammert der Nutzer sowieso ständig, um den Bildschirm-Rechner zu halten. Die dort platzierten Finger bringt Reartype nun in Aktion.
Das Prototyp-Modell ist technisch eher einfach gehalten: Auf der Rückseite des Tablets befindet sich eine zweigeteilte Hardware-Tastatur, deren Bedienung an das Spielen eines Akkordeons erinnert. Auf der Vorderseite sind weitere Tasten angebracht, die zur Navigation dienen, beispielsweise Cursor- und Leertasten.
... mehr
Werkstätten finden mit der Kfz-mobile-App
26.09.2010, Computerbild.de
Die Berliner Agentur die_schnittsteller hat eine iPhone-App für Autofahrer entwickelt: "Kfz mobile" hilft ihnen bei der Suche nach einer geeigneten Autowerkstatt. Aktuell gibt es die kostenlose App nur für das iPhone. Eine Android-Version ist aber bereits in Vorbereitung. Die Anwendung liefert eine Übersicht an Meisterbetrieben der Kfz-Innung. Mit Filterfunktionen sortieren Sie die Einträge nach Kategorien wie Automarken oder Serviceleistungen. Werkstätten für Motorräder und Nutzfahrzeuge sind ebenfalls im Verzeichnis der App enthalten. Auf www.kfzgewerbe.de/app steht die Applikation zum Download bereit. Werkstattbesitzer können die Seite auch nutzen, um sich in die App eintragen zu lassen.
... mehr
o2 startet mobilen Schriftdolmetschdienst Verbavoice für Hörgeschädigte
25.09.2010, heise online
Im Rahmen einer konzernweiten "e-Accessibility-Initiative" hat o2 einen Online-Shop für Hörgeschädigte gestartet. Dieser bietet neben geeigneten Mobiltelefonen und Informationen zu Mobilverträgen in Gebärdensprache einen für den Alltag hilfreichen Schriftdolmetsch-Dienst namens Verbavoice an. Der Service für Hörgeschädigte wurde in Zusammenarbeit mit dem Deutschen Gehörlosen-Bund und der Stiftung Pfennigparade entwickelt.
Die von Verbavoice entwickelte mobile Plattform funktioniert nach dem Prinzip, dass registrierte Hörgeschädigte einen Termin für einen Schriftdolmetscher anmelden und dabei mitteilen, wie lang der Termin dauert und welche Fachrichtung oder Fachtexte zur Vorbereitung auf den Termin wichtig sind. Nach einer Prüfung, welcher Kostenträger den Termin übernimmt, wird der Auftrag auf der Plattform ausgeschrieben und der erste sich meldende Schriftdolmetscher erhält den Zuschlag.
Der Schriftdolmetscher arbeitet mit einer Mischung aus Speech to Text-Software, Tastaturkürzeln und Diktatsoftware und liefert ein verschriftlichtes Ergebnis in Echtzeit zurück, das über eine Web-Anwendung auf dem Mobiltelefon oder aber auf einem Netbook gelesen werden kann, welches wiederum via UMTS oder WLAN einen Internet-Zugang hat.
... mehr
Arcplan und Infospeed entwickeln Data-Mining-Tool
23.09.2010, acquisa
Der Anbieter von Business-Intelligence-Lösungen, Arcplan und Infospeed, Entwickler von Social-Media-Monitoring-Tools, arbeiten künftig bei der Entwicklung von BI- und Webmonitoring-Lösungen zusammen. Mit den dadurch gewonnenen Informationen können Unternehmen Inhalte aus Web-Netzwerken mit Kennzahlen verbinden und diese analysieren.
Die von Infospeed entwickelte Suchtechnologie W2m ist in der Lage, sämtliche Daten aus Social-Media-Quellen wie Blogs und Foren zu generieren. Mit dem Tool Arcplan Enterprise können diese Informationen mit den Unternehmensdaten verknüpft werden und in die Unternehmenssteuerung mit einfließen.
... mehr
Freie Sprachsoftware für Rechner und Roboter
21.09.2010, Futurezone
Ein Roboter, der auf Befehle hört, das Mittagessen serviert und auch für einen Smalltalk zu haben ist: Das ist das Ziel des EU-Projekts Astromobile. Für die Kommunikation stellt der steirische Verein für Forschung und Lehre, "simon listens", die freie Spracherkennungssoftware "Simon" zur Verfügung. Sie ist zwar nicht so gut für Diktate geeignet wie ihre kommerziellen Pendants, dafür kann sie sich sehr gut an die Bedürfnisse von Menschen mit Sprachproblemen anpassen.
"'Simon' ist nichts anderes als ein Maus- und Tastaturersatz", erklärt Franz Stieger, Projektverantwortlicher von "simon listens". Ursprüngliche Idee war, spastisch gelähmten Kindern die PC-Nutzung zu ermöglichen. Mit Unterstützung durch das Framework "Simon" können sie allein durch Spracheingabe E-Mails schreiben, im Internet surfen und via Skype telefonieren.
"Wenn die Spracherkennungssoftware sehr generell ist, ist die Fehlerquote noch zu hoch", erklärt Stieger. So funktioniere etwa "Naturally Speaking" von Dragon zwar für "normal Sprechende gut", doch für Spastiker sei sie nicht anwendbar, da diese oft eine zu undeutliche Aussprache hätten. Die Konkurrenzprodukte zur Spracherkennung seien zudem auf Zielgruppen wie Ärzte, Rechtsanwälte und Notare abgestimmt. Nachdem sich die Formulierungen in diesen Berufsgruppen häufig wiederholen würden, funktioniere das Diktationsmodell hier relativ gut.
... mehr
Heimautomatisierung - iPad-Überzieher mit Zusatzbuttons
17.09.2010, golem.de
Der Grundgedanke ist: Wenn mit dem iPad ein berührungsempfindliches Gerät mit WLAN im Haushalt ist, benötigt der Kunde keine zweite Fernsteuerung mit Display, über das die Heimautomatisierungstechnik gesteuert wird. Schließlich sind diese Geräte recht teuer, vor allem wenn sie mit Farbdisplays ausgerüstet sind. Das Multitouch-Display des iPad hat bei der Heimautomatisierung aber den Nachteil, dass virtuelle Bedienelemente nicht erfühlt werden können. So muss der Anwender stets einen Blick auf das Interface werfen, um die richtige Stelle zu treffen.
Bei Crestrons iPanel sollen deshalb zusätzliche Knöpfe den Bedienkomfort erhöhen. Neben Lautstärkereglern sind links drei Knöpfe unter anderem für die Tonabschaltung und das Licht vorhanden, während rechts ein Steuerkreuz sowie drei weitere Knöpfe eingelassen sind.
Das Crestron iPanel soll rund 500 US-Dollar kosten. Wann es auf den Markt kommt, ist noch nicht bekannt.
... mehr
Telenet: Das User Help Desk lernt sprechen
16.09.2010, Telenet
"Telenet Issue Tracking" eignet sich sowohl für den Einsatz im internen User Help Desk als auch im Kundenservice und Produkt-Support. Anrufer können in einem geführten Sprachdialog ihr Ticket direkt anlegen und sparen sich somit den Umweg über den Agenten. Durch die Integration in ein vorhandenes Issue Tracking System wird das Ticket direkt in der zentralen Datenbank angelegt, von wo aus es vom verantwortlichen Sachbearbeiter abgerufen werden kann. Der Anrufer wird auf Wunsch telefonisch, per E-Mail oder SMS über den Bearbeitungsstatus seines Tickets auf dem Laufenden gehalten.
Die Anwendung ist mehrmandantenfähig und lässt sich aufgrund des verwendeten Frameworks Voice4J in jede ITK-Umgebung integrieren. Optional lässt sich die Anwendung um weitere Features wie z.B. Passwort-Reset per sprachbiometrischem Verfahren oder Volltextverschriftung der Freitextaufnahmen erweitern, wodurch Ticketing-Prozesse fallabschließend automatisiert werden können.
... mehr
Kontextbezogenes Computing - Die Maschine denkt mit und sagt, was zu tun ist
15.09.2010, golem.de
In Zukunft sollen Smartphones mitdenken. Dabei geht es darum, Daten, die ohnehin schon verfügbar sind, zu verknüpfen und zueinander in Beziehung zu setzen. Dieses "context aware computing" will Intel verstärkt erforschen. Neben den harten Daten, die mobile Geräte unterwegs erfassen, sollen dabei auch die weichen Daten einbezogen werden, also zum Beispiel die aus sozialen Netzwerken. Intel stellt sich das so vor: Wenn sich Freunde mit bestimmter Musik wohlfühlen - das sollen die Geräte anhand von Körperdaten erkennen - , schlägt das System diese Songs auch anderen vor.
Die Erfassung von Daten des menschlichen Körpers soll auch Unfälle vermeiden. Gedacht ist es für Senioren, bei denen ein Sturz im eigenen Heim die Unfallursache Nummer eins ist. Einem Stolpern gehen aber meist schon einige unsichere Schritte voraus, so dass der Computer dann sagen kann: Bleib stehen, dir geht es nicht gut, setz dich lieber hin.
Noch persönlichere Daten als den Gesundheitszustand gibt es kaum noch - daher müssen sie besonders gut geschützt werden. Daher sollen Daten, die kontextbezogene Rechner erfassen, von den Anwendern selbst kategorisiert und gezielt freigegeben werden können.
... mehr
Roboter unterstützt ältere Menschen bei Kommunikation
14.09.2010, Informationsdienst Wissenschaft
Wissenschaftler der Technischen Universität München (TUM) wollen den Helfer ALIAS (Adaptable Ambient Living ASsistant) so ausrüsten, dass er selbst komplexe Medien einfach nutzbar macht. Das Ziel: Auch wenn sie ans Haus gebunden sind, sollen ältere Menschen ihre sozialen Kontakte aufrechterhalten und so Isolation verhindern sowie kognitive Fähigkeiten trainieren können.
"Ruf meine Tochter an!" Vielleicht hat der ältere Mann die Nummer vergessen oder das Telefon verlegt, vielleicht ist er aber auch gestürzt und kann sich nicht selbst helfen. ALIAS wird das egal sein – er hilft in jedem Fall. Denn der Roboter versteht den Senior und stellt die Verbindung zur gewünschten Kontaktperson her. Heute ist ALIAS eine Figur mit Kopf, Rädern und PC. Damit er tatsächlich zur häuslichen Hilfskraft wird, werden ihn die TUM-Forscher in den nächsten Jahren mit Software und Bedienelementen ausrüsten.
ALIAS soll nicht nur Telefonanrufe ermöglichen. Auch in Chats und sozialen Netzwerken sollen sich die Nutzer bewegen können. Eine E-Card zu verschicken oder sich in einem Online-Spiel zu messen, wird ebenfalls kinderleicht sein. Und auf Zuruf liest ALIAS aus der Zeitung vor oder übersetzt aus anderen Sprachen. Möglich machen soll die einfache Bedienbarkeit unter anderem ein Spracherkennungssystem und ein Touch Screen mit großen Feldern.
... mehr
Kein weißer Fleck mehr - Internet im Auto für jedermann geplant
08.09.2010, LVZ online
Im Büro, daheim und sogar beim Spaziergang sind immer mehr Menschen online. Nur im Auto fehlt bislang der mobile Zugang zum Internet. Der Automobilzulieferer Continental und die Deutsche Telekom wollen diese Lücke nun mit dem Kommunikationsnetzwerk "AutoLinQ" schließen. Somit können Fahrzeuge über eine Mobilfunkverbindung überall mit dem Handy, dem heimischen Computer, Online-Datenbanken und Mehrwertdiensten im Stil der Apps vernetzt werden. Dabei sollen nicht nur Standard-Prozesse wie das E-Mailen während der Fahrt möglich sein. Wer die neusten Schlagzeilen hören möchte, hat dazu per Sprachsteuerung ebenfalls Gelegenheit. Somit könne die Fahrt zum Büro optimal genutzt werden, indem man zum Beispiel aktuelle Brancheninformationen abrufe, sagt Sten-Olaf Wilkening von Continental. Weiter ist die Online-Suche nach bestimmten Themen oder Begriffen ebenso das Ziel wie die Musikerkennung.
... mehr
Das Handy als Infopoint und Navigator
06.09.2010, Informationsdienst Wissenschaft
Im Rahmen des Forschungsprojektes "MIP – Mobile Information Point", das von der Technischen Universität Wien gemeinsam mit den großen österreichischen Verkehrsunternehmen, Mobilfunkunternehmen und anderen Partnern aus der Wirtschaft durchgeführt wird, wird daran geforscht, wie Fahrgäste in öffentlichen Verkehrsmitteln künftig Informationen neuartig, rasch und barrierefrei abrufen können. In den Bahnhöfen Krems und Baden bei Wien sind bereits intelligente, interaktive Poster (Vorstufen zu interaktiven Anzeigetafeln), sogenannte Mobile Information Points, angebracht. Ein MIP belädt bei aktiver Berührung mit dem Fahrgasthandy das Mobiltelefon mit den aktuellen lokalen Reiseinformationen. Derartige Informationen, etwa über die nächsten ankommenden und abfahrenden Züge und Busse, Echtzeitauskunft und die barrierefreie Abfrage, sind für Fahrgäste des Öffentlichen Verkehrs von hohem Wert.
... mehr
Neuer CRM-Navigator bildet Prozesse im Bereich Kundenmanagement ab
30.08.2010, Informationsdienst Wissenschaft
Wer im Dschungel von Kundeninteressen, Vorlieben und spezifischen Bedürfnissen die Orientierung bewahren will, braucht einen zuverlässigen Navigator, der bei der Optimierung der Beziehungen zwischen Unternehmen und Kunden hilft. "In zahlreichen Praxisprojekten und Unternehmenseinsätzen haben wir wiederholt festgestellt, dass Unternehmen daran scheitern, langfristig profitable Kundenbeziehungen herzustellen", berichtet Prof. Christian Gündling von der Jade Hochschule in Wilhelmshaven. Prof. Christian Gündling und sein wissenschaftlicher Mitarbeiter Rico Meiner vom Fachbereich Management, Information und Technologie arbeiten an der Software "CRM-Navigator". Dieser hilft kleinen und mittelständischen Unternehmen, Prozesse im Bereich Kundenmanagement abzubilden. Zudem gibt es Tools, um das eigene Unternehmen beispielsweise auf Schwächen und Stärken zu durchleuchten.
... mehr
Wie Mensch und Roboter kooperieren können: Ein neuer Ansatz zur Intentionserkennung
30.08.2010, golem.de
In vielen Lebensbereichen, von der industriellen Produktion bis zur Chirurgie, leisten Roboter unentbehrliche Dienste. Die Zahl der Einsatzmöglichkeiten steigt ständig. Wie kann die Zusammenarbeit von Menschen und Robotern weiter optimiert werden? Weltweit arbeiten Forschungsteams an Systemen, die Roboter in die Lage versetzen, die Absichten von Menschen möglichst frühzeitig und möglichst zuverlässig zu erkennen. Denn sobald Roboter zu einer solchen Intentionserkennung fähig sind, müssen sie nicht auf per Knopfdruck erteilte Befehle warten, um den Menschen zuarbeiten zu können. Sie sind dann imstande, gleichsam aus eigener Initiative dazu beizutragen, dass die Menschen die angestrebten Ziele erreichen.
... mehr
Start-up analysiert Netzwerktrends
27.08.2010, heise online
Immer mehr Firmen nutzen mittlerweile Social-Media-Angebote, um das Potenzial neuer Produkte oder Dienstleistungen abzuschätzen. Die Firma Viralheat bietet nun Echtzeitdaten an, die die Haltung der Nutzer zu bestimmten Themen oder Produkten darstellen. Einer der ersten Kunden des "Social Trends" genannten Dienstes ist der US-Sportsender ESPN: Er will die Technik nutzen, live zu ermitteln, wie die Nutzer gerade zu bestimmten Football-Teams stehen. Viralheats Algorithmen stammen aus dem Bereich des maschinellen Lernens und können natürliche Sprache analysieren. Für Social Trends durchsucht werden aktuell Twitter, Facebook-Fan-Seiten, Videoangebote, die sich auf virale Clips spezialisiert haben, sowie Googles Kurznachrichtendienst Buzz.
... mehr
Spracherkennungs-Apps für iPhone und iPad
27.07.2010, heise online
Mit Dragon Dictation von Nuance lassen sich Texte auf dem iPhone, iPod Touch und iPad diktieren. Der Anwender kann die Texte anschließend per Mail verschicken oder in die Zwischenablage einfügen, um sie in beliebigen Anwendungen weiter zu verwenden. Ebenso kann er den Inhalt direkt auf Facebook oder Twitter veröffentlichen.
Die App dient lediglich der Datenübermittlung. Die eigentliche Spracherkennung findet – wie bei Android-Telefonen – auf einem Server statt. Bei der Umsetzung der Audio-Daten auf dem Nuance-Server werden keine individuellen Sprecherprofile angelegt. Wie bei vergleichbaren Desktop-Anwendungen müssen Satzzeichen und Anweisungen wie "Neuer Absatz" beim Diktieren mitgesprochen werden, falls man auf ein grammatisch korrektes, gut lesbares Ergebnis Wert legt.
Dragon Search für iPhone und iPod Touch schickt diktierte Suchanfragen an diverse Suchmaschinen. Derzeit nutzt die Lösung Google, Yahoo!, Wikipedia, iTunes, YouTube und Twitter.
Laut Nuance werden beide Anwendungen vorübergehend kostenlos im deutschen App Store verfügbar sein. Wie lange es die Diktier-Apps gratis geben wird, steht nicht fest: Nuance nennt keinen konkreten Termin für eine kostenpflichtige Version, behält sich aber je nach Entwicklung des Geschäftsmodells Änderungen vor. Bereits heruntergeladene Apps sollen auf jeden Fall kostenfrei bleiben. Im Laufe des Jahres soll laut Hersteller eine achtsprachige Lösung von Dragon Dictation herauskommen.
... mehr
Windows Phone 7 mit Spracherkennung von TellMe
26.07.2010, winfuture
Microsofts neues Smartphone-Betriebssystem Windows Phone 7 wird mit einer weiteren Funktion daher kommen: Spracherkennung. Laut Microsoft-Spezialist Paul Thurrott basiert die Spracherkennung auf der Technologie von TellMe, die Microsoft im Jahr 2007 gekauft hatte. Sie unterstützt neben der reinen Spracherkennung auch bestimmte Kommandos, mit denen Anrufe gestartet, Musikstücke gewählt und lokale Suchanfragen durchgeführt werden können. Dem Vernehmen nach kann die Spracherkennung von jedem Punkt im Menü aus genutzt werden, wobei sie abgesehen von den Telefonfunktionen noch recht einfach umsetzt wurde. So lässt sich in den meisten Fällen nur jeweils eine Aktion per Sprache ausführen, bevor dann nach dem Start der gewünschten Anwendung wieder per Touch gearbeitet werden muss.
Um die Spracherkennung zu starten, muss der Anwender den Start-Button ungefähr zwei Sekunden lange gedrückt halten. Die Sprachsteuerung funktioniert auch bei der in Windows Phone 7 enthaltenen Bing-Suchanwendung. Bei ersten Tests funktionierte das Ganze laut Thurrott bereits sehr gut.
... mehr
The Label Finder: Der mobile Shoppingbegleiter
25.07.2010, Mobile Highlights
"The Label Finder" erkennt den Standort des Nutzers und zeigt ihm alle Shops in der Umgebung. Zudem bekommt er Informationen über die Labels, die in den jeweiligen Geschäften angeboten werden. Es kann auch direkt nach einer beliebigen Marke gesucht und eine Übersicht aller Läden, die Klamotten dieses Labels vertreiben, erstellt werden. Bei einem Klick auf den Standort bekommt man weitere Infos über Öffnungszeiten und eine kurze Beschreibung des Shops. Über die App kann direkt ein Kontakt mit dem jeweiligen Laden aufgebaut werden. Wer neue Labels entdecken möchte, bekommt über den Shuffle-Modus der Anwendung immer neue Marken mit ihrer Kurzbeschreibung angezeigt und kann dann nach Shops in der Nähe suchen. Die Anwendung der Alazar GmbH & Co. KG für iPhone, iPod Touch und iPad ist allerdings für das neue Betriebssystem iOS 4.0 konzipiert und steht in Apples App Store kostenlos zur Verfügung.
... mehr
Der Kugelschreiber mit Kamera und Mikrofon
22.07.2010, golem.de
Livescribes Echo Smartpen ist ein etwas füllig wirkender digitaler Kugelschreiber. Hauptzweck des Geräts ist es, Notizen zu machen - und zwar mit einer gewöhnlichen Kugelschreibermine. Das Besondere sind die vorn angebrachte Kamera, die das Geschriebene aufzeichnet, und das Mikrofon, das gleichzeitig den Ton aufzeichnet. Für Aufzeichnungen hat der getestete Stift 8 GByte Flash-Speicher. Mit dem Speicher sollen bis zu 800 Stunden Aufnahme möglich sein - mehr als genug für ein paar Wochen Vorlesungen an der Uni.
Der Clou ist die Möglichkeit, im Text zu navigieren. Schreibt der Nutzer etwa während einer Vorlesung mit, kann auch der Ton aufgezeichnet werden. Wer will, tippt dann kurz an die Stelle der Notizen, und der kleine Stift spielt den Ton ab, der genau zum Zeitpunkt des Schreibens aufgezeichnet wurde. Das ist vor allem bei schnell geschriebenen Notizen praktisch, die der Schreiber anschließend eventuell nicht mehr entziffern kann. Die unklare Stelle wird einfach angetippt, und schon hört der Nutzer, was der Vortragende zu dem Zeitpunkt gesagt hat, als er möglicherweise zu sehr mit dem Notieren beschäftigt war.
Die gesammelten Informationen, also der geschriebene Text und die Tonaufnahmen, können später mit dem Computer synchronisiert werden - als zusätzliches Backup der Zettelwirtschaft sozusagen. Auch auf dem Desktop lassen sich die Notizen samt Tonaufzeichnungen gut verfolgen.
... mehr
Ford zeigt erstes Twitter-Auto der Welt
21.07.2010, NeueNachricht
Ein innovatives Projekt des US-Autokonzerns Ford, der kürzlich das erste twitternde Auto der Welt vorgestellt hat, zeigt, dass sich die enorme Nachfrage nach Social-Media-Diensten wie Facebook oder Twitter auf die unterschiedlichsten Branchen auswirkt und die Hersteller in diesem Bereich bereits mit Hochdruck daran arbeiten, ihre Produkte für die moderne Internetgesellschaft interessanter zu gestalten.
"Es wird langsam dunkel, Zeit die Frontscheinwerfer einzuschalten", lautet eine typische Twitter-Meldung, die der von Ford präsentierte Prototyp an seine 588 Follower auf dem Community-Portal verschickt. Der Ford Fiesta, der vom US-Unternehmen liebevoll "AJ" getauft worden ist, soll den hauseigenen Ingenieuren als Testplattform dienen, um das Potenzial der Integration von Internettechnologien bei der Autokonstruktion auszuloten. Die Implementierung von Twitter ist dabei nur der erste Schritt, in Zukunft sollen weitere Services wie etwa Geolocation-Dienste folgen, die den jeweiligen Fahrer beispielsweise automatisch zu Online-Kontakten lotsen können.
... mehr
System gehorcht auf Fingerzeig – Softwaresteuerung durch Gesten
13.07.2010, Informationsdienst Wissenschaft
Fraunhofer FIT hat ein System zur berührungslosen Bedienung durch Gestenerkennung realisiert, das Hand- und Fingerstellungen des Benutzers in Echtzeit erkennt und in entsprechende Befehle übersetzt. Das System kommt ohne Spezialhandschuhe und Marker aus und ist obendrein Multi-Touch und Multi-User tauglich. Unter Multi-Touch versteht man in diesem Zusammenhang, dass mehrere Finger beider Hände gleichzeitig das Objekt "berühren" und durch Bewegungen oder Gesten manipulieren können. In unserem Falle Hand- und Fingergesten in der Luft, die das System erkennt und entsprechend interpretiert.
Im FIT-Prototyp werden in Echtzeit Hände und Finger der Benutzter in den Bilddaten einer 3D-Kamera erkannt und die Bewegungen mitverfolgt. Die 3D-Kamera arbeitet nach dem Laufzeitverfahren (TOF-Prinzip). Sie misst für jeden Bildpunkt, wie lange das Licht bis zum gefilmten Objekt und zurück benötigt, und ermittelt so die Distanz.
... mehr
Google will Parkplatzsuche in Großstädten vereinfachen
12.07.2010, golem.de
Mit einer speziellen Android-Software will Google die Suche nach freien Parkplätzen vor allem in Großstädten vereinfachen. Die Idee hinter Open Spot ist, dass sich Anwender gegenseitig informieren, wo es freie Parkplätze gibt. Autofahrer können mit einem Knopfdruck mitteilen, wenn sie einen Parkplatz freigeben. Aber sie können auch einen freien Parkplatz melden, den sie beim Vorbeilaufen bemerken. Die freien Parkplätze erscheinen dann bei anderen Open-Spot-Nutzern auf einer Karte im Umkreis von rund 1,5 km.
Der ehrgeizige Ansatz setzt voraus, dass möglichst viele Anwender den Dienst nutzen. Allerdings bleibt generell das Problem, dass der Parkplatz schon weg sein kann. Denn gerade in Gegenden mit nur wenigen Parkplätzen bleiben sie oftmals nur wenige Sekunden frei. Zur Größe der Parklücke macht die Software keine Angaben. Mit speziellen Mechanismen soll Open Spot falsch gemeldete Parkplätze erkennen und nicht anzeigen. Google machte allerdings keine Angaben dazu, wie solche Falschmeldungen erkannt werden können.
Open Spot ist vorerst nur für Smartphones verfügbar, auf denen mindestens Android 2.0 läuft. Die Software ist Bestandteil von Google Labs und befindet sich noch im Experimentierstadium. Der Dienst ist derzeit nur in den USA, in Kanada und den Niederlanden nutzbar. Ob die Software später für Deutschland angeboten wird, ist nicht bekannt.
... mehr
VoiceFlash-Premiere: Erste sprachgesteuerte Webanwendung in der Hotellerie
12.07.2010, Pressemitteilung WebService
Das MAVIDA Balance Hotel & Spa präsentiert sich künftig online mit einem interaktiven Video-Interface. Zum ersten Mal in der Hotellerie kommt darin VoiceFlash zum Einsatz. Mit der von .dotkomm rich media solutions und MATERNA Communications entwickelten Technologie steuert der Nutzer das gesamte Interface interaktiv mit seiner Stimme. Die Maus hat ausgedient, die Spracheingabe erfolgt über ein handelsübliches Headset oder das Notebook-Mikrofon. Auf der Startseite von www.mavida.at begrüßt Hotelinhaberin Ilona Hagleitner persönlich ihre Gäste. Sie tritt in direkten Dialog mit dem Besucher und führt ihn gezielt durch das Angebot des Hotels, das der Kunde per Spracheingabe ansteuern kann.
"In der Hotellerie ist es entscheidend, den Kunden emotional anzusprechen, um ihn vom Angebot zu überzeugen. Mittels VoiceFlash entsteht ein persönlicher und individueller Dialog, Grundvoraussetzung für eine sehr gute Conversion im Online-Kanal", so .dotkomm-Geschäftsführer Ralf Pispers.
... mehr
MIT-Forscher erfinden unsichtbare Maus
09.07.2010, heise online
Wenn es nach Wissenschaftlern am Media Lab der US-Hochschule MIT geht, kommt bald ein neues Eingabesystem für PCs auf den Markt: die unsichtbare Maus. Dabei handelt es sich um eine Kombination aus einem Infrarot-Laser und einer dafür passenden Kamera, die die Bewegungen der Hand des Nutzers aufzeichnet. Dabei bewegt man sein Greiforgan genauso, wie man das von gewöhnlichen Hardware-Nagern gewohnt wäre – nur dass dieser eben nicht mehr vorhanden ist. Schiebt man die Hand nach links, wandert der Mauszeiger nach links, schiebt man sie nach rechts, oben oder unten, folgt er auch diesen Bewegungen. Auch für das Klicken gibt es Gesten: Dazu muss man nur seinen sonst auf dem Tisch ruhenden Zeigefinger kurz heben und wieder absenken.
Noch ist das "Mouseless" genannte Projekt in einer frühen Phase. Projektleiter Pranav Mistry, Forschungsassistent und Doktorand am Media Lab, der vor seinem Gang ans MIT bei Microsoft an neuen Nutzerschnittstellen arbeitete, glaubt aber an eine schnelle praktische Umsetzung. Beim aktuellen Prototyp sitzt der Laser neben der Tastatur eines Laptops, die Kamera ist wiederum am Deckel montiert. Beides ist nicht besonders elegant, ließe sich aber sehr einfach miniaturisieren.
... mehr
Smartphone-Apps einfach selbst erstellen
09.07.2010, Informationsdienst Wissenschaft
Mit dem E-Composer von Fraunhofer ESK lassen sich mobile Applikationen erstellen ohne zu programmieren. Text, Audio und Video werden mit einem Baukastensystem individuell zu einer Anwendung zusammen gestellt. Dabei können die vom Handy erfassten Sensordaten, z.B. der jeweilige Standort, in die App einbezogen werden. Der E-Composer generiert die eigene Applikation wahlweise in Flash oder HTML 5 und macht sie damit automatisch für alle gängigen Smartphones kompatibel.
Smartphone-Apps sind keine Spielerei, sondern ein großes Potenzial für das mobile Marketing. Deshalb nutzen immer mehr Unternehmen die kleinen Helfer, sei es um die Kundenbindung zu stärken oder neue Kunden zu gewinnen. Die passende Applikation ist jedoch nicht immer verfügbar und die Anstellung eines Programmierers ist kostspielig. Mit dem E-Composer kann jeder seine eigene Applikation erstellen. Der Nutzer muss lediglich wissen, welche Inhalte die Apps enthalten und wie sie vermittelt werden sollen.
... mehr
Twitter-Nachrichten offline durchsuchen
29.06.2010, Futurezone
"Wir haben beobachtet, dass der Output von Twitter nur dann sinnvoll erscheint, wenn er später wieder nutzbar wird", so Martin Ebner, Abteilungsleiter für Vernetztes Lernen am Zentralen Informatikdienst der TU Graz. Als Beispiel hierfür nennt Ebner etwa Kurznachrichten, die auf Konferenzen verschickt werden. Diese würden nur dann einen Mehrwert erhalten, wenn man die Links, die man im Zuge dessen gesammelt hat, oder die Statements, die man sich notiert hat, erhalten bleiben. Mit Grabeeter wurde daher auf der TU Graz ein Dienst entwickelt, mit dem sich eigene Tweets und Nachrichten von einzelnen, bei Grabeeter registrierten Nutzern lokal speichern und offline durchsuchen lassen. Mittels Hashtags können zudem Ereignisse, Themen und Veranstaltungen gesucht, wiedergefunden und sortiert werden.
Grabeeter hat dazu auch einen speziellen Client in JavaFX implementiert, der plattformunabhängig läuft und im Hintergrund aktualisiert werden kann. Im Client lassen sich Nachrichten auch für einen bestimmten, begrenzten Zeitraum durchsuchen. Neben dem Client gibt es zudem ein Web-Interface, das für die Suche verwendet werden kann. Die Nachrichten können in XML und JSON exportiert werden.
... mehr
Automatisierte PC-Hilfe
28.06.2010, heise online
"Antifrustrations-Software" nennt Soluto das System, das Konflikte zwischen Computer-Hardware, Anwendungsprogrammen und Betriebssystem erkennt und dem User Problem-Lösungen bereitstellt. Hat der Benutzer beispielsweise Schwierigkeiten mit einer nur noch träge reagierenden Tabellenkalkulation, kann das System des Start-ups direkte Hilfestellungen geben. Es empfiehlt z.B., die leistungshungrige Aktualisierung der Virenschutzdatenbank, die ausgerechnet am arbeitsreichen Nachmittag abläuft, in den Abend zu verschieben.
Lösungen liefert das System dabei nicht nur über einen eigens entwickelten Entstör-Algorithmus, sondern schöpft auch aus einer Datenbank früherer Erfahrungen. Diese wurden auf den Rechnern anderer Nutzer gewonnen und gesammelt. Die Software kann dabei beispielsweise erkennen, welche Einstellung ein User vorgenommen hat, um ein bestimmtes Problem zu beheben und dann Empfehlungen auf den Rechnern anderer Nutzer mit ähnlichen "Krankheitsbildern" anzeigen. "Millionen PCs bei Millionen Nutzern leiden zwangsläufig unter ähnlichen Problemen. Wenn nur 10.000 Personen den gleichen Stress haben, finden wir Methoden, diese zu beheben", erläutert Gründer Tomer Dvir.
... mehr
Online-Lernsystem Babbel führt Spracherkennung ein
23.06.2010, ZDNet
Der Fremdsprachenlerndienst Babbel hat sein System um ein Spracherkennungs-Tool erweitert. Mit der Audio-Analyse können Nutzer ihre Aussprache testen. Das System erkennt Akzent, Betonung und Wortmelodie. Babbel-Nutzer können so ihre Aussprache trainieren, um sich auf Konversationen im Alltag vorzubereiten. Das Audio-Tool erkennt einzeln gesprochene Wörter und ganze Sätze. Der Nutzer erhält eine Bewertung auf einer Skala von 0 bis 100. Ab 50 Punkten ist die Aussprache "international gut verständlich". Mit dem Tool hebt sich Babbel nach eigenen Angaben von Konkurrenten wie Rosetta Stone und Tell Me More ab.
Babbel ist über den Internet-Browser, aber auch über mobile Applikationen und über PC-Software nutzbar. Die Spracherkennung funktioniert derzeit nur auf der Website. Für Neukunden gibt es einen kostenlosen Testzugang.
... mehr
Mensch gegen Maschine
18.06.2010, taz online
Das Fernsehquiz "Jeopardy" kann verflixt schwer sein: Die vom Moderator gestellten Fragen – eigentlich sind es Antworten, aus denen die Mitspieler Fragen machen müssen – enthalten nicht selten Wortspiele und kommen aus den unterschiedlichsten Wissensgebieten. Wer also bei der Sendung, die seit Jahrzehnten im US-Fernsehen läuft, bis zur letzten Runde bestehen will, braucht Intelligenz und Sprachverständnis.
Forscher beim IT-Konzern IBM hoffen nun, dass sie diese Eigenschaften auch einem Computersystem beibringen können. Der Großrechner namens "Watson" kombiniert eine riesige Wissensdatenbank mit Suchmaschinentechnik und Spracherkennung. Die Idee: Das System soll direkt gegen menschliche Gegner antreten und diese wenn möglich überflügeln. Die dabei gewonnenen Einblicke und Techniken aus dem Gebiet der künstlichen Intelligenz (KI) sollen dann wiederum eines Tages in ganz normale Produkte einfließen, um beispielsweise die Analyse großer Datenbestände zu erleichtern.
... mehr
Smartphone-App verbindet Fahrgäste und Taxifahrer
17.06.2010, heise online
Franz von Brandenstein will zum Retter aller Menschen werden, die vergeblich in den Straßen deutscher Großstädte nach einem Taxi Auschau halten. Der Geschäftsführer der Hamburger Talex GmbH hat eine Smartphone-Anwendung entwickeln lassen, die auf Knopfdruck alle freien in der Nähe verfügbaren Fahrzeuge kontaktieren kann. Bei der Anwendung "Taxibutton" haben sowohl die Fahrgäste als auch die Fahrer ein passendes Programm auf dem Handy. Untereinander verbunden werden sie mittels mobilem Internet, die Positionsangaben des Fahrgastes kommen per GPS.
Mittlerweile läuft die Technik im Regelbetrieb. Trotzdem kostet Taxibutton in der aktuellen Aufbauphase weder die Fahrgäste noch die Fahrer etwas. Mittelfristig sollen aber zumindest letztere zahlen: Geplant sind 33 Cent pro Bestellung, die sich entweder per Premium-SMS oder In-App-Payment, also direkt in der Applikation per Kreditkarte, begleichen lassen.
... mehr
Mobile Barcodes sollen das Einkaufsverhalten verändern
15.05.2010, derStandard.at
Mobile Barcodes sollen Produkte und andere Objekte wie Sehenswürdigkeiten via Handy mit Informationen ausstatten. Dem normalen Konsumenten bisher nur durch das "Biep" an der Kasse geläufig, sollen Barcodes nun Dank neuer mobiler Technologien, nämlich mit Hilfe der im Code enthaltenen Identifikationsnummer Informationen aufs Smartphone zaubern. Das können etwa bei einer Autoreklame technische Daten, aber auch das direkte Buchen einer Probefahrt sein. Bei Lebensmitteln beispielsweise können Herkunft und exakte Inhaltsstoffe abgerufen werden.
Derartige Anwendungen hat es schon gegeben - allerdings bemüht sich das Unternehmen GS1 Austria all dies zu standardisieren und miteinander zu verknüpfen: Einerseits sind das Smartphones mit Kamera und Internetzugang, dann die entsprechende Software, die auf diesen vielen verschiedenen Geräten laufen soll, sowie die Mobilen Anbieter, von denen die vier größten in Österreich für dieses Projekt bereits mit an Bord sind.
Nicht zuletzt sollen die Informationen nicht wie in sozialen Netzwerken von irgendwoher stammen, sondern "vertrauenswürdige Quellen" angezapft werden. Gregor Herzog von GS1: "Wir glauben, dass sich die Markenhersteller sehr rasch daran beteiligen werden."
... mehr
Bahn bietet Online-Ticket per MMS an
15.06.2010, heise online
Bei der Deutschen Bahn muss das Onlineticket künftig nicht mehr ausgedruckt werden, denn bei der Kontrolle werden ab sofort auch MMS auf dem Handydisplay als Fahrkarte akzeptiert. "Jetzt ist es möglich, sich die Fahrkarte bei einer Buchung im Internet auf bahn.de als MMS direkt auf das Mobiltelefon schicken zu lassen", gab die Bahn bekannt. "Statt des ausgedruckten Onlinetickets zeigt der Reisende dem Zugbegleiter die MMS auf seinem Handydisplay." Für diesen Service müssen die Kunden im Online-Angebot der Bahn registriert sein und sich mit ihren Zugangsdaten auf bahn.de anmelden. Fahrkarten können nun bis zu 10 Minuten vor Abfahrt des Zuges gekauft werden, bisher ging das nur beim Kauf via Handy.
Bahn-Sprecher Andreas Fuhrmann: "Wir arbeiten mit einem 2D-Barcode. Dieser befindet sich sowohl auf dem ausgedruckten Bahnticket, als auch in digitaler Version auf dem Handy als MMS. Erst vor kurzem haben wir das erweitert. Wir verwenden jetzt auch einen größeren Code bei Mobiltelefonen. Zuvor konnten wir dort nur sehr eingeschränkt Informationen unterbringen, weil die Handydisplays der limitierende Faktor waren." In den vergangenen Jahren habe sich die Technik weiterentwickelt. Displays hätten eine höhere Auflösung und könnten mehr darstellen, so Fuhrmann. "Entsprechend konnten wir den Code weiterentwickeln und mehr Informationen hineinpacken", sagte er.
Das Ticket wird parallel weiter als PDF per E-Mail versandt. Nutzer des MMS-Tickets können sich eine Testnachricht zusenden lassen, um zu prüfen, ob ihr Mobiltelefon multimediale Nachrichten darstellen kann. Das Onlineticket auf dem Notebookdisplay vorzuzeigen, ist für Reisende weiterhin nicht möglich. "Es muss immer die MMS oder der Ausdruck sein", sagte Fuhrmann.
... mehr
Google stellt Navigation und Sprachsuche vor
09.06.2010, golem.de
Google hat zwei neue Produkte zur mobilen Nutzung vorgestellt: Eine vollwertige Navigation mit Google Maps und die Voice Search.
Maps Navigation ist eine Offboard-Navigation, bei der die Karten nicht lokal gespeichert, sondern bei jeder Routenkalkulation heruntergeladen werden. Ziele kann der Anwender per Sprache oder Tastatur eingeben. Maps Navigation greift dabei auf die lokale Suche von Google zu: Gibt man beispielsweise "Arzt" ein, sucht Maps nach Ärzten in der Nähe und bietet sie als Ziel an. Es lassen sich aber auch Adressen aus der Kontakte-Liste oder aus Google Latitude als Ziel verwenden. Auf den Karten blendet Maps Navigation optional Verkehrsinformationen und interessante Punkte wie Parkhäuser oder Tankstellen ein. Die Verkehrsdaten stammen von kommerziellen Anbietern oder von Google-Maps-Nutzern. Google Maps Navigation Beta ist für Smartphones mit Android 1.6 verfügbar. Für andere mobile Betriebssysteme wird es die Google-Navigation vorerst nicht geben.
Nutzer von Smartphones sollen ihre Suchanfragen künftig nicht mehr umständlich eintippen, sondern einfach ins Telefon sprechen - die Voile Search ist jetzt auch für Deutsch erhältlich. Dank Cloud Computing will Google die notwendige Rechenleistung aufbringen, um Hintergrundgeräusche zu filtern und selbst Eingaben zu erkennen, die Begriffe in verschiedenen Sprachen enthalten. Die Google-Sprachsuche ist noch nicht auf Dialekte optimiert. Erkannte Suchanfragen werden an die Suchmaschine weitergeleitet. Falls der Nutzer die Ergebnisse nicht anklickt, erhält die Sprachsuche eine Rückmeldung, so dass sie aus den Fehlern lernen kann. Google speichert gesprochene Suchanfragen außerdem anonymisiert ab und wertet sie aus, um das System zu optimieren. Android-Systeme ab Version 1.6 erhalten die neue Funktion als Update, iPhone-Nutzer können die kostenlose Mobile App aus dem Appstore laden. Für Blackberry und Symbian stellt Google sie zum Download bereit.
... mehr
Intelligente Jacken helfen beim Stressabbau
06.06.2010, futurezone
Intelligente Kleidung könnte dem Träger in Zukunft emotionalen Beistand im Alltag leisten. Melden die Sensoren schlechte Laune, sollen Musik und Bilder den Gestressten aufmuntern. Ausgestattet mit Sensoren zur Überwachung des Gesundheitszustandes wie Körpertemperatur und Herz- und Atemfrequenz soll moderne Kleidung Rückschlüsse auf die emotionale Verfassung des Trägers ziehen können. Wird eine erhöhte emotionale Belastung festgestellt, wird der Gestresste mit ausgewählter Musik und Bildern sowie aufmunternden Worten, die über in der Kleidung eingebaute LE-Displays und Lautsprecher in der Kapuze ausgegeben werden, beruhigt. Die über die Sensoren gesammelten Daten werden mit einer Web-basierten Datenbank abgeglichen, die vorher mit allen relevanten Informationen des Trägers gespeist wurde. Die Internet-Verbindung erfolgt über ein mitgeführtes Smartphone. Entwickelt wurde die Kleidung von britischen Forschern im Rahmen des "Wearable Absence" Projekts. Bisher sind die Kleidungsstücke nur als Prototypen verfügbar.
... mehr
IBM SPSS Predictive Analytics stellt neues Social Media Mining Tool vor
01.06.2010, acquisa
Um die vielfältigen Informationen aus Social Media zu sammeln und analysieren zu können, hat IBM SPSS eine neue Software entwickelt. Die Lösung arbeitet mit sozialen Netzwerken und Blogs, funktioniert aber auch im Zusammenspiel mit großen unternehmensinternen Datenquellen.
Das Konzept: Durch den Einsatz des Tools lassen sich Textinhalte aus Dokumenten, E-Mails, Call-Center-Einträgen und vor allem Social Media wie Blogs, Twitter oder Facebook sammeln und miteinander verbinden. Unternehmen können auf Basis der gesammelten Informationen fundierte unternehmerische Entscheidungen treffen. Vor allem die Meinung und Wünsche der Kunden über Produkte und Unternehmen sind aufgrund der Vielzahl der Social Media-Kanäle nur schwer überschaubar. Mit dem neuen Tool sollen Unternehmen einen umfassenden Einblick in das Denken ihrer Kunden erhalten können, um strategische Entscheidungen in Marketing oder Vertrieb auf Basis der gewonnen Erkenntnisse zu entwickeln.
Die Data-Mining- und Textanalysesoftware soll es ermöglichen, Veränderungen in den Einstellungen und Meinungen von Konsumenten und Angestellten zu erkennen und aussagekräftige Daten zu erhalten. Darauf aufbauend können passende Aktionen zum Beispiel zur Kundengewinnung und -bindung erarbeitet werden.
... mehr
Ablenkungsfreies Schreiben auf dem iPad
01.06.2010, golem.de
Der Mac-Texteditor myTexts von moApps ermöglicht dem Autor durch ein ausgeblendetes Benutzerinterface die volle Konzentration auf den Text. Die Anwendung besitzt zwei verschiedene Modi. Einer davon zeigt ein Interface mit einem simulierten Papierstück und einer Schreibunterlage. Der andere Modus zeigt in einer Vollbildansicht lediglich den eingetippten Text. Zu den Texten können separate Notizen angelegt werden. Die Mac-OS-X-Variante von myTexts kann die vom iPad exportierten Texte lesen und bearbeiten. Damit die Texte auch unter Windows weiterverarbeitet werden können, steht auch eine Text-Exportfunktion zur Verfügung. Die iPad-Version von myTexts kostet 2,39 Euro und enthält derzeit die Lizenz für die Desktopvariante, die normalerweise einzeln 14 Euro kostet.
... mehr
Roboter teilen Wissen
31.05.2010, heise online
Roboter sollen den Menschen schon in wenigen Jahren im Haushalt zur Hand gehen, Pflege- und Serviceautomaten in Krankenhäusern oder Altenheimen aushelfen. Das Problem: Die meisten dieser personenkompatiblen Systeme müssen trotz ausgeklügelter Algorithmen zur Situations- und Umgebungserkennung für viele Aufgaben stets neu programmiert werden. Hinzu kommt, dass selbst Orte, die sich nur leicht unterscheiden, jedes Mal neu erfasst werden müssen. Das Projekt "Robo Earth", an dem Philips Applied Technologies, die ETH Zürich, die TUs München und Eindhoven sowie die Universitäten Stuttgart und Zaragoza beteiligt sind, will die Adaption von Haushalts- und Pflegerobotern nun mit einer speziellen Informationsbibliothek beschleunigen. Als eine Art "Wikipedia für Roboter" soll die neue Datenbank Prozesse erfassen, Umgebungen speichern und Abläufe vorhalten, die eines der am Projekt beteiligten Robotersysteme bereits perfekt beherrscht. Der Datenaustausch erfolgt über das Internet und allgemeingültige Schnittstellen.
... mehr
Optische Sensoren erkennen Sonnenstand und Fahrergesten im Auto
29.05.2010, heise online
Die optischen Sensoren von Elmos erkennen den Sonnenstand an der Windschutzscheibe und die Gesten des Fahrers beim Bedienen von Radio oder Navi. Beides kann die Sicherheit im Auto erhöhen.
Die fortlaufenden Informationen über den Sonnenstand beziehungsweise den Lichteinfall an der Frontscheibe würden dazu genutzt, die Darstellung auf den Instrumententafeln im Auto so anzupassen, dass sie jederzeit gut ablesbar sind, erklärte Stefan Lenz von Elmos. Die Firma entwickelt die Sensorik und Auswertung für solche Licht- und Winkelmessung.
Ähnliches gilt auch für die Halios-Sensoren zur Erfassung von Gesten. Über einer Art Touchpad ohne Touch wird hier ein IR-Feld aufgebaut, in dem etwaige Störungen aus Entfernungen von wenigen Millimetern bis etwa drei Metern erkannt und zur Auswertung an einen Controller geleitet werden. Wischt der Fahrer mit einer Hand durch dieses unsichtbare Feld, könnte beispielsweise der Radiosender wechseln. Eine Sichtbeziehung zum Gerät sei dabei überflüssig, erläuterte Lenz. Dies erhöhe die Fahrsicherheit erheblich. Laut Lenz wird die Sensorik im kommenden Jahr bereits in Fahrzeugen zum Einsatz kommen – welche Autos dies sein werden, verriet der General Manager nicht.
... mehr
Einkaufen mit Avataren
25.05.2010, Deutschlandradio Kultur
Kundeninformationen und Dienstleistungen werden zunehmend von elektronischen Systemen übernommen. Doch wir sind es gewohnt, einen persönlichen Ansprechpartner zu haben. Das könnten in Zukunft intelligente Avatare - virtuelle Gesprächspartner - übernehmen, die mit Mimik und künstlicher Sprachtechnologie die Kommunikation zwischen dem Kunden und Verkäufer verbessern sollen.
"Guten Tag und willkommen! Lassen Sie mich zeigen, was wir alles erledigen können!", so grüßt eine junge Frau von einem Bildschirm, der in den Kühlschrank einer Modellküche eingelassen ist. Die virtuelle Gesprächspartnerin ist Teil eines Forschungsprojektes des Deutschen Forschungszentrums für Künstliche Intelligenz in Saarbrücken mit dem Kölner Unternehmen Charamel. Alexander Reinike koordiniert dieses Projekt "Interaktive Avatar Kommunikations-Technologie", kurz INTAKT: "Viele Menschen haben ein Problem, mit der Maschine zu sprechen. Sobald man einen visuellen Ansprechpartner gegenüberstellt, fällt diese Kommunikation viel einfacher, die Hemmschwelle sinkt."
Anders als ihre Sprache ist ihre Gestik und Mimik schon recht flüssig. Ob die noch etwas hölzern wirkenden Avatare schon mehr sind als technisch mögliche Spielerei und wirklich schon Berührungsängste zwischen Menschen und Maschinen abbauen können, darf noch bezweifelt werden.
... mehr
Software erkennt Sarkasmus
20.05.2010, golem.de
Rhetorische Stilformen wie Ironie oder Sarkasmus bleiben oft unerkannt - in geschriebener Sprache noch mehr als in gesprochener. Dennoch greifen viele Autoren, gerade im Internet, gern zum Sarkasmus. Damit dieses Stilmittel künftig nicht mehr verborgen bleibt, haben die Informatiker Oren Tsur, Dmitry Davidov und Ari Rappoport von der Hebräischen Universität in Jerusalem einen Sarkasmus-Detektor entwickelt. Semi-supervised Algorithm for Sarcasm Identification, kurz Sasi, sei in der Lage sarkastische Sätze mit einer Treffergenauigkeit von 77 Prozent zu erkennen. Nach einer Lernphase analysierte Sasi 66.000 Amazon-Rezensionen auf sarkastische Äußerungen. Ein Team aus 15 Menschen mit unterschiedlichem kulturellem Hintergrund beurteilte dann die Ergebnisse. Danach lag Sasi in 77 Prozent der Fälle richtig.
Die Sarkasmuserkennung könne zur Verbesserung von Besprechungen und Bewertungssystemen beitragen, schreiben Tsur, Dmitry und Rappoport. Sie wollen ihre Erkenntnisse auf einer Konferenz über Blogs und soziale Medien vorstellen.
... mehr
Hybridauto Volt bekommt Google Maps
18.05.2010, Chromoid
GM arbeitet mit Google zusammen, um das kommende Range-Extender-Fahrzeug mit Elektroantrieb, das weitgehend baugleich in Deutschland als Opel Ampera vorfahren wird, mit Android-Features und Google-Diensten zu erweitern. Besitzer von Chevrolet Volt werden unter anderem den Standort ihres Fahrzeugs über ihr Android-Smartphone verfolgen können. Die Spracherkennung ihrer Mobiltelefone soll ihnen außerdem erlauben, Navigation über Google Maps abzurufen, die das bordeigene OnStar-System mit gesprochenen Richtungsanweisungen ausgibt. Der Autohersteller sieht darüber hinaus mit Anwendungen auch für iPhone und Blackberry vor, dass Volt-Fahrer per Mobiltelefon den Ladezustand überwachen und das Nachladen veranlassen können.
... mehr
iConji - Piktogramme für barrierefreie Kommunikation
15.05.2010, golem.de
Mit iConji sollen künftig Benutzer in aller Welt auch ohne Übersetzer kommunizieren können. Mit Piktogrammen aus der neuen Bildersprache können Anwender Sätze bilden, die über Sprachbarrieren hinaus verständlich sein sollen. Die Bildersprache ist offen und kann durch Anwender mit neuen Symbolen erweitert werden. Die Piktogramme erhöhen auch die Eingabegeschwindigkeit gegenüber traditionellen Textnachrichten, denn mit der Bildersprache reduziert sich unter Umständen auch der Inhalt eines Satzes. Zusätzlich können einzelne Symbole noch mit Texten und Zahlen ergänzt werden, etwa um bei einer Einladung zum Tee auch den Treffpunkt angeben zu können.
... mehr
Stumme telefonieren mit Gesichtsbewegungen per Computer
14.05.2010, Teletarif
Das Gesicht des Probanden ist in Bewegung. Er spricht, aber kein Laut dringt aus seinem Mund. Verstanden und übersetzt wird seine Botschaft dennoch. Und zwar von einem Computer. Mit einer neuen Technologie wollen Forscher am Karlsruher Institut für Technologie (KIT) das Telefonieren ohne den Einsatz der Stimme ermöglichen. Die neue Technik könnte insbesondere von Menschen mit Sprachbehinderungen genutzt werden.
Bei dem Verfahren werden die Gesichtsbewegungen während der stummen Konversation vom Computer erfasst, interpretiert und übersetzt. "Wenn wir sprechen, ziehen sich sämtliche Gesichtsmuskeln auseinander und wieder zusammen", erklärt die leitende Wissenschaftlerin Tanja Schultz das Prinzip der Technik. Je nachdem wie sich Zunge, Lippe und die Kiefer bewegten, ließen sich einzelne Worte mit Hilfe des Computers analysieren. Tatsächlich übersetzt die Maschine während des Praxistests die Lippenbewegungen und erkennt das "Hallo", das der Proband lautlos von sich gegeben hat.
... mehr
Spezialsuchmaschine hilft bei Übersetzungen
11.05.2010, golem.de
Linguee sucht nach Texten im Internet, die von Menschen übersetzt wurden. Dadurch liefert die Suchmaschine bessere Ergebnisse als herkömmliche Übersetzungsdienste. Der Dienst findet einzelne Wörter, Wortkombinationen oder Satzteile. Wie bei der Betaversion vor einem Jahr wird allerdings weiterhin nur die Sprachrichtung Englisch-Deutsch und Deutsch-Englisch unterstützt, allerdings wurde die Übersetzung weiter optimiert. Im Juli 2010 sollen die Sprachversionen Englisch-Spanisch, Englisch-Französisch und Englisch-Portugiesisch integriert werden. Mit der finalen Version allerdings erscheinen die Suchergebnisse übersichtlicher als bisher. So versucht die Suchmaschine gute Übersetzungen zu erkennen und nach oben in der Trefferliste zu setzen. Das Ergebnis zeigt das Suchwort innerhalb einer übersetzten Textpassage. Damit sollen sich unbekannte Wörter besser im richtigen Zusammenhang übersetzen lassen.
... mehr
Echtzeitübertragung: Sportics.net verbindet Sport und Internet
10.05.2010, Online-Artikel.de
Die Sportplattform Sportics.net verbindet die Möglichkeiten moderner Netzwerke und Technologien mit der realen Sportwelt. Sportics erlaubt Sportbegeisterten nicht nur die Übertragung von Leistungsdaten beliebiger Geräte nach dem Sport. Vielmehr können Mitglieder seit Mai 2009 auf sportics.net ihre Leistungsdaten sowohl nach dem Sport als auch in Echtzeit - während des Sports - direkt aus dem Sportcomputer, Ergometer, Fitnessstudio, vom Handy aus oder auch manuell auf die Plattform übertragen, sich live per Web oder mobil auf dem Handy verfolgen, motivieren und Leistungen kontrollieren lassen. Ergo stehen Sportlern, Freunden, Trainern oder auch Gegnern die Sportdaten jederzeit und überall zur Verfügung. Aus diesen können nun, je nach Bedarf, Leistungs-Rankings oder eigene Sport- und Fitnesstagebücher mit persönlichen Trainingsergebnissen erstellt, ausgetauscht und ausgewertet werden.
... mehr
i-You Chinesisch - App des DFKI Spin-off Yocoy
29.04.2010, Informationsdienst Wissenschaft
Als Ausgründung aus dem DFKI-Forschungsbereich Sprachtechnologie unterstützt Yocoy mit seiner neuen App "i-You Chinesisch" die deutschen Besucher und die chinesischen Gastgeber der EXPO 2010 in Shanghai. i-You ist ein multilinguales Kommunikationswerkzeug und hilft in nahezu allen Dialogsituationen: am Flughafen, im Hotel, im Taxi, beim Smalltalk, selbst beim Feilschen im Geschäft, aber auch in Notfallsituationen. Ein gewählter Satz oder ein um nutzerspezifische Informationen ergänzter Lückentext wird übersetzt und synthetisiertes Chinesisch über den Lautsprecher des iPhones oder des iPodTouch ausgegeben. Im Anschluss kann der chinesische Gesprächspartner seine Antwort aus einer Fülle von situationsangepassten Alternativen auswählen, die dann für den deutschen Gast ins Deutsche übersetzt werden. Ist die Benennung bestimmter Waren, Gerichte, Gebäude oder Schriftzeichen unbekannt, können auch Fotos als Anschauungsmaterial in eine Frage eingebunden werden.
Die Anwendung belegt den funktionierenden Transfer von Forschungsergebnissen, ist verwendbar mit iPhone oder iPodTouch und voll funktionsfähig auch ohne Internetanbindung.
... mehr
Flughafen Frankfurt mit neuem Service fürs mobile Internet
28.04.2010, dsl Magazin
Einen neuen Service bietet Flughafenbetreiber Fraport seinen Kunden: Wer mobiles Internet nutzt - vom einfachen internetfähigen Handy bis hin zum Smartphone - kann nun verschiedene Flugdaten abrufen. Für die Nutzung des neuen Serviceangebots ist keine Installation eines Anwendungsprogramms erforderlich. Die Darstellung ist der geringen Monitorgröße angepasst und verzichtet daher auf überflüssige grafische Elemente. Der mobile Service bietet die Suche nach Zielflughafen, Flugnummer oder Uhrzeit. Auch über die normale Homepage frankfurt-airport.de wird man automatisch zur mobilen Flugdatensuche weitergeleitet. Eine Detailansicht mit allen Informationen zum gesuchten Flug komplettiert das neue Angebot.
... mehr
Alterian bietet seine Social Media Monitoring-Services jetzt auch auf arabisch an
26.04.2010, Wort+Welt
Mit SM2 steht weltweit erstmalig eine SMM-Technologie zur Verfügung, mit der sich die bisher nicht übergreifend analysierbare arabische Social Web-Welt endlich umfassend monitoren lässt - dank richtungsweisender Sprachtechnologie gleichzeitig für über 30 arabische Nationen. In Zusammenarbeit mit SocialEyez, den Social Web-Spezialisten des führenden Media-Monitoring-Anbieters im Mittleren Osten, Media Watch Middle East, ist es gelungen, die an Varianten so reiche arabische Sprache sowie alle relevanten arabischen Social Media in das Wirkspektrum von Alterians Social Media Monitoring-Dienstes SM2 zu integrieren. Damit können nun endlich übergreifende Analysen und Reportings aus der online-Kommunikation im aufgrund der hohen Versatilität der Sprache für Software-Lösungen bisher weitestgehend unzugänglichen Arabischen Raum generiert werden. 
... mehr
Bei Anruf Job
24.04.2010, Welt online
Auf dem Weg ins Büro einen neuen Job finden - das ist ab sofort möglich: Konzerne wie Daimler, Bayer oder Deutsche Bank informieren nämlich seit Kurzem auch drahtlos über offene Stellen: Sie haben über ihre gemeinsame Plattform Jobstairs eine eigene App für das iPhone herausgebracht, die aktuelle Vakanzen anzeigt. Auf Wunsch blendet das kostenlose Miniprogramm sogar eine Landkarte ein, auf der die potenziellen Arbeitsorte markiert sind. Nur eine technische Spielerei? Nein, sagen Experten. Per Handy zum neuen Arbeitgeber - das wird in wenigen Jahren auf dem ganzen Arbeitsmarkt an der Tagesordnung sein. "Das Interesse am so genannten Mobile Recruiting ist riesig", bestätigt Wolfang Jäger, Professor an der Hochschule RheinMain, Wiesbaden. Er hat in einer Umfrage ermittelt, dass 89 Prozent aller Unternehmen künftig mit dem Bewerber über mobile Geräte in Kontakt treten wollen.
... mehr
Spracherkennung bei Google Maps
22.04.2010, SpeechTechMag
Google hat eine neue Version von Google Maps veröffentlicht, die Windows Mobile- und Symbian S60-Handy-Nutzern die Suche via Spracherkennung ermöglicht. Für BlackBerry und Android-Smartphones gibt es diese Möglichkeit schon länger, für Apple's iPhone allerdings steht sie noch immer nicht zur Verfügung. "We understand that typing on phones isn’t as easy or fast as talking into them," schreiben die Entwickler Yuliang Wang und Yifei Zhang vom Google Mobile Team in einem Blog Post auf der Google Website. "As a result, we're big fans of letting you search in Google Maps for Mobile in the most natural way possible - with your voice."
... mehr
Plantronics und WorkSnug präsentieren iPhone-Applikation für Nomadic Worker
13.04.2010, offenes Presseportal
Geschäftsreisende kennen das Problem: Wer in einer fremden Stadt ankommt, verbringt zunächst einmal kostbare Zeit mit der Suche nach einem geeigneten Ort, an dem sich der Laptop aufschlagen und in Ruhe arbeiten lässt. Wo gibt es Strom, kostenloses W-Lan, eine erträgliche Geräuschkulisse und nach Möglichkeit noch einen leckeren Kaffee? Um den „Nomadic Worker“ des 21. Jahrhunderts bei der Suche nach geeigneten Arbeitsorten im urbanen Umfeld zu unterstützen, hat das Londoner Mobile-Startup WorkSnug mit Unterstützung von Plantronics eine kostenlose iPhone-Applikation entwickelt. „WorkSnug“ spielt nach dem Prinzip der Augmented Reality Informationen direkt in das Echtzeit-Kamerabild des iPhone und leitet mobile Anwender so zum nächsten geeigneten Workspace.
... mehr
Siemens: Auf dem Weg zum „speech-enabled“ KIS
13.04.2010, Healthtechwire
Eine tiefe Integration der Spracherkennung ins Krankenhausinformationssystem (KIS) ist unverzichtbar, wenn sich Sprache als Eingabemedium für die klinische Dokumentation durchsetzen soll. Für Christoph Nahrstedt von der Siemens AG Healthcare Sector ist diese Integration keine Einbahnstraße, sondern ein wechselseitiger Prozess. Eine sinnvolle „Integration 2.0“ der Spracherkennung ins KIS müsse den heterogenen Anwendern möglichst viel Funktionalität bieten, damit diese ihre individuellen Dokumentationsstile nicht aufgeben müssen. In Nahrstedts Vision einer „Integration 2.0“ stehen der gesamte Inhalt sowie auch die Strukturinformation klinischer Dokumente für die Spracherkennung zur Verfügung. Damit würde es dann problemlos möglich, Teile eines Dokuments zu unterschiedlichen Zeitpunkten zu diktieren, schon eingefügte Informationen zu übersprechen oder Dokumente an beliebiger Stelle zu ergänzen. Erst das sei dann eine tiefe Integration, die diesen Namen auch verdient.
... mehr
Chordiant optimiert Outbound-Kundeninteraktion für seine Customer Experience-Lösungen
12.04.2010, Pressebox
Chordiant, Anbieter für Customer Experience Software und Services, bietet ab sofort seine neue Software Chordiant Cx Outbound an. Die neue Lösung erweitert die bereits bestehende Inbound-Kommunikation um die Outbound-Komponente. Das Produkt bietet den Unternehmen eine Reihe von Kundenstrategien, in denen der jeweils nächste geeignete Schritt für die Kundeninteraktion systematisch ermittelt wird, unabhängig vom Kommunikationskanal. Dadurch können Unternehmen ihren Kunden eine konsistente Ansprache und Interaktion bieten, die den Customer Lifetime Value deutlich steigert. Somit bietet es personalisierte Interaktionsstrategien, mit denen Unternehmen auf jedes individuelle Kundenbedürfnis eingehen können.
... mehr
Schweizer Sprachtechnologie im Google-Handy
12.04.2010, Basler Zeitung digital
Mensch und Maschine kommunizieren auf unterschiedlichen Wegen. Svox setzt ganz auf die Sprache. Im Jahr 2000 als Spin-off der ETH gegründet, entwickelten die Sprachforscher anfänglich Systeme zur Sprachausgabe. Heute gehört auch die Spracherkennung und -steuerung zum Repertoire. Auch Google setzt auf Technologie von Svox. Sie stellt auf Mobiltelefonen mit dem Android-Betriebssystem eine Sprachsteuerung bereit. Handys mit der Android 2.1, namentlich das Nexus One (siehe TA vom 8. März), gehorchen aufs Wort. Per Sprache lässt sich erfragen, wann der nächste Termin ansteht und wie viele neue Mails eingetroffen sind. Auch die Antwort erfolgt selbstverständlich sprechenderweise.
... mehr
Amazon startet Benachrichtigungsdienst SNS
07.04.2010, golem.de
Der neue Cloud-Dienst Amazon Simple Notification erlaubt es, Benachrichtigungen zu versenden. Dazu stellt Amazon eine flexible und skalierbare Plattform bereit, die wie gewohnt nutzungsabhängig bezahlt wird. Neue Nachrichten werden dem Dienst per API übergeben und dann per HTTP oder E-Mail verteilt. Anwendungen für den Dienst sieht Amazon beispielsweise im Bereich Monitoring/Überwachung, bei Workflowsystemen, zeitkritischen Informationen und mobilen Anwendungen.
... mehr
Tübinger Informatiker entwickeln bequemes und sicheres Einloggverfahren
29.03.2010, Informationsdienst Wissenschaft
Viele Internetnutzer kennen das Problem, dass man die vielen Passwörter und Benutzernamen für seine Online-Accounts vergisst oder verwechselt. Dr. Bernd Borchert vom Wilhelm-Schickard-Institut für Informatik der Universität Tübingen hat zusammen mit Studierenden ein neues Verfahren entwickelt, das dem Benutzer nicht nur das Merken dieser Daten erspart, sondern auch das Eintippen. Mit dem neuen Verfahren wird zugleich ein Problem gelöst, das viele Internetnutzer verdrängen: Ihre Dauer-Passwörter für Online-Accounts können durch Trojaner auf dem Eingaberechner abgehört und für kriminelle Zwecke missbraucht werden. Alles was der Benutzer braucht ist ein internetfähiges Fotohandy. Für jeden Online-Account ist zunächst ein Initialisierungsschritt nötig. Wenn sich der Benutzer dann in seinen Account einloggen will, geht er auf die Webseite des Account-Anbieters. Dort wird ein zweidimensionaler Code angezeigt, eine Art schwarz-weißes Strukturbild, das mit dem Fotohandy abfotografiert wird. Das Handy verarbeitet die gelesenen Daten und kontaktiert anschließend den Account-Server. Nach Prüfung der Daten setzt sich der Server mit dem Browserfenster auf dem Bildschirm des Benutzers in Verbindung und schaltet dort den Account frei.
... mehr
Voxeo veröffentlicht Cloud Communications API mit Twitter Support
25.03.2010, TMC
Voxeo hat den weltweiten Start seiner Cloud Kommunikationsschnittstelle Tropo bekannt gegeben. Tropo unterstützt nun die Kommunikation über Twitter, SMS, IM/Chat und Sprache von überall mit allen Anwendungen. Tropo bietet Cloud-basierte Telefoniedienste, die es Entwicklern ermöglichen, Sprachanwendungen in bekannten Programmiersprachen wie Groovy, JavaScript, PHP, Python und Ruby zu schreiben. Dieser Ansatz erweitert die bis dato verfügbaren XML-zentrierten Optionen, die in der Vergangenheit die einzige Möglichkeit für cloud-basierte Telefondienste waren. Tropo-Anwendungen können einfach und schnell in den unterstützten Sprachen erstellt werden - ohne dabei in XML-Formate übersetzt werden zu müssen. Anwendungen, die auf Tropo entwickelt werden, können Anrufe über traditionelle Festnetzanschlüsse, Mobiltelefone, Nebenstellenanlagen und neuere IP-basierte Lösungen wie SIP und Skype beantworten und initiieren. Tropo ist nicht nur Open Source, sondern basiert auch vollständig auf offenen Standards wie SIP, Java SIP Servelets und dem IETF Media Resource Control Protocol (MRCP).
... mehr
Neue Apple-Patente: iGroups und Text-to-Speech
23.03.2010, Online PC
Bereits im November 2009 hat Apple ein Patent beantragt, dass eine Möglichkeit beschreibt, kurze Textnachrichten von einem iPhone zum anderen zu senden, ohne dass der Datenkanal von SMS oder ein Backend-Server benötigt würde, der eine Sendung bis zum Abruf zwischenspeichert. Dabei werden kurze Textschnipsel (etwa eine Telefonnummer) in gesprochene Sprache umgewandelt und über die normale Audio-Verbindung des Telefons verschickt. Beim Empfänger kommt die Nachricht dann als normaler Anruf an, der bei Nichterreichbarkeit auf der Sprachbox landet. Ein weiterer Patentantrag beschreibt eine "Social App" namens "iGroups". Dabei soll es sich um ein Soziales Netzwerk wie etwa Twitter oder Facebook handeln, das die GPS-Funktionalität des iPhones ausnutzt, um zum Beispiel Freunde und Bekannte in der Nähe des eigenen Standorts zu zeigen.
... mehr
HP bringt neue Services für Unified Communication and Collaboration
23.03.2010, marketing Börse
HP hat sein Service-Portfolio im Bereich Unified Communications & Collaboration (UCC) um Angebote erweitert, die Kunden dabei helfen, ihre Kommunikationssysteme zu vereinfachen und zu integrieren. Darüber hinaus hat HP sein UCC-Portfolio durch Kooperationen mit Polycom und NET (Network Equipment Technologies) erweitert. Die HP Polycom Services für Sprach- und Bildkommunikationslösungen vereinfachen Kommunikationssysteme und beschleunigen die Zusammenarbeit mit Kunden und Partnern. Dazu gehören Polycoms integrierte Sprach- und Videolösungen für UC-Umgebungen von Avaya und Microsoft sowie ein erweitertes Portfolio an VoIP-Telefonen für den Microsoft Office Communications Server "Wave 14". HP integriert die Schnittstelle NET VX Series UC in die UCC-Lösungen von HP und Microsoft. Das vereinfacht das Management und optimiert die Kommunikationssysteme für Messaging, Video- und Sprachübertragung. "Nur ein ganzheitlicher Ansatz, ausgerichtet an Geschäftsanforderungen und bereits vorhandenen Technologien, kann die Produktivitätsversprechen von UCC einlösen", sagt Ralf Kiwitzki, Leiter der Network Solutions Group bei HP Deutschland. "Durch unsere umfassenden Beratungsdienstleistungen kann HP den Kunden dabei helfen, aus der unüberschaubaren Menge an Angeboten diejenige Lösung herauszufiltern und zu konfigurieren, die ihnen den bestmöglichen Geschäftsnutzen bietet."
... mehr
Neuer Audi A8 mit Sprachsteuerung von Nuance
19.03.2010, SpeechTechMag
Das Multimedia Interface (MMI) im neuen Audi A8 bietet neben der Einbindung von Google Earth in die Navigation auch eine ausgefeilte Sprachsteuerung von Nuance. Drei Features hebt Nuance dabei heraus: One-Shot Destination Entry heißt, man kann die vollständige Adresse des Ziels ansagen, etwa "Berlin, Winsstraße 62". Auch im Adressbuch hinterlegte Adressen lassen sich ganz einfach aufrufen: "Navigiere zur Privatadresse von Volker Müller" sucht die passende Adresse und das Navi berechnet die Route. Die Musiksuche soll ebenso intuitiv funktionieren. Man kann die Audioquelle (CD-, MP3-, DVD-Player oder Radio) steuern und einfach Titel, Interpret und/oder Album angeben, etwa: "Spiele Titel Chasing Cars" - wobei das System ohne Probleme deutsche oder englische Titel erkennt. Und auch Adressbuch und Telefon lassen sich bequem und einfach steuern. Rufnummern kann man ohne Unterbrechung ansagen und das System erkennt diese fehlerfrei. 2000 Kontakte lassen sich speichern, 50 Namensfavoriten kann man festlegen, bei denen man dann allein mit dem Namen ein Telefonat starten kann. Die Sprachsteuerung trägt einen großen Teil zur Fahrsicherheit bei. Die Hände können am Steuer bleiben. Die wichtigsten Funktionen aktiviert man per Sprache.
... mehr
Wissenschaftler wollen das Sprachenlernen vereinfachen
15.03.2010, Informationsdienst Wissenschaft
Das zwei Millionen Euro teure Projekt mit dem Titel Allegro (Adaptive Language Learning technology for the Greater Region) wird mit einer Million Euro aus EU-Mitteln bezuschusst. Neben der Saar-Uni sind das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI), die Supélec Metz sowie das Inria Nancy beteiligt. Koordinator ist Manfred Pinkal, Professor für Computerlinguistik an der Saar-Uni.
Im Projekt Allegro entwickeln die Wissenschaftler über drei Jahre interaktive Sprachlern-Werkzeuge für Deutsch und Französisch. So soll es Sprachschülern möglich sein, mit dem Computer natürliche Dialoge zu Übungszwecken wie mit einem menschlichen Partner zu führen. Die Sprachschüler sollen aus verschiedenen Alltagsszenarien wählen können, die in einem Gastland relevant sind, zum Beipiel ein Telefonat führen, ein Gespräch an der Hotelrezeption und die Frage nach dem Weg.
... mehr
Das Spielzeug von morgen und übermorgen
13.03.2010, heise online
Auf der Game Developers Conference in San Francisco präsentierte Sony Computer Entertainment seine im Herbst auf den Markt kommende Bewegungssteuerung. Um eine genaue Ortung im Raum zu ermöglichen, hat Sony in die Move-Fernbedienung einen mit einem Gyroskop kombinierten Beschleunigungssensor eingebaut, der Bewegungen in alle Richtungen und Drehungen um alle Achsen erfasst. Die PS3-Eye-Kamera filmt die Fernbedienung, und eine Software errechnet anhand der Größe und der Position der Leuchtkugel ihre Lage und Entfernung im Raum.
Darüber hinaus experimentieren Hersteller schon lange mit der Gehirnwellensteuerung. Die scheinbare Gedankenkontrolle beruht auf dem Konzept der Elektroenzephalographie (EEG), bei der Gehirnwellen auf verschiedenen Frequenzbändern aufgezeichnet werden. Für 200 Dollar bekommt man z.B. bei Neurosky einen Kopfhörer mit vier Elektrosensoren, die Gehirnwellen im Alpha- und Gamma-Band sowie Augenzwinkern registrieren. Ziel in der mitgelieferten Steuerungssoftware ist es, einen Zustand höchster Entspannung bei gleichzeitiger Konzentration zu erreichen. Je besser dies klappt, desto höher sollen im mitgelieferten Spiel Feuerwerksraketen fliegen, die man mit einem Augenzwinkern explodieren lassen kann.
... mehr
Spracherkennung zur Authentifizierung
11.03.2010, ChannelPartner
Ein internationales Forscherteam hat einen deutlich schnelleren Ansatz zur Sprach-Authentifizierung entwickelt. "Mit dieser Methode erreichen wir ohne nennenswerte Genauigkeitsverluste eine Beschleunigung um einen Faktor zehn bis 20 gegenüber dem zugrunde liegenden Goldstandard", sagt Tomi Kinnunen, Informatiker an der University of Eastern Finland. Der Weg zum Massenmarkt ist aber noch weit. Für aktuelle Forensik-Anwendungen beispielsweise zum Vergleich aufgenommener Stimmproben mag es genügen, wenn Sprechererkennung einige Minuten oder sogar Stunden dauert. Damit sie aber im Massenmarkt Akzeptanz gewinnen kann, sind nicht nur geringe Fehlerraten, sondern auch eine schnelle Reaktionszeit nötig, so Robert Rodman, Informatikprofessor an der North Carolina State University.
Kinnunen zufolge ist die Geschwindigkeit der Sprechererkennung aber nur ein Teilproblem. "Die Methoden beständig gegenüber Umweltfaktoren zu machen ist eine größere Hürde dafür, die Technologie für ein breites Publikum nützlich zu machen", erklärt er. Derzeit seien Systeme zu ungenau, wenn ein User sich erst in einem leisen Büro anmeldet und dann beispielsweise im Auto wieder authentifizieren will. Ferner sei der Effekt menschlicher Faktoren wie Trunkenheit oder Wut noch nicht ausreichend erforscht.
... mehr
Google testet TV-Suche
09.03.2010, heise online
Seit 2007 bietet der Internetkonzern bereits die Vermittlung von TV-Werbung an. Nach Informationen des Wall Street Journal möchte Google darüber hinaus auch eine engere Verbindung von Web und TV schaffen. Dafür testet Google intern durch eigene Mitarbeiter Fernseh-Suchfunktionen über Google-Software. Für den Dienst kooperiert Google mit Dish, einem US-Provider für Satelliten-TV.
Der Google-Dienst für TV-Suche benötigt keine gesonderte Hardware oder einen PC, um Fernsehsendungen aufzufinden. Er arbeitet mit Settop-Boxen des Dish-Netzwerks, auf denen Google-Software installiert wird. Mit der TV-Suche lassen sich nicht nur Fernsehsendungen finden, sondern auch passende Web-Videos von YouTube. Die Software ermöglicht auch eine personalisierte Liste von Sendungen und Videos, um ein individuelles TV-Programm zusammenzustellen.
... mehr
Computer lernen Gefühle
04.03.2010, Die Zeit online
Marc Schröder findet Maschinen nicht dumm, nicht faul, nicht laut, er findet sie vor allem – unhöflich. "Stellen Sie sich vor, Sie reden mit jemanden, und der antwortet einfach nicht. Nie! Er guckt Sie nicht mal an, und erklärt Ihnen auch nicht, dass er mit etwas anderem beschäftigt ist", sagt Schröder. Es klingt, als verwechsele der Experte für Künstliche Intelligenz da Mensch und Maschine. Dabei ist das gar nicht so weit hergeholt: Schließlich schimpfen wir tatsächlich ständig mit unseren Rechnern. "Je komplexer ein Gerät, desto eher nehmen Menschen es als soziale Einheit wahr", sagt Schröder.
Einsatzgebiete für fühlende Computer gibt es einige: automatische Sprachdialogsysteme bei Telefon-Hotlines wären vermutlich eine geringere Qual, wenn sie den Ärger eines Anrufers bemerken und darauf reagieren könnten, statt in ihrem monotonen Singsang fortzufahren. Oder Computerspiele: Sie könnten sich auf das Befinden eines Spielers einstellen und ein Spiel individuell weniger ängstigend oder sogar noch blutrünstiger machen, je nachdem, wie dem Menschen am anderen Ende der Grafikkarte gerade zumute ist.
... mehr
Mit Software-Ergonomie zu besserem Kundenservice
22.02.2010, Informationsdienst Wissenschaft
Kunden möchten zügig und individuell betreut werden - das stellt hohe Anforderungen an die Service Management Systeme, die zur Bearbeitung der Kundenanfragen eingesetzt werden. Doch häufig leiden diese Systeme an überladenen Bedienoberflächen und unstimmiger Nutzerführung - und dies erschwert eine zielgerichtete Kundenbetreuung. Die Firma c.a.p.e. IT entwickelt Systemlösungen, die durch ausgereifte Usability auch technikfremden Service-Mitarbeitern erlaubt, Kundenanfragen schnell und gezielt zu bearbeiten. Die Software entstand in Zusammenarbeit mit Arbeitspsychologen der TU Chemnitz: "Wir haben die c.a.p.e. IT auf der CeBIT 2009 kennen gelernt und die Aufgabe angenommen, diese Fachsoftware aus ergonomischer Sicht zu prüfen und Hinweise zur bedienerfreundlichen Gestaltung zu geben", resümiert Nina Bär, Projektmitarbeiterin der "Kompetenzinitiative Usability" (KiU) an der TU Chemnitz. Das Resultat lässt sich auf der CeBIT begutachten.
... mehr
Banking: Biometrie statt PIN
21.02.2010, Tagesspiegel
So ziemlich jeder Mensch benötigt im Alltag mehrere Passwörter. Das Interesse an Biometrieverfahren ist daher groß: Biometrie ist nicht nur sicherer, der Kunde muss sich auch weniger Passwörter merken. Deshalb testet die Deutsche Bank in ihrer Filliale Q110 in Berlin, der „Filliale der Zukunft“, nun einen Venenscanner: Nachdem der Kunde seine Karte in das Gerät eingeführt hat, fordert ihn der Automat auf, seine Hand für ein paar Sekunden über einen Sensor zu halten. Berühren muss er das Gerät dabei nicht. Der Sensor beleuchtet die feine Musterung der Venen unter der Haut mit Infrarotstrahlen und vergleicht dieses Bild mit den hinterlegten Daten des Kunden. Der Feldversuch läuft bereits seit November 2008. Bisher habe der Automat jede der 200 Testpersonen erkannt, sagt Filialleiterin Ira Holl. Und anscheinend kommt die Idee auch bei den Kunden gut an: „Die meisten sagen: Das wäre toll, wenn die Geheimzahl wegfallen würde.“
... mehr
Twitter veröffentlicht OpenSource-Produkte
19.02.2010, Golem.de
Der Microblogging-Dienst Twitter ist nicht nur „hippes“ Medium, sondern wird auch von Unternehmen in der Kundenkommunikation eingesetzt. Nun hat Twitter zahlreiche OpenSource-Produkte veröffentlicht - was den individuellen Einsatz der Technologie erheblich fördern dürfte. Unter dem Motto "Twitter loves open source" gibt Twitter sowohl eigne Projekte als auch solche frei, an denen sich Twitter bei der Entwicklung beteiligte und für seine Dienste nutzt. Dazu gehören etliche Ruby-Gems , etwa ein Gem zur einfachen Generierung von UUIDs, das Kerstel-Client-Gem für Message-Queuing sowie das Zookeeper-Gem, das eine Schnittstelle zu einem Distributed-Lock-Server bereitstellt.
... mehr
MobileWorld Congress: IVVR-Anwendungen auf dem Vormarsch
18.02.2010, TMC
Deutsche Unternehmen wie telenet oder Crealog bieten IVVR-Lösungen bereits seit Längerem an. Auf dem MobileWorld Congress präsentierte nun auch Speechstorm seine Video-IVR. Bei einer IVVR werden gängige IVR-Lösungen mit Video kombiniert. Durch das zusätzliche visuelle Feedback wird der Dialog für den Nutzer vereinfacht und lange Auswahlmenüs fallen weniger zur Last. Einzige Anforderung auf Seiten des mobilen Endgeräts ist, dass es über Mobilfunkstandards der dritten Generation, in erster Linie UTMS, verfügt. Damian Kelly, VP of Strategic Development, sieht großes Potential in der IVVR-Technologie: “We see an increasing demand from organisations and service providers who want the ability to quickly and easily build their own video applications, not just for 3G video phones, but for a whole range of mobile and IP devices.“
... mehr
Intelligente Spracherzeugung
18.02.2010, Informationsdienst Wissenschaft
Computerlinguisten der Universität des Saarlandes forschen daran, wie ein System aus einem bestimmten Zusammenhang heraus selbst sprachliche Anweisungen erzeugen kann. Anwendungsfeld ist eine 3D-Spiele-Welt, in welcher der Computer dem Spieler Tipps zur Navigation gibt. Alexander Koller, der im Informatik-Exzellenzcluster der Universität des Saarlandes eine Forschergruppe leitet, erklärt die Herausforderung folgendermaßen: "In verschiedenen Computerspielen gibt es schon heute eine Erzählstimme, die zum Beispiel Tipps bei der Schatzsuche gibt. Dies sind jedoch statische Anweisungen, die vorher als komplette Sätze einprogrammiert werden". Eine Situation genau analog zu heutigen IVRs. Die auf der CeBIT vorgestellte Technologie könnte eines Tages also auch zu einem radikalen Umbruch in der Kundeninteraktion führen.
... mehr
Google will Facebook und Twitter Konkurrenz machen und arbeitet an mobilem Babelfisch
08./09.02.2010, heise online
Google will seinen E-Mail-Dienst um Funktionen erweitern, die Online-Netzwerke wie Facebook und Twitter populär gemacht haben. Die Nutzer von GMail und Google Mail sollen demnächst auch kleine Botschaften und Statusmeldungen in Echtzeit an ihre Kontakte verschicken und deren Nachrichten beobachten können. Dabei wolle Google auch seine Video-Plattform YouTube sowie die Foto-Site Picasa in den neuen Dienst einbinden. Laut New York Times soll die Funktion über Add-ons für GMail realisiert werden. Ob auch Social-Network-Dienste der Konkurrenz unterstützt werden, ist derzeit noch unklar.

Was in der Science Fiction von Star Trek bis zu "Per Anhalter durch die Galaxis" zur Standardausstattung gehört, will Google "in einigen Jahren" auf der Erde anbieten. Die Übersetzung gesprochener Texte in Echtzeit soll das Mobiltelefon übernehmen. Ein Standbein der Technik könnten die bereits vorhandenen Werkzeuge zum Übersetzen von Webseiten sein, die zurzeit zwischen 52 Sprachen vermitteln. Außerdem verfügt Google über Verfahren zur Spracherkennung, die das Unternehmen bereits im Android-Betriebssystem einsetzt.
Vom Gehirn lernen: Informatiker entwickeln neue Generation von Neurocomputern
01.02.2010, Informationsdienst Wissenschaft
Intelligente Maschinen, die nicht nur mitdenken, sondern auch aktiv dazulernen, sind die Vision von Forschern des Instituts für Grundlagen der Informationsverarbeitung der TU Graz. Sie koordinieren nun drei Jahre lang das Forschungsprojekt "Brain-i-Nets" der Europäischen Union. Die Wissenschafter wollen eine neue Generation von Neurocomputern entwerfen, die auf Rechenprinzipien und Lernmechanismen im Gehirn beruht und gleichzeitig neue Erkenntnisse über Lernmechanismen im Gehirn gewinnen. Speziell die Plastizität der Verbindungen zwischen Nervenzellen hat es den Forschern angetan. Mit neuen Methoden wollen die Wissenschaftler nun herausfinden, wie das Gehirn sich lernend seiner Umgebung anpasst.
... mehr
Markteinführung der mobilen Plattform Nuance Voice Control Automotive
01.02.2010, Xdial
Nuance gibt die Markteinführung der mobilen Plattform Nuance Voice Control Automotive bekannt, eine integrierte Sprachschnittstelle für die Automobilindustrie. Diese Plattform basiert auf der Spracherkennungstechnologie von Dragon NaturallySpeaking und unterstützt die Bedienung von Connected Services während der Autofahrt, wie dem SMS-Versand oder die Abfrage von Verkehrsnachrichten, durch einfache Sprachbefehle. Nuance Voice Control Automotive bietet über eine einzige, einheitliche Sprachschnittstelle einen nahtlosen Zugang zu allen On-Board- und Connected Services. Die Lösung versteht den natürlichen Sprachfluss und erweitert sinnvoll mobile Sprachanwendungen.
... mehr
School of Design Thinking: Ideen für Supermarkt der Zukunft
01.02.2010, Märkische Allgemeine online
Geht es nach den jüngsten Entwürfen von Studenten der HPI School of Design Thinking, dann sieht ein Einkauf im Supermarkt in Zukunft so aus: Der Kunde bekommt einen Scanner in die Hand gedrückt. Er schlendert damit durch die recht eng ausfallenden Regalreihen, in denen nur noch Modelle von Produkten stehen. Was er haben möchte, scannt er an. Lediglich in der Mitte des Marktes werden einige Frischeprodukte noch auf herkömmliche Weise angeboten. Die gewünschte Ware wird erst an der Kasse automatisch aus dem Keller geliefert. Ein Vorteil: Enorme Einsparung an Energiekosten. Da nicht mehr ein riesiger Markt mit sämtlichen Produkten beleuchtet und beheizt werden muss und auch energiefressende offene Kühlregale wegfallen, könnte ein solcher „nachhaltiger Supermarkt“ rund 68 Prozent der Energiekosten einsparen.
... mehr
Voice Studio: Ihre Stimme im Garmin-Navi
28.01.2010, Computerbild
Mit Hilfe von Voice Studio können Besitzer von Navigationsgeräten ihr Gerät so personalisieren, dass die Ansagen von ihnen bekannten Stimmen erfolgen. „Sie können nun sich selbst oder die Stimme ihrer Freunde, Partner und Kinder aufzeichnen, sich so von diesen zum Ziel führen lassen und sogar diese Stimmen mit anderen nüvi-Nutzern teilen”, sagt Olaf Meng, Produktmanager Automotive bei Garmin Deutschland. Die kostenlose Anwendung Voice Studio kann unter www.garmin.de/voicestudio heruntergeladen werden. Nach der Installation können die Anwender Ansagen aufzeichnen, in Voice Studio bearbeiten und auf das Navigationsgerät laden.
... mehr
Voice-Erweiterung für Chrome und neue Google-Voice-Version fürs iPhone
26.01.2010, Futurezone + Internetworld
Google hat eine neue, mobile Version des Google-Voice-Dienstes vorgestellt, die den Zugang zum Dienst per Browser ermöglicht. Im Sommer 2009 hatte Google seinen neuen Telefoniedienst vorgestellt, der es möglich macht, eine Telefonnummer einzurichten, unter der man überall erreichbar ist. Für BlackBerry- und Android-Telefone gibt es seit einem halben Jahr eine Anwendung, die den neuen Dienst unterstützt, von Apples App Store aber wurde Google Voice entfernt. Mit der neuen Version kann der Dienst nun direkt im Browser aufgerufen und betrieben werden und muss nicht auf das Mobiltelefon heruntergeladen werden.

Und auch dem hauseigenen Browser Chrome spendierte Google eine Voice-Erweiterung. Werden auf einer Webseite Telefonnummern erwähnt, erscheinen diese als Hyperlink, sind klickbar und damit direkt als Telefonanruf wählbar. Ein Klick auf den Hyperlink aktiviert ein neues Pop-up-Fenster, in dem der Nutzer aussuchen kann, mit welchem Telefon er gegebenenfalls den Anruf durchführen möchte. Eine direkte Verbindung kann danach hergestellt werden. Auch Kurznachrichten können mittels der Voice-Erweiterung verschickt beziehungsweise gelesen werden. Für die Zukunft sei geplant, Voicemail-Playback direkt vom Pop-up-Fenster aus zugänglich zu machen.
Visual Sound: neues Handy-Konzept für Schwerhörige und Gehörlose
26.01.2010, LG Blog
Die New Yorker Studentin des Pratt Institute, Suhyun Kim, entwickelte mit "Visual Sound" ein Konzept für ein ungewöhnliches optisches Mobiltelefon, das Hörbehinderten das moderne Leben etwas erleichtern soll. Der Entwurf sieht nicht nur gut aus, sondern hat auch technisch einiges zu bieten: Per Spracherkennung und -synthese wird Sprache in Text und Text in Sprache umgewandelt. Während eines Telefonats wird die Stimme des sprechenden Anrufers simultan in Text übertragen, der über den vergrößerten ausziehbaren Touchscreen rollt. Andersherum kann ein Text eingegeben werden, der dann in Sprache umgesetzt und dem anderen Teilnehmer übermittelt wird. Das UMTS-Modell soll auch in der Lage sein, ein Videogespräch zu führen, bei dem dann auf die Gebärdensprache zurückgegriffen werden kann. Jetzt fehlt es nur noch an einem Hersteller, der das Design in Serie gehen lässt.
... mehr
ProMobile macht BlackBerry Smartphones zu professionellen Diktiergeräten
20.01.2010, OPI
Mit der Brainworks Diktiersoftware ProMobile wird das BlackBerry Smartphone zum professionellen Diktiergerät. „Mit dem BlackBerry diktieren, ungewöhnliche Mobilität erzielen und jedem Anwender die Arbeit wesentlich erleichtern, das waren unsere primären Ziele bei der Anpassung der Diktiersoftware ProMobile.“, erklärt Eduard Meiler, Geschäftsführer der Brainworks GmbH. Durch die schnelle Installation und die einfache Konfiguration können große Unternehmen die Software in kürzester Zeit allen Mitarbeitern zur Verfügung stellen. Diktate lassen sich dann innerhalb von wenigen Minuten erstellen, bearbeiten und versenden. Dabei unterstützt ProMobile den Versand der Diktate über den BlackBerry Enterprise Server, Direct TCP oder über das WLAN. Durch die Anbindung an das Unternehmensnetzwerk kann ProMobile auch auf die Unternehmensdatenbank zugreifen.
... mehr
Ein Besuch im Hotelzimmer von morgen
17.01.2010, FAZ.net
Im 5200 Quadratmeter großen Duisburger Zukunftslabor „Intelligente Raum- und Gebäudesysteme“, in dem 40 Wissenschaftler zusammen mit Industriepartnern technische Innovationen für Hotels, Büros, Wohnungen und sonstige Gebäudesysteme erproben, werden Nutzungskonzepte für das Hotel von morgen entworfen. Und das hält für den Gast allerhand Überraschungen bereit. Das fängt schon bei der Buchung an: In ein paar Jahren könnte es sein, dass der Hotelgast kein Zimmer mehr bucht, sondern eine „Raumkonstellation“. Und der Weg zum Zimmer gleicht einem Abenteuer aus der Fernsehserie „Raumschiff Enterprise“. Kein Hotelpage, sondern die „intelligente Flurbeleuchtung“ leitet den Gast zum richtigen Zimmer. Im Zimmer selbst lässt sich vieles über Spracherkennung des zimmereigenen „Bordcomputers“ steuern. Und ein Service-Roboter mit eingebauter Mini-Bar ist als fahrender Zimmerkellner unterwegs. Ein wenig unpersönlich wirkt das schon. Aber Klaus Scherer, Leiter des Fraunhofer In-Haus-Zentrums, meint, dass viele Gäste anonyme Bestellvorgänge - vor allem für Getränke - durchaus begrüßen.
... mehr
Shortcuts per Fingerzeig
13.01.2010, heise online
Ein neues Werkzeug namens Scrybe erweitert den Funktionsumfang von Touchpads und steht seit Kurzem als limitierte Betaversion bereit. Es stammt vom US-Interface-Spezialisten Synaptics aus Santa Clara. Mit Scrybe können Nutzer beispielsweise im Web suchen, in dem sie den Buchstaben "G" für Google auf das Touchpad zeichnen. Und auch eigene Gesten sind definierbar. Scrybe-Projektleiter und Synaptics-Manager Ted Theocheung sieht mit der neuen Lösung einen Paradigmenwechsel aufkommen - weg von Tastatur und Maus, hin zu einem "Gesten-Workflow", mit dem sich auch kompliziertere Jobs wie Online-Shopping oder Multimedia-Konsum direkt vom Touchpad aus erledigen lassen. Dadurch müsse man weniger tippen und die Anzahl der notwendigen Schritte verringere sich.
... mehr
Nuance präsentiert SpeechMagic 7
11.01.2010, Nuance Communications, Inc.
Nuance stellt Version 7 von SpeechMagic vor. Die Spracherkennungsplattform wurde mit besonderen Funktionalitäten für den Einsatz in Großinstallationen ausgestattet. Die Spracherkennung liefert vom Start weg hohe Erkennungsraten und fügt sich optimal in den Arbeitsalltag von Ärzten ein. Neue, einfache Integrationstools begünstigen die Einbindung in medizinische IT Systeme und gewährleisten eine schnelle Projektabwicklung, auch in standortübergreifenden Installationen. "SpeechMagic 7 wurde auf Basis der Anforderungen und des Feedbacks von über 100 Integrationspartnern entwickelt. Wir können somit auf die Erfordernisse von Krankenhäusern in ganz Europa und anderen Teilen der Welt optimal reagieren. Wir bieten diesen eine zukunftssichere Spracherkennungsplattform, die den zu erwartenden Veränderungen im Gesundheitswesen Rechnung trägt – dazu gehören virtuelle Umgebungen, Windows 7 und die Bereitstellung in großen Installationen und allen gängigen IT-Gesundheitssystemen", sagt Gernot Puck, Produktmanager SpeechMagic bei Nuance Healthcare.
... mehr
GoYellow startet anonymisierten Anrufdienst
11.01.2010, golem.de
Wer bei der neuen Servicehotline von GoYellow seine Festnetz- oder Handynummer hinterlegt, wird anonym erreichbar. Die Nummer des Angerufenen bleibt bei der Vermittlung geheim, verspricht der Betreiber. Anrufer werden dabei über ein Callcenter an den gewünschten Gesprächspartner vermittelt, ohne dessen persönliche Kontaktinformationen zu erhalten. Mit GoYellow 118000 sind Menschen auf Wunsch telefonisch erreichbar, ohne sich in ein öffentliches Verzeichnis eintragen zu müssen und ohne dass der Anrufende die Telefonnummer seines Gesprächspartners erfährt. "Mit 118000 kann jeder selbst entscheiden, wer ihn sprechen kann und wer nicht. Lästige Werbeanrufe können von vornherein abgeblockt werden", sagt GoYellow-Chef Klaus Harisch. Unternehmenssprecherin Anja Meyer sagte Golem.de: "Die Menschen sollen sagen können: Ich bin erreichbar über die 118000, und der Rest geht keinen etwas an." Die Kosten für den Dienst trage immer der Anrufer. In der Betaphase ist der 118000-Dienst noch gratis, später kosten die ersten beiden Minuten jeweils 1,59 Euro. Jede weitere Minute wird mit 29 Cent berechnet, sagte Meyer weiter. Sie hofft, dass bis Ende Februar 2010 der Bestand der Datenbank soweit angewachsen ist, dass auch 118000-Dienste für Internet-Communitys angeboten werden können.
... mehr
Google Phone mit Android-Betriebssystem: Erste Eindrücke vom Nexus One
11.01.2010, Basis Thinking Blog
Googles Smartphone, das brandneue Nexus One, ist erst seit ein paar Tagen per Internet bestellbar, doch schon jetzt wird Unmut aus den Reihen der Kunden laut: UMTS sei nicht gerade seine Stärke und 3G werde an Orten nicht erkannt, an denen andere Geräte problemlos das Signal aufnehmen. Noch schleppender aber sei der Kunden-Support, den Google für das Handy (ausschließlich via E-Mail) anbietet. Die Beantwortung von Anfragen dauere so lange, dass einige Kunden ihr Gerät bereits frustriert zurückgeschickt hätten. Dem Suchmaschinengiganten ist das Problem mit dem mangelnden Support übrigens bekannt. In einem Interview mit Walt Mossberg von AllThingsDigital sagte Google-Entwickler Andy Rubin, der das Nexus kürzlich vorgestellt hatte: "Wir müssen im Kundensupport besser werden."

Google selbst nennt sein Smartphone eine "einzigartige Kombination aus Design und Innovation". Und tatsächlich gibt es wenig, was das Nexus One nicht kann. Superschneller Prozessor, Vierband-Telefon, WLAN, Bluetooth, großer Touchscreen, Fünf-Megapixel-Kamera, GPS, digitaler Kompass, und eine Spracherkennung, mit der man sogar Webanwendungen wie Google Maps steuern kann. Die Kooperation mit dem taiwanesischen Technikhersteller HTC hat sich ausgezahlt – gerade in den Details. Das Nexus One verfügt über zwei Mikrofone, eines davon, um die Hintergrundgeräusche herauszufiltern. Und um die von vielen als störend empfundenen Fingerabdrücke auf der Rückseite zu vermeiden, wurde eine spezielle Teflonschicht aufgebracht.

Über google.com/phone kann das Gerät entweder frei für 529 US-Dollar oder zusammen mit einem Mobilfunk-Vertrag bestellt werden. Derzeit ist der Shop allerdings nur für Kunden aus den USA und in Kürze für Testmärkte in Großbritannien, Hong Kong und Singapur geöffnet. In den USA kann das "Superphone" vorerst nur mit einem Vertrag von T-Mobile gekauft werden, da es sich bei dem Gerät um die GSM-Version handelt und andere Provider wie Verizon und Spring einen anderen Mobilfunkstandard unterstützen. Natürlich steht es Kunden auch frei, ihre AT&T-SIM-Karte in das Gerät einzulegen, dann steht ihnen allerdings kein flottes 3G-Netz zur Verfügung.
ShoutOUT: Spracherkennung für iPhone kommt nach Deutschland
10.01.2010, Teletarif
Das amerikanisch-australisische Software-Unternehmen promptu.com zeigte zur Consumer Electronics Show (CES 2010) in Las Vegas eine Spracherkennungssoftware für Smartphones: ShoutOUT, das seit kurzem im US-amerikanischen AppStore für das Apple iPhone verfügbar ist. Das Programm zeichnet den vom Nutzer gesprochenen Text auf, komprimiert die Sprachdaten und überträgt diese über das Internet an einen Server von promptu.com. Dieser analyisiert die erhaltenen Sprachdaten und sendet den Text an die App zurück. Dort wird der Text dann wiederum an die passende Stelle in der SMS-Anwendung eingetragen. Aktuell ist ShoutOUT auf die Anwendung Speech-to-SMS reduziert, man kann damit also nur Kurzmitteilungen versenden. Parallel zur iPhone-App arbeitet promptu.com auch an ähnlichen Softwarelösungen für andere Handy-Betriebssysteme. Auch hier soll zu Beginn SMS mit Spracherkennung unterstützt werden, danach folgen die beliebten Social-Media-Dienste Twitter und Facebook und dann E-Mail.
... mehr
Spredfast misst Social-Media-Wirkung
04.01.2010, heise online
2009 könnte als das Jahr in die Technikgeschichte eingehen, in dem das soziale Web erwachsen wurde. Die Anzahl der Facebook-Nutzer schnellte auf 350 Millionen hoch, Twitter wurde zum normalen Kommunikationskanal und LinkedIn startete einen Dienst, mit dem Headhunter das Netzwerk nach neuen Mitarbeitern durchsuchen können. Und auch etliche Unternehmen sprangen mit Firmenblogs, Twitter-Mitteilung oder User Generated Content auf den Web-2.0-Zug auf. In manchen Chefetagen würde man allerdings gerne wissen, ob sich diese Aktivitäten wirklich rechnen. Die Antwort könnte vielleicht das Start-up Social Agency aus dem texanischen Austin geben. Im Dezember startete es den Webdienst Spredfast. Dieser soll Unternehmen nicht nur helfen, ihre Social-Media-Aktivitäten besser zu managen, sondern auch deren Erfolg zu messen. Spredfast zählt, wie viele Nutzer Firmenmitteilungen auf Twitter, Facebook, LinkedIn, YouTube oder Flickr wirklich aufrufen. Ebenso wird die Wirkung von Blogeinträgen auf Plattformen wie Moveable Type, WordPress, Blogger, Lotus Live oder Drupal verfolgt. Dabei liefert Spredfast nicht nur simple Klickraten, sondern untersucht auch, wie Nutzer auf die Inhalte reagieren, etwa ob Blogeinträge kommentiert oder Twitter-Mitteilungen weitergeschickt werden. Ziel sei, Unternehmen verlässliche Daten zu liefern, ob das Spiel mit dem Web 2.0 Produkte und Marken auch wirklich bekannter mache.
... mehr
RoboBraille und Loquendo bieten Service für Seh- und Lesebeeinträchtigte
15.12.2009, Loquendo
RoboBraille präsentiert einen E-Mail-Service, der auf der Sprachsynthese von Loquendo basiert. Das Produkt wandelt Textdokumente in eine Vielzahl alternativer Formate für seh- bzw. lesebeeinträchtige Menschen um: Braille, Audiodateien oder DAISY. Derzeit unterstützt der Service sieben Sprachen. Die Gründe für die Wahl der Loquendo TTS für den RoboBraille-Service waren die lebendigen und ausdrucksvollen synthetischen Stimmen und das breite Spektrum an verfügbaren Sprachen. "The RoboBraille team decided that Loquendo was the speech engine of choice because our visually impaired and reading impaired users found the speech engines from Loquendo fluent and intelligible" so Lars Ballieu Christensen, Koordinator von RoboBraille.
... mehr
Nuance Dragon Dictation jetzt im App Store
08.12.2009, Nuance Communications, Inc.
Die Dragon Dictation App von Nuance ist im US-AppStore angekommen. Mit Dragon Dictation können iPhone-Besitzer Emails und Textnachrichten einfach diktieren statt sie zu tippen. Darüber hinaus lassen sich mit der App auch Nachrichten in anderen Apps - wie Facebook oder Twitter - hinterlassen. Derzeit steht die Diktiersoftware kostenlos zur Verfügung - allerdings nur für begrenzte Zeit.
“Dragon Dictation takes the messaging experience on the revolutionary iPhone to a whole new level,” said Michael Thompson, senior vice president and general manager, Nuance Mobile. “Dragon Dictation is also incredibly natural and intuitive. Users will soon find they’re speaking more than typing using the power of speech to communicate even faster, whatever they’re doing and wherever they are."
Ob und wann die App auch hierzulande den Sprung in den AppStore schafft ist noch ungewiss.
... mehr
Künstliche Intelligenz - neu überdacht
08.12.2009, heise online
Im Mind Machine Project arbeiten rund zwei Dutzend Professoren zusammen, darunter so illustre Geister wie die KI-Legende Marvin Minsky oder der Leiter des Center for Bits and Atoms, Neil Gershenfeld. „Es gibt noch immer kein Programm, das nach einem Blick in ein Zimmer sagen kann, da sitzt ein Mensch, da steht ein Glas Wasser auf dem Tisch. Kein Computer kann auch nur einfache Geschichten verstehen“, hatte Minsky bereits 2006 - anlässlich des 50jährigen Jubiläums der KI-Forung kritisiert - und seinen Forscherkollegen mangelnde geistige Beweglichkeit vorgeworfen. Nun wollen Gershenfeld und seine Kollegen "noch einmal zurück gehen, und das reparieren, was kaputt gegangen ist". In drei Themenfeldern sei die KI-Forschung stecken geblieben - diese sollen mit Hilfe von Teilprojekten neu angegangen werden: Das erste Teilgebiet betreffe "die Modellierung des Denkens".  Hier müsse es darum gehen, die Vielzahl der bereits existierenden Modell zu einem funktionierenden Ganzen zu verbinden. Das zweite Projekt betreffe die Erforschung des Gedächtnisses - insbesondere die Einbeziehung von zweideutigen, unscharfen Erinnerungen und Assoziationen. Und schließlich wollen sich die Projektteilnehmer mit der Wechselwirkung zwischen physischem Körper und Intelligenz beschäftigen.
... mehr
VoiceCash Prepaid Karte löst Kreditkartenmissbrauchs-Risiko
23.11.2009, Pressrelations
Für Kreditkarteninhaber waren die letzten Wochen äußerst unerfreulich. Mehr als 100.000 Kreditkarten wurden deutschlandweit eingezogen und sollen schnellstmöglich ausgetauscht werden. Vorangegangen war ein mutmaßlicher Diebstahl von Nutzerdaten. Wegen der öffentlich gewordenen Sicherheitslücken bekommen Kreditkarten ein Imageproblem. Doch welche anderen Möglichkeiten gibt es für Verbraucher? Eine Lösung bietet die VoiceCash Gruppe mit ihrer Prepaid MasterCard. Das Missbrauchsrisiko ist äußerst begrenzt, da es zum einen eine rein guthabengeführte Karte ist, auf die jeweils nur der Betrag geladen wird, über den man auch verfügen möchte. Und zum anderen bietet die Karte ein zusätzliches Sicherheitsmerkmal: Die patentierte Stimmerkennungs-Technologie von VoiceTrust. Damit können Bezahlvorgänge mit der eigenen Stimme autorisiert werden.
... mehr
Live-Untertitelung von Parlamentsdebatten
23.11.2009, derStandard.at
Das österreichische Parlament will die im Fernsehen übertragenen Parlaments-Sitzungen mehr Menschen zugänglich machen: Im konkreten Fall speziell den Gehörlosen oder stark Hörbehinderten. Im Rahmen eines gemeinsamen Pilotprojekts von ORF und Parlament wird ein Spracherkennungssystem entwickelt, das die Live-Untertitelung der Parlamentsdebatten ermöglicht. Das System soll erstmals bei den kommenden Plenarsitzungen am 10. und 11. Dezember zeigen, was es zu leisten im Stande ist. "Wir müssen das jetzt erstmals in der Praxis ausprobieren", so der Leiter der Öffentlichkeitsarbeit des Parlaments zu derStandard.at. "Ich bin aber zuversichtlich, dass eventuell lediglich kleinere Anpassung nötig sein werden."
... mehr
Youtube untertitelt Videos per Spracherkennung automatisch
20.11.2009, Golem.de
Videos bei Youtube zu untertiteln war mühsam - bis jetzt: Durch Spracherkennung können Youtube-Videos künftig auch automatisch untertitelt werden. Die Spracherkennung stammt von Google Voice und wird normalerweise zur Umwandlung von Sprachnachrichten in Text eingesetzt. Ist ein Video untertitelt, lässt es sich auch mit Gogol Suchmaschinen durchsuchen. Wer weiterhin lieber auf manuelle Untertitelungen setzt, profitiert ebenfalls von der Spracherkennung. In der Vergangenheit mussten die Untertitel immer mit genauen Timecodes als Textdatei heraufgeladen werden, damit Youtube die Titel zur richtigen Zeit einblendet. Mit der automatischen Texterkennung synchronisiert Youtube die vom Anwender bereitgestellten Texte automatisch mit dem Video. Die automatische Untertitelung wird zunächst nur in einer Handvoll von Partnerkanälen angeboten und ist nur für englischsprachige Videos verfügbar. Die Funktion zur Synchronisation von Text und Video soll hingegen für alle Videos bereitgestellt werden. Künftig will Google auch andere Sprachen und Kanäle unterstützten, einen Zeitplan nannte das Unternehmen jedoch nicht.
... mehr
Loquendo veröffentlicht ASR 7.8
19.11.2009, Loquendo
Loquendo veröffentlicht Version 7.8 seiner Spracherkennungssoftware Loquendo ASR. Die neueste Version bietet einige Verbesserungen und soll eine noch genauere Erkennung von natürlicher spontaner Sprache ermöglichen. Der Spracherkenner kann in Version 7.8 mit phonetischen Transkriptionen in X-SAMPA umgehen und die automatisch erstellten Lexika beruhen ebenfalls auf X-SAMPA. Das Loquendo Acoustic Model Adaptation Tool wurde optimiert und erlaubt nun die schnellere Entwicklung von an einen Sprecher bzw. an eine bestimmte Umgebung angepassten akustischen Modellen. Die mehrsprachige ASR bietet akustische Modelle für den Einsatz in speziellen Telefonie-Umgebungen (Festnetz, Mobilfunk, VoIP) und für laute Umgebungen, wie beispielsweise das Auto. Das Produkt ist für Windows und Linux erhältlich und unterstützt alle gängigen Embedded-Betriebssysteme.
... mehr
Diktiersoftware ProMobile jetzt auch kompatibel mit dem Apple iPhone
17.11.2009, Firmenpresse
Pünktlich zur MEDICA 2009 präsentiert die Brainworks GmbH eine iPhone-Version der Diktiersoftware ProMobile. Damit lässt sich das iPhone als professionelles Diktiergerät nutzen. "User erhalten eine flexible und mobile Diktierlösung, die einfache Handhabung und Verlässlichkeit bietet. Zudem wird unsere Software aktuellen Sicherheitsanforderungen gerecht und verschlüsselt Diktate nach den heute geltenden Standards. Erstellte und bearbeitete Diktate können jeweils über UMTS, WLAN, GPRS oder E-Mail an bereits vorhandene digitale Diktiersysteme versendet werden und ermöglichen die einfache Anbindung an bestehende Unternehmensnetzwerke", erklärt Eduard Meiler, Geschäftsführer der Brainworks GmbH.
... mehr
Spracherkennung im Großformat: Nuance bringt SpeechMagic Solution Builder 2.0 auf den Markt
11.11.2009, Nuance Communications, Inc.
SpeechMagic Solution Builder 2.0 ermöglicht erstmalig den standortübergreifenden Zugriff auf das Spracherkennungssystem durch bis zu 1.500 Ärzte gleichzeitig. Die weiterentwickelte Spracherkennungsfunktion unterstützt strukturierte Befunde für die Nutzung in der Patientenakte. Zusätzlich zum Effizienzgewinn durch Spracherkennung, beschleunigen neue Funktionalitäten für Autotext und Dokumentvorlagen den Diktiervorgang um weitere 20%. "[Wir haben das Dokumentationsverhalten von Ärzten] bis ins Detail analysiert, um Spracherkennung völlig natürlich in den Arbeitsalltag einzubinden. So können wir jetzt die Struktur von elektronischen Patientenakten direkt im Spracherkennungseditor abbilden. Die Ärzte navigieren dadurch schneller durch die entsprechenden Felder und die Informationen werden EPA-fertig erfasst", erklärt Gerhard Schuberth, Geschäftsführer von Nuance Healthcare, DACH.
... mehr
Horror per Handy: Werbeagentur Jung von Matt konzipiert sprachgesteuerten Kinofilm
10.11.2009, NeueNachricht
Was man mit Sprachsteuerung schon heute mit Handys veranstalten kann, beweist der interaktive Horrorfilm "Last Call" von der Werbeagentur Jung von Matt. Hier können Kinobesucher per Sprache und Handy aktiv ins Geschehen eingreifen. "Wir wollen zwei Grenzen aufheben: Die eine zwischen Film und Game, die andere zwischen Handlung und Zuschauer", erklärt Andreas Henke, Creative Director von Jung von Matt, im Interview mit NeueNachricht. Henke präsentierte den Film beim Nuance-Fachkongress Conversations DACH.
... mehr
iPhone-Programm übersetzt während der Spanienreise
10.11.2009, Handelsblatt
Nie wieder sprachlos im Urlaub: Eine Gruppe von Forschern aus Deutschland und den USA hat ein Dolmetscherprogramm für das iPhone entwickelt: "Jibbigo" beherrscht Spanisch und Englisch. Der Nutzer spricht einzelne Sätze in das Mikrofon des Smartphones und postwendend liefert Jibbigo die Übersetzung als Text- und Sprachversion. 40 000 Wörter umfasst das Vokabular. Die Datenbank ist auf dem iPhone gespeichert. "Jibbigo benötigt daher keinen Zugang zum Internet oder zu einem Server", sagt Alex Waibel, Informatik-Professor am Karlsruhe Institute of Technology sowie an der Carnegie Mellon University in Pittsburgh. Derzeit arbeiten die Forscher daran, das Angebot um weitere Sprachen zu ergänzen. Apple vertreibt die Software für knapp 20 Euro.
... mehr
Sprachanalyse-Algorithmus erkennt Depressionen
05.11.2009, heise online
Der Ton macht die Musik, heißt es im Volksmund. Auch für Alex Pentland vom MIT: Der Leiter des Human Dynamics Lab erforscht, was Tonfall und Stimmlage, Länge und Häufigkeit von Pausen sowie Geschwindigkeit beim Reden über die Stimmungslage einer Person verraten. Seine Gruppe entwickelt Algorithmen zur Sprachanalyse, die ermitteln sollen, ob jemand von Ängsten geplagt, vereinsamt oder depressiv ist. Die MIT-Ausgründung Cogito Health will Pentlands Forschungsergebnisse nun in einer Sprachanalyse-Software vermarkten, die eine solche Diagnose über das Telefon vornehmen kann.
... mehr
Microsoft setzt verstärkt auf Sprachtechnologie
03.11.2009, eweekeurope + Winfuture
Softwarehersteller Microsoft will künftig stärker auf den Einsatz von Sprachtechnologie, speziell von Spracherkennung setzen. Dies kündigte Microsoft in einer Pressemeldung an. Bereits das neue Betriebssystem Windows 7 verfügt laut Hersteller über eine verbesserte Spracherkennung. In Zukunft sollen auch die Microsoft-Suchmaschine Bing vom Mobiltelefon aus per Spracherkennung steuerbar sein und Outlook 2010 mit einer Voice2Text-Komponente ausgestattet werden: Aus Voicemail-Nachrichten wird ein Vorschau-Text extrahiert, der dem Nutzer vor dem Anhören der Voice-Mail dabei hilft, die Nachrichten vorzuklassifizieren und zu priorisieren.
SVOX mit neuer Sprachsoftware-Version
03.11.2009, SpeechTechMag
Die neue Version 9.1 der SVOX-Sprachsoftware ist laut Hersteller unter anderem ausgestattet mit einer verbesserten Text2Phone-Konvertierung und optimierten akustischen Modellen für Deutsch und Englisch. Die Software ist für den Einsatz im Automotive- und im Mobile-Bereich optimiert: "This latest improvement of SVOX core speech recognition technology allows our automotive and mobile customers to achieve even higher recognition rates in even more difficult noise conditions," so SVOX CEO Martin Reber. Weiter sieht Reber in den genannten Verbesserungen einen wichtigen Meilenstein für die weitere Etablierung von Sprachtechnologie im mobilen Sektor, in dem die Sprachtechnologie einen wichtigen Beitrag zur Nutzerfreundlichkeit leiste.
... mehr
Erster Entwurf für Emotion Markup Language (EmotionML) 1.0 veröffentlicht
30.10.2009, W3C
Mit dem Erarbeiten eines Emotion Markup Language Standards schafft die Multimodal Interaction Working Group eine wichtige Basis für Emotionserkennung und Emotionsgenerierung in der Mensch-Maschine Interaktion. Anwendung findet die Markup-Language zum Beispiel bei der Annotation von emotionalen Merkmalen in Texten und Bildern, bei der Emotionserkennung oder bei der Erzeugung von Emotion - z.B. durch Sprachsynthese. Dadurch wird eine bislang eher am Rande existierende sprachtechnologische Dimension vertieft: Lag der Schwerpunkt bislang verstärkt auf den rein linguistischen Merkmalen von Sprache - ergeben sich nun weiterreichende Möglichkeiten im paralinguistischen Bereich der Emotion. Die Etablierung des Standards basiert auf wissenschaftlich fundierten Erkenntnissen, gleichzeitig wurde aber auch auf die praktische Anwendbarkeit Wert gelegt.
... mehr
Google startet kostenloses Navigationssystem
28.10.2009, heise online
Nach Bekanntwerden der Nachricht stürzten die Aktien von Anbietern wie der niederländischen TomTom und von Garmin in den Keller: Google bringt ein vollkommen kosten- und werbefreies Navigationssystem für Android-Smartphones auf den Markt. Ein hochwertiges Produkt, welches nicht nur die Datenbasis von Google Maps mit einschließt, sondern auch über eine ausgereifte Spracherkennung verfügt, wie Google in einem Werbevideo demonstriert. Das System versteht nicht nur Einzelwortkommandos, es lässt auch natürliche Eingaben in ganzen Sätzen oder Phrasen zu. Zudem sind neben Orten und Straßen auch Points of Interest und temporäre Ziele wie z.B. die Namen von Ausstellungen integriert. Mit dieser Applikation, die bislang nur für den US-Markt verfügbar ist, dürfte Google ein wichtiger Schlag gegen Apple's iPhone und das Microsoft-Betriebssystem Windows Mobile gelungen sein.
... mehr
System zur visuellen Emotions-Erkennung verbessert multimodale Dialogsysteme
22.10.2009, University of Surrey
Sprache lässt sich besser verstehen, wenn auch der visuelle Kommunikationskanal zu Verfügung steht. Jetzt haben Forscher an der Universität von Surrey eine automatisierte Methode entwickelt, relevante visuelle Signale für das Verstehen von Sprache auszuwerten. Im Vordergrund steht dabei die Emotionserkennung. Dazu wurden Videoaufnahmen von menschlicher Konversation analysiert und annotiert und als Trainingsmaterial genutzt. Tim Sheerman-Chase, leitender Forscher in diesem Projekt, sieht einen Durchbruch in der visuellen Emotionserkennung: "This is a new direction in emotion recognition. Most previous work focused on actors or artificial social situations. The ability for computers to understand meaning in natural conversation is key to being able to use our innate communication skills to use computers." Neben seiner Relevanz für multimodale Dialogsysteme verdeutlicht dieser Fall auch sehr gut die Notwendigkeit für eine standardisierte Emotion Markup Language.
... mehr
Neue Technologie für E-Book Reader
22.10.2009, heise online + golem.de
Pünktlich zur Frankfurter Buchmesse drängen neue Lesegeräte für E-Books auf den Markt. Bislang ist das Interesse der Käufer aber gering. Seit dem 19. Oktober verkauft Amazon seinen eBook-Reader Kindle auch an Kunden außerhalb der USA. Zum internationalen Verkaufsstart stehen allerdings nur englischsprachige eBooks zum Download bereit. Kunden aus Deutschland können aus über 250.000 englischsprachigen eBooks und diversen Zeitschriften auswählen.
Auch das Berliner Startup txtr hat sein E-Book-Lesegerät txtr Reader auf der Frankfurter Buchmesse vorgestellt. Der Reader soll für 320 Euro ab dem 15. Dezember in Deutschland erhältlich sein. Bis zum Verkaufsstart will Txtr 20.000 E-Books im Format EPUB bereitstellen, es wäre dann das größte Angebot für deutschsprachige EPUBs.
E-Book-Reader gibt es inzwischen eine ganze Reihe auf dem Markt, deshalb setzen die Anbieter auf neue Technologien, um sich von den Konkurrenten zu unterscheiden. LG hat ein E-Book vorgestellt, dessen Akku sich über eine Solarzelle aufladen lässt. Die Dünnschicht-Solarzelle befindet sich im aufklappbaren E-Book und ist dünner als eine Kreditkarte. Die US-Buchhandelskette Barnes & Noble hat ihren E-Book-Reader Nook vorgestellt. Wichtigstes Unterscheidungsmerkmal zu anderen Lesengeräten sind die zwei Bildschirme: ein schwarz-weißer zum Lesen und ein farbiger für das Nutzermenü. Und Anfang Januar 2010 will Plastic Logic seinen großen, vor allem für den geschäftlichen Einsatz konzipierten E-Book-Reader Quer Proreader präsentieren, der auf seinem robusten Display digitale Ausgaben von Magazinen und Zeitschriften in Originalgröße darstellen kann und als Touchscreen die Bedienung vereinfacht, ohne die Darstellung zu beeinträchtigen.
WolframAlpha fürs iPhone
20.10.2009, Connect
Im Mai dieses Jahres hat der Entwickler Steven Wolfram seine Antwortmaschine WolframAlpha an den Start gebracht. Im Gegensatz zu Suchmaschinen wie Google liefert WolframAlpha statt weiterführender Links Inhalte. Jetzt ist die Anwendung auch für das iPhone erhältlich. Im App Store können User WolframAlpha iPhone für knapp 50 Dollar herunterladen. Das Programm wurde für das Apple-Smartphone optimiert und bietet unter anderem ein spezielles Keyboard mit Sonderzeichen, über das beispielsweise komplexe Formeln eingetippt werden können. Die Ergebnisanzeige ist ebenfalls aufs iPhone abgestimmt, außerdem sind in WolframAlpha Funktionen wie Maps und andere Services des Smartphones eingebunden. Mit WolframAlpha ist das iPhone laut Anbieter unter anderem als wissenschaftlicher Taschenrechner nutzbar. Die Anwendung soll deshalb auch für Wirtschafts- und Finanzanalysen geeignet sein.
... mehr
VoiceCorp startet mit einer iPhone-Anwendung zur Sprachwiedergabe von RSS-Feeds
19.10.2009, Pressebox
VoiceCorp hat eine Anwendung für iPhone und iPod Touch entwickelt, die es den Anbietern von Web-Inhalten erlaubt, hochqualitative Podcasts aus ihren RSS-Feeds zur Verfügung zu stellen. Der automatisierte Podcast-Dienst basiert auf dem ReadSpeaker podCaster und ist ein Podcast-Player für das iPhone, der aus einem RSS-Feed eine Audio-Version erstellt und diese vorliest. Neben dem iPhone ist die Anwendung auch für Android-Telefone verfügbar. Versionen für Blackberry und Java sollen folgen. "Mit Hilfe der auf unserem ReadSpeaker podCaster basierenden iPhone-Anwendung werden Web-Inhalte für eine größere Zielgruppe zugänglich gemacht, da man hiermit genau jene Menschen erreicht, die sich Nachrichten und andere Web-Inhalte lieber anhören anstatt sie zu lesen", sagt Niclas Bergstrom, Geschäftsführer von VoiceCorp. "Dies kann von Menschen mit Leseschwäche bis hin zu Geschäftsleuten reichen, die die neuesten Nachrichten hören möchten, während sie mit etwas anderem beschäftigt sind."
... mehr
Neue Speech-to-Text-Funktion für Nortels Unified Messaging Platform
14.10.2009, TMC
Visual Voice ist eine gemeinschaftliche Entwicklung von SpinVox und Mutare Software und ermöglicht eine neue Speech-to-Text-Funktion für Nortels Unified Messaging Platform zur Verwaltung von Voicemail. Visual Voice überträgt gesprochene Inhalte einer Voicemail in geschriebenen Text und schickt diese Nachricht inklusive Anrufer-Name, Telefonnummer, E-Mail-Adresse und möglichem Audio-Inhalt an bis zu fünf E-Mail-Accounts oder jedes Smartphone, PDA oder Handy. "The SpinVox and Mutare Software powered Visual Voice capability for Nortel CallPilot will be a boon to business users, simplifying day-to-day communications and helping workers be more efficient and productive.", so Ben Crown, CEO von Mutare Software.
... mehr
Avaya Aura für den Mittelstand
12.10.2009, Avaya
Avaya stellt eine neue Version ihrer offenen Unified Communications (UC)-Plattform Avaya Aura™ für Unternehmen mittlerer Größe vor. Mit einem einzigen Server können Unternehmen mit 100 bis 2.400 Mitarbeitern künftig UC-Anwendungen zentral für bis zu 250 Standorte zur Verfügung stellen. Die neue Lösung ist eine der ersten Kommunikationslösungen, die mit der Avaya Aura System-Plattform eine standard-basierte Virtualisierungstechnologie nutzt. Avaya Aura für den Mittelstand läuft auf allen gängigen Servern, die von Avaya im Hinblick auf Sicherheit, Skalierbarkeit und Ausfallsicherheit zertifiziert worden sind.
... mehr
Prima Diktieren mit Spracherkennung Dictate
08.10.2009, Macwelt
Macspeech Dictate ist der Nachfolger des deutlich in die Jahre gekommenen iListen von Macspeech. Das neue Diktierprogramm basiert auf der bewährten Sprachengine von Dragon Naturally Speaking. Nun erschien die deutsch-lokalisierte Version. Nach der Installation ist lediglich ein kurzer Text zu diktieren, bevor das Mikrofon auf die eigene Stimme eingestellt ist und es richtig losgehen kann. Nach 15 bis 20 Minuten ist das komplette Eingangsprozedere erledigt. Es schadet aber nicht, möglichst bald vorliegende eigene Texte durch Dictate analysieren zu lassen, was im Unterschied zu früheren iListen-Versionen jetzt zuverlässig funktioniert. Damit wird der Spracherkennung auch selteneres Vokabular umstandslos hinzugefügt.
... mehr
VOICETRUST stellt Business Suites zur Sprecher-Erkennung vor
06.10.2009, Presse Anzeiger
Mit der "Enterprise Suite", der "Callcenter Suite" und der "Banking Suite" können insbesondere Callcenter und Finanzdienstleister nun auf ein Bündel von Modulen zur Sprecher-Erkennung zurückgreifen. "Mit einer breiten Palette an branchenspezifischen Lösungen reagieren wir auf das Bedürfnis vieler Wirtschaftszweige, gleichzeitig Sicherheit, Komfort und Effizienz zu steigern", sagt General Manager Joachim Fischer. Die "Enterprise Suite" basiert auf dem Industriestandard, den VOICETRUST mit seinem Password Reset gesetzt hat. Die "Callcenter Suite" ist auf bessere und sichere Kundenbetreuung spezialisiert. Und die "Banking Suite" gibt vor dem Hintergrund zunehmender Phishing-Attacken und Kartendiebstähle den Kunden von Banken und Kreditkartenfirmen zusätzliche Sicherheit.
... mehr
LG bringt Uhrenhandy auf den deutschen Markt
06.10.2009, heise online
Der koreanische Elektronikkonzern bringt sein zum Mobile World Congress im Februar angekündigtes Uhrenhandy GD910 auf den deutschen Markt. Bei der Bedienung setzt LG nicht nur auf den 1,4 Zoll großen Touchscreen, sondern auch auf Spracheingabe und eine Text-to-Speech-Engine. Viele Handy-übliche Funktionen vermisst man allerdings bei dem winzigen Uhrenhandy. Wer aber vor allem Wert auf eine schicke (und 91 Gramm schwere) Armbanduhr legt, kann aus acht verschiedenen Anzeigeformaten wählen. In Großbritannien war das Handy nur in einer limitierten Auflage erhältlich. In Deutschland soll das Gerät 999 Euro kosten.
... mehr
E-Book-Reader mit Handschrifterkennung
25.09.2009, heise online
Der Hamburger Anbieter für Sprachencomputer Hexaglot bringt einen E-Book-Reader mit Handschrifterkennung auf den deutschen Markt. Zur Bedienung steht außer mechanischen Tasten ein Plastikstift zur Verfügung, der das Zeichnen und Schreiben auf dem Display ermöglicht. Handschriftliche Notizen soll der Reader in Drucktext umwandeln können, Texte lassen sich zudem über eine virtuelle Tastatur schreiben.
... mehr
Informationen schnell organisieren - Intuitives Wissensmanagement mit semantischer Sprachtechnologie
25.09.2009, Informationsdienst Wissenschaft
Der Erfolg der Online-Enzyklopädie Wikipedia zeigt eindrucksvoll, dass Wikis sehr erfolgreich zum Wissensmanagement eingesetzt werden können. Doch in vielen anderen Fällen fehlen die Heerscharen von hoch-motivierten "Wikipedians", die in ihrer Freizeit mit großem Aufwand die Inhalte strukturieren und verbessern. Gerade in Unternehmen entwickeln sich Wikis oft unkontrolliert zu einem zwar reichhaltigen, aber unübersichtlichen Informations-Chaos. Damit gerät das Prinzip "Wiki" an seine Grenzen, denn schnell verliert der Einzelne den Überblick über die Fülle der Informationen. Mitarbeiter der Arbeitsgruppe "Ubiquitous Knowledge Processing" (UKP Lab) der TU Darmstadt erforschen derzeit unter Leitung von Prof. Dr. Iryna Gurevych, wie sich Ordnung in dieses Chaos bringen lässt.
... mehr
Erste sprachgesteuerte Projektplanung
22.09.2009, Pressebox
Als Zusatzprogramm zu Microsoft Project 2007 erlaubt es ProVokale, alle wesentlichen Befehle für die Pflege der Projektdaten per Sprache einzugeben. Insbesondere die komplexen Befehle wurden durch Spracheingabe verfügbar gemacht, sodass der Projektleiter sehr rasch einen vollständigen Termin- und Ressourcenplan erstellen kann, ohne die Maus und die Tastatur benutzen zu müssen. Durch diesen Ansatz muss der Projektleiter nicht wissen, wo sich die Befehle verstecken! Es genügt, dass er weiß, was er tun möchte und anstatt sich mit der Maus durch die verschiedenen Menüs zu klicken, konzentriert er sich auf die Eingabe der Daten.
... mehr
Avaya IP Office 5 bietet kleinen Unternehmen leichteren Zugang zu Unified Communications und besserem Kundenservice
21.09.2009, Avaya
Avaya präsentiert die neue Version von Avaya IP Office speziell für kleine und mittlere Unternehmen (KMU). Mit Release 5 der Anwendung können KMU Unified Communications künftig einfacher in ihre Geschäftskommunikation einbinden und damit ihren Kundenservice verbessern. Gleichzeitig stehen zahlreiche neue Funktionen zur Verfügung, die sowohl die Skalierbarkeit und Ausfallsicherheit der Lösung als auch die Produktivität von Unternehmen steigern. Mit dem neuen Release stehen auch Verbesserungen für den Einsatz im Contact Center an. So steht eine neue Anwendung für die Berichterstellung in Contact Centern zur Verfügung, die auch über das Internet zugänglich ist und einfacher installiert, aktualisiert und verwendet werden kann.
... mehr
Nuance Speak & See Suite für die vereinfachte PC-Nutzung
14.09.2009, Nuance Communications, Inc.
Nuance präsentiert die neue Softwarelösung Speak & See Suite. Mit vier verschiedenen Programmen in einem einzigen Softwarepaket (Spracherkennung, Vorlesefunktionen, Bildschirmlineal, Bildschirmvergrößerung und Farbüberlagerungen) unterstützt das System PC-Anwender, die mit Lese- oder Rechtschreibschwächen zu kämpfen haben, unter Sehschwäche oder –behinderungen leiden, Deutsch nicht als Muttersprache sprechen bzw. Fremdsprachen erlernen möchten. Schülerinnen und Schülern mit unterschiedlichen Voraussetzungen und Bedürfnissen bietet die Software einen einfachen Zugriff auf Texte und Informationen.
... mehr
Im Dialog mit der Maschine
11.09.2009, Funkschau
Die Sikom Software GmbH hat zusammen mit dem Fraunhofer Institut für Produktionstechnik und Automatisierung eine universelle Software-Schnittstelle zwischen Sprachplattformen und industriellen Software-Werkzeugen entwickelt. Damit wird es möglich, industrielle Applikationen in ihrem Softwarekern mit einer Sprachdialog-Eingabe zu versehen und Daten per Sprache direkt in das System einzugeben.
... mehr
Hände frei beim Autofahren
10.09.2009, Telenet
Das Telefonieren ist im Auto nur noch über Freisprechanlage erlaubt, die Bedienung anderer Geräte wie das Navigationsgerät per Hand in den USA bereits heute untersagt. Der Bedarf an Applikationen, die eine Steuerung elektronischer Geräte im Auto auch per Sprache oder Geste erlauben, wird demnach über kurz oder lang steigen – vom Komfort, die solche Anwendungen dem Nutzer bieten können, einmal ganz abgesehen. Mit FlexMedia präsentieren SemVox und Telenet auf der diesjährigen Internationalen Automobil Ausstellung (IAA) ein System, mit dem der Nutzer einfach und schnell, überall und jederzeit auf beliebige Geräte und Inhalte zugreifen kann.
... mehr
Nuance-Technologie für Mercedes-Benz und BMW
09.09.2009, Nuance Communications, Inc.
Die Spracherkennungslösung ’One-Shot Destination Entry’ von Nuance kommt ab sofort in den On-Board-Navigationsgeräten der aktuellen S-Klasse von Mercedes-Benz sowie in den neuen mobilen Traffic-Assistant-Navigationsgeräten Z204 und Z205 von Becker zum Einsatz. Mit der One-Shot-Destination-Entry-Technologie kann der Nutzer die komplette Zieladresse mit einem einzigen Sprachbefehl eingeben, statt wie bisher Schritt für Schritt, zuerst den Orts- und dann den Straßennamen anzugeben.
Auch die neuen BMW-Modelle setzen auf Nuance-Technologie für die sprachbasierte Musikwahl und Adresseingabe. Mit der neuen Systemgeneration haben BMW-Fahrer nun die Möglichkeit, in einem natürlichen Sprachfluss verschiedene Funktionen im Fahrzeug zu bedienen. Sie können per Spracheingabe nach Musiktiteln suchen und Zieladressen mit einem einzigen Sprachbefehl eingeben. Die Ablenkungsgefahr, die eine manuelle Eingabe mit sich bringt, ist dadurch drastisch reduziert.
Twittern und Chatten via Spracherkennung
02.09.2009, maccommunity
Die neue Version 3.4 des iPhone-Instant-Messaging- und Twitter-Clients IM+ bietet nun auch eine Spracherkennungs-Funktion. Damit lassen sich Sprachaufnahme in Text umwandeln. Somit ermöglicht die Anwendung das Twittern und Chatten per Spracheingabe. Bisher steht die Software allerdings nur für Englisch zur Verfügung.
... mehr
Google integriert Übersetzungsfunktion Translate in Office-Applikation
28.08.2009, golem.de
Nach Googles E-Mail-Dienst lernt jetzt auch die Office-Anwendung Google Docs Fremdsprachen. Durch die Integration der Übersetzungsfunktion Translate lassen sich Dokumente in 51 Sprachen übertragen. Die Ergebnisse der maschinellen Übersetzung lassen oft zu wünschen übrig, das gibt auch Google zu. Das Unternehmen arbeite aber "kontinuierlich daran, die Qualität der Übersetzungen mit der Zeit zu verbessern", heißt es.
Zu den 51 Sprachen, die Googles automatischer Übersetzungsdienst meistert, gehören unter anderem alle 23 offiziellen Sprachen der EU. Mittlerweile sind es 2.550 Sprachpaare - also Kombinationen von Urprungs- und Zielsprachen - in die Übersetzungen möglich sind.
Multimodale Eventsuche auf dem Handy
27.08.2009, Telenet
Auf der diesjährigen IFA präsentierten SemVox und Telenet ein gemeinsam entwickeltes System, das die Suche und Buchung von Veranstaltung noch einfacher, flexibler und vor allem mobiler gestalten soll. Der multimodale Eventkalender für das Handy bietet seinen Anwendern vollkommen neue Freiräume: Alle Anfragen können nach Belieben per Sprache, Tastatur, Gesten oder auch in Kombination eingegeben werden. Dank einer flexiblen kontextabhängigen Dialogsteuerung ist der Nutzer nicht an feste Menüvorgaben gebunden, sondern kann komplexe Anfragen wie "Welche Veranstaltungen finden nächstes Wochenende in München statt?" stellen. Das System liegt aktuell für alle Android-basierten Smartphones vor. Die Unterstützung weiterer Endgeräte ist in der Entwicklung.
... mehr
Nuance präsentiert Vocalizer 5.0 für Mobil- und Callcenter-Anwendungen
26.08.2009, Nuance Communications, Inc.
Mit dem Vocalizer 5.0 stellt Nuance eine Text-To-Speech-Lösung für Callcenter- und Mobilanwendungen vor. Die neue TTS zeichnet sich laut Nuance vor allem durch eine hohe Präzision und Zuverlässigkeit aus und zeigt bei der Wiedergabe von Namen und Adressen eine "nahezu fehlerfreie Sprachausgabe". Mit der Basic-Version bietet das Unternehmen darüber hinaus eine kostengünstige Lösung für Mobil- und Unternehmensanwendungen, die nur ein begrenztes Vokabular benötigen z.B. Währungs-, Datums-, Uhrzeit- oder Rufnummernansagen.
... mehr
Spracherkennung in Second Life integriert
25.08.2009. Informationsdienst Wissenschaft
Forscher des Fraunhofer-Instituts für Produktionstechnik und Automatisierung (IPA) integrierten ein Sprachdialogsystem in die virtuelle Welt von Second Life. Das System erlaubt es, mit Objekten in Second Life zu interagieren. "Wir wollten damit zeigen, wie einfach und schnell Spracherkennung heutzutage in bestehende An­wen­dun­gen integriert werden kann", sagt Daniel Wimpff, wissenschaftlicher Mitarbeiter am Fraunhofer IPA. Die einfache Integration von Sprachdialogen in beliebige Applikationen wird durch die Fraunhofer Voice Control API ermöglicht. Diese Schnittstelle wird wie ein Webservice angesprochen und überträgt die Kontrolle über das Sprachdialogsystem an das Anwendungsprogramm.
... mehr
Voxeo präsentiert Kommunikationsplattform Prophecy 10
25.08.2009, TMC
Im Rahmen der SpeechTEK 2009 präsentierte Voxeo das neue Release seiner Kommunikationsplattform Prophecy. Prophecy 10 ermöglicht es jedem Unternehmen eigene Unified Communications- und Selfservice-Anwendungen schnell und einfach zu erstellen und zu verwalten. Die neue Plattform wurde vor allem für Multi-Channel-Interaktionen optimiert. "By enabling multi-channel self-service with no additional development costs, Prophecy 10 can 'multiply the ROI' of any enterprise voice self-service investment.", so Jonathan Taylor, CEO von Voxeo.
... mehr
Nachbesserungen bei Wolfram Alpha
22.08.2009, heise online
Laut Stephen Wolfram, Urheber der semantischen Suchmaschine Wolfram Alpha, hat das Entwickler-Team seit dem offiziellen Start zwei wesentliche Fortschritte erreicht: Zum Einen wurden neue Wissensbereiche eingebunden und zum Anderen die linguistischen Funktionen überarbeitet. Fast in jedem zweiten Fall, in dem Alpha versagt hätte, wäre der Grund nicht etwa fehlendes Wissen gewesen, sondern schlicht der, dass die Maschine nicht verstanden hätte, was man von ihr wollte. Eine Analyse der Anfragen ergab, dass die gestellten Fragen von der linguistischen Struktur her deutlich anders ausfielen, als man das erwartet hatte.
... mehr
Patent auf stimmbasierten Lügendetektor
14.08.2009, SpeechTechMag
Charles Humble, Gründer des National Institute for Truth Verification (NITV) erhielt ein zweites Patent für seinen CVSA II (Computer Voice Stress Analyzer). Das System erfasst die Veränderungen von Frequenz und Modulation in der menschlichen Stimme, wenn jemand lügt. Der CVSA II ist schon bei mehr als 1800 Strafverfolgungsbehörden und dem US-Militär im Einsatz und ermöglicht die Analyse von Live-Gesprächen, Telefonaten und aufgezeichneten Konversationen. "CVSA is much less complicated than a polygraph," sagt Humble. "A polygraph uses a lot of squiggly lines that you do not necessarily know what they mean. This uses simple graphs that chart their stress levels."
... mehr
Vorbild Gehirn - wie Computer hören lernen
13.08.2009, Max-Planck-Gesellschaft
Sehen, Hören, Fühlen - die Wahrnehmungen, die das Gehirn scheinbar mühelos bewältigt, stellen Computer bisher noch oft vor unlösbare Aufgaben. Forscher des Leipziger Max-Planck-Instituts für Kognitions- und Neurowissenschaften und des Wellcome Trust Centre for Neuroimaging in London haben nun ein mathematisches Modell entwickelt, mit dem die maschinelle Wahrnehmung und Verarbeitung von gesprochener Sprache deutlich verbessert werden könnte. Das Modell basiert auf der Annahme, dass die Bedeutung der Informationen auf verschiedenen zeitlichen Ebenen für die Verarbeitung von Wahrnehmungsreizen wahrscheinlich sehr viel größer ist als bisher angenommen.
... mehr
Exposé vorlesen: Immowelt.de integriert kostenlose Sprachfunktion
11.08.2009, fairnews
Bei Immowelt.de können sich Immobiliensuchende die Objektbeschreibungen jetzt bequem vorlesen lassen. Die kostenlose Sprachfunktion ist in alle Immobilienbeschreibungen integriert und vervollständigt das multimediale Gesamtpaket der Immobilienplattform: Neben der mobilen Suche übers Handy bietet Immowelt.de auch eine innovative Freitextsuche, praktische Kartenansichten inklusive Umgebungsinformationen und eine FreeCall-Funktion, mit der Interessenten gratis Anbieter von Wohnungen und Häusern anrufen können. Umgesetzt wurde die Sprachfunktion von der Linguatec GmbH.
... mehr
Diktiersoftware ProMobile für BlackBerry Smartphones mit erweitertem Funktionsumfang
06.08.2009, firmenpresse
Die Diktierlösung ProMobile der Berliner Brainworks GmbH bietet einen schnellen Einstieg in die digitale Diktierwelt. Mit Hilfe der Software lassen sich zum Beispiel BlackBerry Smartphones zu professionellen Diktiergeräten erweitern, so dass ein zusätzliches separates Gerät nicht mehr notwendig ist. Im Rahmen der jüngsten Weiterentwicklung wurden zahlreiche Programmteile der Promobile-Familie überarbeitet und durch zusätzliche Funktionen ergänzt. Die Einbindung der Spracherkennung ermöglicht es jetzt, erstellte und gesendete Diktate direkt im Hintergrund durch den Spracherkennungsserver umzusetzen. Damit stehen sie dem Diktierenden in kürzester Zeit als Text zur Verfügung.
... mehr
Emotions-Check durch Spracherkennung
05.08.2009, Computerwoche
Einem Forscherteam der Universität Dallas ist es jetzt in Zusmmenarbeit mit Working Solutions, einem texanischen Beratungsunternehmen für Call Center Betreiber, gelungen, ein System zu entwickeln, das Ärger identifzieren und von Sprachschwankungen sowie störenden Nebengeräuschen unterscheiden kann. Damit ist es möglich, schneller Lösungsvorschläge für verärgerte Kunden bereitzuhalten. "Bislang können wir über unser Kontaktzentrum verärgerte Anrufer erst nach Tagen oder Wochen identifizieren, wenn es bereits zu spät ist.", so John Hansen, Leiter des Center for Robust Speech Systems an der Universität Dallas. Die Zukunft des Sprachanalyse-Tools liegt für Hansen daher ganz klar in der Verbesserung des Kundenerfahrungshorizontes.
... mehr
iPhone 3GS mit VoiceOver für blinde Menschen nutzbar
05.08.2009, heise online
Apples Implementierung der kostenlosen VoiceOver-Lösung in das iPhone wird von vielen blinden und stark sehbehinderten Menschen weltweit als eine Art "sprechende Revolution" wahrgenommen. Das iPhone 3GS ist nicht nur das erste vollständig blind bedienbare Touchscreen-Gerät der Welt, sondern bietet auch Menschen mit Seh- oder Hörproblemen spezielle Hilfen wie Vergrößerung oder weiße Schrift auf schwarzem Hintergrund. Marco Zehe, Qualitätsbeauftragter für Barrierefreiheit bei Mozilla und selbst blind, hat nach einmonatiger Nutzung des iPhone 3GS mit VoiceOver in seinem Blog nun über erste Erfahrungen berichtet: VoiceOver macht nahezu alle Funktionen des Geräts auch für blinde Menschen nutzbar.
... mehr
Fonix iSpeak 1.4 für das neue iPhone
31.07.2009, SpeechTechMag
Fonix Speech, ein Anbieter von integrierten Sprachverarbeitungslösungen, stellt mit Fonix iSpeak 1.4 Spracherkennungssoftware für das iPhone zur Verfügung. Mit der Anwendung wird sprachgesteuerte Anrufwahl per Name oder Nummer möglich, die vor allem auch in lauter Umgebung zuverlässig funktionieren soll. iSpeak erlaubt eine nahezu komplette Bedienbarkeit per Spracheingabe, ohne dass zusätzlich Tasten gedrückt werden müssen.
... mehr
Schlauer googeln dank Sprachforschung
30.07.2009, Informationsdienst Wissenschaft
Indogermanisten und Wirtschaftsinformatiker der Universität Jena haben gemeinsam ein Projekt ins Leben gerufen, das die Recherche über Suchmaschinen im Internet wesentlich übersichtlicher und weniger zeitintensiv gestalten soll. "Die Idee ist, unsere Erkenntnisse auf dem Gebiet der mehrdimensionalen Wortschatzvernetzung für praktische Anwendungen nutzbar zu machen", begründet Dr. Bock von Lehrstuhl für Indogermanistik die ungewöhnliche Kooperation von Sprachwissenschaftlern und Wirtschaftsinformatikern. Die Benutzerfreundlichkeit von Suchmaschinen ließe sich beispielsweise dadurch erhöhen, dass auch sinnverwandte oder Teilbegriffe als Treffer angezeigt und vorsortiert werden.
... mehr
Neue iPhone App hilft in Notsituationen
26.07.2009, aperto move
Der von der aperto move GmbH für die Bundesvereinigung der Deutschen Apothekerverbände entwickelte Apotheken-Notdienstfinder, der seit einiger Zeit unter der mobilen Kurzwahl 22833 bundesweit per Anruf oder SMS zu erreichen ist, wird nun durch eine iPhone App ergänzt. Egal wo, egal wann - 24 Stunden, Tag und Nacht, hilft die in der Zusammenarbeit mit der acceleract GmbH entwickelte Anwendung beim Auffinden der nächstgelegenen Notdienst-Apotheke. Zu jeder Apotheke werden alle relevanten Details wie Name, Adresse, Telefonnummer, Entfernung und Öffnungszeiten ausgegeben. Die Nutzer können sich die Apotheken auf einer Karte anzeigen und eine Anfahrtroute errechnen lassen. Steht keine Internetverbindung zur Verfügung, wird ein Anruf beim mobilen 22833 Apotheken-Notdienstfinder angeboten.
... mehr
Loquendo Spracherkennung für Dänisch und Finnisch
23.07.2009, Loquendo
Loquendo bringt seine Loquendo ASR für Dänisch und Finnisch auf den Markt. Damit unterstützt die Spracherkennung von Loquendo mittlerweile 24 Sprachen. Die finnische und dänische Sprachsynthese wurden bereits Ende des vergangenen Jahres veröffentlicht. Mit den beiden neuen Produkten stellt Loquendo damit beide Technologien – ASR und TTS – für drei skandinavische Sprachen zur Verfügung. Norwegisch soll in Laufe dieses Jahres noch folgen.
... mehr
Samsung Watchphone mit Spracherkennung kommt nach Frankreich
22.07.2009, engadget
Samsungs Handy im Armbanduhrenformat, das S9110, ist gerade einmal 11.98 mm dünn und lässt sich wie eine Uhr ums Handgelenk legen. Wer nur erreichbar sein möchte, dem reicht so ein kleines Gerät am Arm - wäre da nicht das Problem der Bedienbarkeit. Denn es ist nicht leicht, auf dem winzigen Touchscreen die Tasten zu treffen. Dafür verfügt das Samsung-Handy über Spracherkennung, so dass die Bedienung spielend leicht erfolgen soll. Für 450 Euro kann das Handy ab August in Frankreich erworben werden.
... mehr
Lumenvox Speech Engine 9.0
21.07.2009, PR-inside
Durch die Integration der LumenVox Speech Engine mit VXI* und der Asterisk-Telefonie-Plattform laufen nun VoiceXML-Applikationen problemlos auch unter Linux und Asterisk. Die sprecher- und hardwareunabhängige LumenVox Speech Engine ist ein standardbasierter Spracherkenner, der mehrere Sprachen unterstützt. Das System bietet darüber hinaus eine leistungsfähige Entwicklungs- und Laufzeitumgebung, die umfangreiche Logging-Funktionen mitbringt.
... mehr
Einkaufsliste per Spracherkennung: Der Smartshopper
17.07.2009, neuerdings.com
Mit dem SmartShopper Deluxe kann man seine Einkaufsliste per Zuruf erstellen. Das Gerät, dass einem das Leben leichter machen soll, kommt aus den USA und gehorcht aufs Wort: Dank der Spracherkennung, die über 2500 Lebens- und Haushaltsmittel, Pflegeprodukte und Büroartikel erkennt, muss man das Gewünschte nur in das Mikrofon des Geräts sprechen. So kann man nach und nach eine ganze Einkaufsliste erstellen. Geht man in den Supermarkt, kann man sich die Liste vorher ausdrucken lassen. Der Wortschatz des SmartShoppers lässt sich um 5000 nutzerdefinierter Wörter erweitern. Bisher versteht das Gerät allerdings nur Englisch und ist mit 99 Dollar auch nicht wirklich günstig.
... mehr
Intelligente Kleidung hilft Ärzten und Technikern
15.07.2009, heise online
Als Zukunftsvision und als eher erfolgloses Geschäftsmodell geistert die Vorstellung von in Kleidung integrierten Computern schon lange herum. Nun entwickelten Wissenschaftler am Technologie-Zentrum Informatik und Informationstechnik der Universität Bremen intelligente Kleidung für den Automobil- und Flugzeugbau, die Feuerwehr und fürs Krankenhaus. "Wir wollten, dass Arbeiter den Computer nutzen können, ohne dafür die Arbeit unterbrechen zu müssen", sagte Michael Lawo vom Technologie-Zentrum. Der innovative Arztkittel beispielsweise arbeitet über Sensoren, die sich in seinem Ärmel befinden. So kann der Mediziner das System durch Armbewegungen steuern. Patient und Arzt tragen zudem dünne Datenarmbänder, die auf Abruf alle Informationen auf den Bildschirm neben dem Krankenbett übertragen. Neue Einträge in die Patientenakte kann der Arzt während der Visite direkt per Spracherkennung aufnehmen. "So fallen zwei Stunden für die tägliche Nachbereitung weg", sagte Lawo. In einem österreichischen Krankenhaus sei die Technik bereits erfolgreich im Einsatz.
... mehr
Alex - Deutschlands neue Computerstimme
09.07.2009, SpeechConcept
In Zusammenarbeit mit CereProc, UK, entwickelte SpeechConcept im letzten Jahr mehrere Stimmprofile. Mit "Alex" wird zunächst eine männliche Synthesestimme angeboten, die durch ihre Natürlichkeit in Prosodie und Phonetik bestechen soll. "Woran TTS-Hersteller normalerweise jahrelang arbeiten, ist uns in relativ kurzer Zeit gelungen", so Entwicklungsleiterin Dr. Maria Strobel, "nämlich eine qualitativ hochwertige TTS-Engine zu produzieren, die ihresgleichen sucht." Die TTS steht in Kürze für alle marktgängigen Telefonieanwendungen und Desktoplösungen zur Verfügung. Einen besonderen Wettbewerbsvorteil sieht das Unternehmen darin, mit der CereVoice kostengünstig und kurzfristig sogenannte Corporate Voices anbieten zu können.
... mehr
Wunderman geht mit Telenet neue Marketingwege
08.07.2009, Pressebox
Auf einer virtuellen Geburtstagskarte im Web und mit Hilfe des Telefons können sich Frequent Traveller von Miles & More, dem Vielfliegerprogramm der Lufthansa, ihr Geburtstagsgeschenk erpusten. Das innovative und interaktive Voice&Web-Spiel wurde von der Telenet GmbH Kommunikationssysteme gemeinsam mit der Frankfurter Agentur Wunderman entwickelt. Die Einladung und den Zugang zum Spiel erhalten die Kunden per Mail. Per Telefon wird der Anwender individuell und personalisiert angesprochen und aufgefordert, Konfetti vom Bildschirm zu pusten. "Durch die innovativen Lösungen von Telenet im Bereich Sprachautomation eröffnen sich für uns als Werbeagentur neue kreative Möglichkeiten.", so Bernhard Beßendörfer, Management Supervisor bei der Agentur Wunderman, die das Projekt für Miles & More umgesetzt hat.
... mehr
Texterkennung mit dem Mac
08.07.2009, golem.de
Mit Exactscan 2 präsentiert Exactcode eine neue OCR-Software für MacOS X, die dafür konzipiert ist, Scans durchsuchbar zu machen. Das System unterstützt Englisch, Deutsch, Holländisch, Französisch, Italienisch, Portugiesisch, Spanisch und Schwedisch. Die Mac-interne Suchmaschine Spotlight und andere Desktopsuchmaschinen können die erkannten Bereiche aus den PDFs indizieren und bilden so die Basis für ein kleines Dokumentenmanagementsystem (DMS), in dem der Anwender mit Suchbegriffen recherchieren kann. Das Programm ist in einer Standard- und einer Professional-Version erhältlich. ExactScan 2 Professional kostet 109 Euro, die Standardvariante wird für 89 Euro angeboten.
... mehr
Voice-Control-API (VCA)
06.07.2009, Informationsdienst Wissenschaft
Leistungsfähige Sprachverarbeitungssysteme erobern momentan viele Wirtschaftsbereiche mit direktem Endkundenkontakt. Im industriellen Sektor führen sie jedoch noch immer ein Mauerblümchendasein. Dabei sind gerade in diesem Bereich die Vorteile einer Sprachsteuerung wie z. B. die Konzentration auf die Tätigkeit bei gleichzeitiger Einsetzbarkeit beider Hände ("hands free") sowie die räumliche Flexibilität durch moderne Kommunikationsmittel offensichtlich. Die vom Fraunhofer IPA entwickelte Voice-Control-API (VCA) soll Abhilfe schaffen und die Integration von Sprachverarbeitungssystemen in beliebige industrielle Applikationen ermöglichen.
Die VCA setzt sich in Form eines Vermittlers zwischen das Sprachsystem und die industrielle Anwendung. Dabei weist sie Standardschnittstellen nach beiden Seiten auf: SOAP ("Simple Object Access Protocol") zur Applikation und VoiceXML zum Sprachverarbeitungssystem. Als Transportmedium werden die Standardprotokolle des World Wide Web verwendet. Durch dieses plattformunabhängige Konzept und durch den leicht verständlichen Aufbau der VCA-Funktionen kann praktisch jede industrielle Applikation in kurzer Zeit "sprachfähig" gemacht werden.
... mehr
Suchmaschine für Fernsehbeiträge
01.07.2009, Fraunhofer
Wann wurde die Finanzkrise in der Tagesschau zum ersten Mal erwähnt? Was sagte doch gleich Merkel zur Präsidentschaftswahl? Bisher müssen Journalisten, Archivare und Medienbeobachter lange suchen, bis sie eine bestimmte Stelle in Sendungsmitschnitten finden. Oder sie investieren viel Geld in ein Spracherkennungssystem, das diese Aufgabe übernimmt. Doch solche Systeme mussten bisher von Experten regelmäßig auf den neuesten Stand gebracht werden und waren daher mit hohen laufenden Kosten verbunden. Die Forscher am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin haben nun ein System entwickelt, mit dem man kostengünstig in Fernsehbeiträgen recherchieren kann. "Unser System basiert auf einem Silbenlexikon statt auf einem Wortlexikon. Klassische Spracherkenner können nur eine begrenzte Zahl von Worten erkennen – die Zahl der existierenden Wörter ist jedoch unüberschaubar groß. Im Unterschied dazu ist die Anzahl verschiedener Silben handhabbar. Mit etwa 10 000 gespeicherten Silben können wir jedes Wort zusammensetzen", sagt Daniel Schneider, Forscher am IAIS.
... mehr
Uni Bremen: Sprechender Kaffeeautomat gibt auch Auskünfte
30.06.2009, heise online
Wissenschaftler der Universität Bremen haben einen Kaffeeautomaten entwickelt, der nicht nur acht verschiedene Sorten Kaffee servieren, sondern auch sprechen kann. "Wir haben die Maschine so programmiert, dass sie die entsprechenden Vokabeln und die Grammatik erkennt", erklärte die Informatikerin Hui Shi vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI). Der Automat kennt außerdem die Telefonnummern der Mitarbeiter am Institut, weist Gästen den Weg zu den Büros und weiß, wann die nächste Straßenbahn an der Uni abfährt. Zurzeit arbeiten die Wissenschaftler daran, dass das Gerät auch Gesichter erkennen kann. Damit könnte die Maschine seine Kunden auch persönlich ansprechen und deren Vorlieben speichern. "Die Gesichtserkennung ist noch im Anfangsstadium. Es wird noch einige Jahre dauern, bis es so weit ist", betonte Shi. Künftig könnte der Automat in Hotellobbys, Flughäfen oder öffentlichen Gebäuden als kaffeekochendes Infoterminal zum Einsatz kommen.
... mehr
Maschinen lesen das Internet: Internet-Analysewerkzeug für US-Armee entwickelt
29.06.2009, golem.de
Die Forschungsagentur des US-Verteidigungsministeriums, die Defense Advanced Research Projects Agency (DARPA), hat BBN Technologies mit der Entwicklung eines automatischen Texterkennungssystems beauftragt. Die DARPA stellt für das Machine Reading Program über fünf Jahre hinweg 29,7 Millionen US-Dollar bereit. Ziel des Vorhabens ist ein System, das Texte aus dem Web analysiert, die Informationen mit vorhandenen Datenbanken oder Ontologien abgleicht und daraus ein Dossier für menschliche Analysten oder KI-Systeme anfertigt. Die Technik soll zunächst militärischen Zwecken zugute kommen, könne aber auch für zivile Zwecke eingesetzt werden: In einer Zeit, da Bibliotheken über immer mehr digitale Inhalte verfügen, könnten Wissenschaftler es für umfangreiche historische Forschungen nutzen.
... mehr
iPhone 3G S: Sicherheitslücke bei der Sprachsteuerung
25.06.2009, MacWelt
Die Sprachsteuerung von Apples neuem iPhone 3G S sollte die Bedienung des Gerätes noch nutzerfreundlicher und das Telefonieren oder die iPod-Bedienung auch im Auto oder ähnlichen Situationen ohne weiteres möglich machen. Doch ein Nutzertest der Macwelt zeigt: Das neue Feature hat nicht nur Schwächen, sondern stellt eine ausgewachsene Sicherheitslücke dar. Denn die Sprachsteuerung hat einen großen Haken: Sie umgeht die Code-Sperre des iPhones, die Unbefugte von der Benutzung abhalten soll. Per Sprachsteuerung kann auch bei gesperrtem Telefon jede beliebige Nummer angerufen werden. Die iPod-Funktionen sind ebenfalls zugänglich, bergen aber kein Kostenrisiko für den Besitzer.
... mehr
Webkonferenzen und virtuelle Messen
23./25.06.2009, Informationsdienst Wissenschaft + Presseecho
Noch bis zum 23. August bietet Cycos Unternehmen die Möglichkeit, das Webconferencing-Modul der Unified Communications(UC)-Software mrs Vanguard kostenlos zu testen. Mit der Testversion können bis zu fünf User an Webkonferenzen teilnehmen. Cycos Webconferencing ist eine besonders einfach zu handhabende Lösung, wenn es darum geht, bis zu 100 Teilnehmer von unterschiedlichsten Orten weltweit an einen "virtuellen" Tisch zu bekommen. Wenn sich das Unternehmen nach der Testphase für die Lösung entscheidet, besteht die Möglichkeit, die Anwendung in eine Unified Communications-Umgebung einzubetten.

Eine Messe erleben, ohne auf eine Messe zu fahren - das bietet jetzt die Universität Mannheim Studieninteressierten mit einem virtuellen "Tag der Wirtschaftsinformatik". Am 6. und 7. Juli 2009 können Internetnutzer durch Veranstaltungsräume "laufen", Vorlesungen anhören und Messestände besuchen. Die technische Grundlage für die virtuelle Messe wurde von drei ehemaligen Doktoranden der Universität Mannheim entwickelt, die planen, die Technologie auch über den akademischen Rahmen hinaus einzusetzen. So ist beabsichtigt, die Event-Plattform auch in Zusammenarbeit mit Unternehmen zu nutzen. Diese könnten durch den Einsatz virtueller Events nicht nur Raumprobleme lösen, sondern auch Ihren Kunden Zeit und Kosten sparen.
Valuescope Finsights geht mit erster Version live
17.06.2009, Live-PR
Valuescope, Spezialist für semantische Technologien im Vertriebsumfeld, geht mit der ersten Version von Finsights, einer Online-Plattform speziell zur Aggregation von Finanznachrichten, live. Finsights greift auf valuescope's fortschrittliche Technologie automatisierter Sprachverarbeitung zurück, die neben Schlüsselwörtern Ontologien und Taxonomien nutzt, um Texte zu klassifizieren und deren Relevanz zu beurteilen. Auf das Feld der Finanztechnologie angewandt, werden automatisch relevante Branchenereignisse aus einer überwältigenden Menge an Internetinhalten gefiltert und über eine leicht bedienbare Benutzeroberfläche übersichtlich aufbereitet dargestellt. Am Ende steht ein leistungsstarkes Werkzeug, das insbesondere für Vertriebs- und Marketingverantwortliche hilfreich ist, die nach Ansprechpartnern im mittleren Management suchen.
... mehr
Flexibles Echtzeit-Monitoring für virtuelle Call Center
14.06.2009, Gunnar Sohn
In der Callcenter-Branche wird Flexibilität groß geschrieben. So arbeiten die Agenten immer häufiger an wechselnden Standorten und Arbeitsplätzen für ein- und dieselbe Hotline. Moderne Softwarelösungen wie die webbasierte Automatic Call Distribution (ACD) der Deutschen Telekom verbinden dabei Anrufer automatisch mit dem richtigen Ansprechpartner. Obwohl räumlich von einander entfernt, werden die Agenten mit der ACD zu Teilnehmern eines großen virtuellen Callcenters: Anrufer wählen eine Servicenummer und erreichen stets einen Gesprächspartner - ganz egal, wo dieser sitzt. Um die Effizienzpotenziale eines virtuellen Callcenters voll auszuschöpfen, benötigen Anwender ausgefeilte Instrumente für die Steuerung und das Monitoring des Telekommunikationsverkehrs. Um für die ACD ein solches flexibles Echtzeit-Monitoring zu realisieren, hat das Dortmunder Softwareunternehmen VoicInt Telecommunications GmbH sein "Web Enterprise Monitoring" an die Call Center-Plattform der Deutschen Telekom angebunden. Damit stehen ACD-Nutzern nun umfassende Informationen, Statistiken und Kennzahlen parallel zu den laufenden Prozessen bereit.
... mehr
Apple präsentiert sein neues iPhone 3GS
11.06.2009, heise online + golem.de + connect
Das "S" im Namen des neuen iPhone 3GS steht für "Speed", denn Dank neuer Hardware soll das Handy etwa doppelt so schnell arbeiten wie sein Vorgänger. Darüber hinaus ist das neue Smartphone von Apple mit Sprachsteuerung ausgestattet. Damit kann zukünftig sowohl die Telefonfunktion als auch iTunes per Sprachbefehl gesteuert werden. Und das Gerät antwortet sogar in gesprochener Sprache. Apple demonstrierte auf seiner Entwicklerkonferenz WWDC 2009 die Musikwiedergabe per Sprachkommando: Auf die Frage, welches Lied gerade gespielt wird, nennt das Gerät Interpret und Titel. Das neue iPhone soll am 19. Juni auf den Markt kommen.

Noch im Juni 2009 will Navigon die Navigationssoftware MobileNavigator für das iPhone 3G anbieten. Die Software funktioniert auf allen iPhones mit der neuen Firmware iPhoneOS 3.0 und somit auch auf dem neuen iPhone 3GS. Der MobileNavigator umfasst die von anderen Navigationsgeräten von Navigon bekannten Komfortfunktionen, wie Reality View Pro, Tag-und-Nacht-Modus, Geschwindigkeits- sowie Fahrspurassistent Pro. Außerdem lassen sich Points of Interests (POIs) einblenden. Die Software kann das iPhone-Adressbuch nutzen, um sich bequem zu eingetragenen Adressen leiten zu lassen. Navigon verspricht, dass es den MobileNavigator im Juni 2009 über den App Store geben wird.

Das Berliner Unternehmen Textunes, das elektronische Bücher für mobile Endgeräte anbietet, hat für das iPhone eine besondere Form von E-Books entwickelt: eine Kombination aus digitalem Text und Hörbuch. Der Nutzer lädt das digitale Buch auf sein iPhone und kann dann wählen, ob er ein Kapitel lieber liest, anhört, oder ob er multimedial gleichzeitig lesen und hören möchte. Die kombinierten Text-Audio-Bücher träfen "das Lebensgefühl der urbanen Zielgruppe", sagt der Textunes-Geschäftsführer. Sie könnten den Text "in der U-Bahn lesen, und wenn man umsteigen muss, dann wird eben aufs Hörbuch umgeschaltet."

Und noch eine neue App für das iPhone: Voicesafe soll dem iPhone-Nutzer mehr Sicherheit gewähren, denn mit Hilfe dieses Programms lässt sich das Apple-Smartphone nur mit der eigenen Stimme öffnen. "Vergessen Sie Ihre Passwörter, das ist sicherer. Ihre Stimme ist Ihr Passwort", wirbt darum der Hersteller Voicetrust. Laut der Münchner Entwicklerfirma sind mit dem so genannten "mobilen Geheimnisspeicher" die Zeiten vorbei, in denen das Handy neugierigen Mitmenschen persönlichste Geheimnisse über dessen Besitzer verriet.
woopla verbindet 6 Millionen Twitter User per Telefon
09.06.2009, openPR
Die auf interaktive Sprachapplikationen spezialisierte woopla GmbH aus Duisburg startet mit twitwoop eine Web&Voice-Applikation für den Consumerbereich und spricht damit 6 Millionen Nutzer des Microblogging-Dienstes Twitter an. Mit twitwoop haben registrierte Twitter-Nutzer die Möglichkeit, Sprachnachrichten per Telefon aufzunehmen und diese direkt in Ihre eigene Twitter-Timeline zu stellen. woopla hat hierfür die von Twitter angebotene API vollständig in die eigenen IVR-Systeme integriert. Zur Nutzung des Dienstes müssen registrierte Twitter-User zunächst Ihre Rufnummer unter twitwoop.com freischalten. Nach erfolgter Freischaltung kann eine der Einwahlrufnummern in Grossbritannien, den USA oder Deutschland genutzt werden. Hinterlassene Nachrichten werden mit einem numerischen Antwortcode versehen. Über diesen haben andere User wiederum die Möglichkeit, per Telefonanruf zu antworten.
... mehr
Genesys integriert UC-Lösungen von Fremdanbietern
08.06.2009, Genesys
Genesys bringt UC-Connect auf den Markt, eine Software zur Unterstützung der Interoperabilität zwischen der Genesys Customer Interaction Management (CIM) Software Plattform und den UC-Lösungen anderer großer Anbieter. Laut Genesys kann die CIM-Plattform mithilfe von UC-Connect direkt mit Alcatel-Lucents MyInstant Communicator, IBM Sametime, Microsoft Office Communications Server 2007 und Siemens Openscape verbunden werden. Genesys-Kunden können durch den Einsatz von UC-Connect also künftig selbst bestimmen, welche UC-Software sie nutzen.
Daneben bietet UC Connect noch weitere Features. Zum Beispiel überprüft die Software die Verfügbarkeit von Experten und informiert anschließend nicht nur, welche Experten namentlich für ein Kundengespräch zu Verfügung stehen, sondern auch welche Skills diese jeweils bieten.
... mehr
Google Wave: Der Echtzeit-Wiki-Kommunikator
29.05.2009, NeueNachricht + heise online
Wissensmanagement in Unternehmen und geeignete IT-Werkzeuge sind zentrale Stütze der Projektarbeit. Die Studie "Kollaborieren oder Kollabieren" der mind Business Consultants zeigt jedoch, dass ein Großteil der "Wissensarbeiter" sich von den ihnen zur Verfügung gestellten Arbeitsmitteln nicht ausreichend unterstützt fühlt.

Das neue Produkt Google Wave schließt hier eine empfindliche Lücke. Google Wave ist ein Echtzeitkommunikator, der neben synchroner Kommunikation (Instant-Messaging, Chat) auch das gemeinsame Editieren von Dokumenten in Echtzeit erlaubt. Auf diese Weise werden nicht nur Entwicklungsprozesse optimiert - auch das Managemet wird dabei unterstützt, den aktuellen Projektstatus zu identifizieren, Aufgaben zu verteilen, deren Erledigung zu verfolgen und das Geleistete zu dokumentieren.
Bing: Microsofts neue Suchmaschine
28.05.2009, heise online
Microsoft bringt seine neue Suchmaschine Bing auf den Markt und nimmt damit einen neuen Anlauf ins lukrative Geschäft der Internet-Suche. Bing wird in Zukunft die Windows Live Search komplett ersetzen. Noch heute würden rund 30 Prozent aller Suchanfragen ohne Ergebnis abgebrochen, erläutert Microsoft-Managerin Dorothee Ritz. Bing solle dagegen den Nutzern mit einem verbesserten Index deutlich mehr relevante Ergebnisse liefern. Auf der Startseite von Bing werden die Anwender ähnlich wie bei Google neben einer globalen Suche auch zwischen verschiedenen Suchkategorien auswählen können. Dazu zählen "Bilder", "Videos", "Shopping", "News" und "Maps". Für komplexe Suchanfragen, wie etwa im Zuge einer Kaufentscheidung, werden für den deutschsprachigen Markt künftig die Ergebnisse der User-Bewertungssite Ciao eingebunden.

Bislang waren Microsofts Bemühungen im Suchmaschinen-Markt weniger erfolgreich: Im vergangenen Jahr lag Microsofts Marktanteil hier bei 4,8 Prozent, während Google mit einem Anteil von 81 Prozent die Konkurrenz weit hinter sich ließ.
... mehr
Druckergeräusche verraten Patientenakten und Kontodaten
27.05.2009, Informationsdienst Wissenschaft
Mit einer Kombination aus automatischer Spracherkennung und maschinellem Lernen ist es einer Forschergruppe um Michael Backes, Professor für Kryptografie und Informationssicherheit an der Universität des Saarlandes, gelungen, über 70 Prozent der auf einem Nadeldrucker gedruckten Texte zu rekonstruieren - allein über die Auswertung der Druckergeräusche. Damit die Nadeldrucker ihre Geheimnisse preisgeben, mussten die Wissenschaftler einige Vorarbeit leisten: Sie druckten zunächst ein Wörterbuch aus, zeichneten die entsprechenden Druckgeräusche auf und ordneten in einer Datenbank den Wörtern das jeweils charakteristische Tonmuster zu. Die Herausforderung bestand dann darin, bei weiteren Tonaufnahmen die Wörter automatisch zu erkennen und Störgeräusche, wie zum Beispiel Patientengespräche in einer Arztpraxis, herauszufiltern.

Mit dieser Methode gelang es den Forschern über 70 Prozent der Wörter herauszufiltern und damit die meisten Inhalte einer Patientenakte oder Angaben auf Kontoauszügen zu verstehen. Auch einzelne Zahlen wie etwa Geheimnummern von Konten können auf diese Weise mit erstaunlich hoher Trefferquote erkundet werden.
... mehr
Yahoo! oneSearch Voice vereinfacht mobile Suche durch Spracherkennung
26.05.2009, Presseportal
Yahoos Web-Suche soll Smartphone-Besitzern künftig aufs Wort gehorchen. Mit "oneSearch Voice" gestaltet Yahoo die Suche im mobilen Internet für seine User noch einfacher und bequemer: Statt Suchbegriffe auf einem Touchscreen oder einer winzigen Handytastatur mühsam einzutippen, können die Anwender künftig ihre Anfragen einfach per gesprochener Sprache eingeben. Die Ergebnisse werden wie bisher bei der mobilen Yahoo-Suche üblich angezeigt. Ab sofort ist die Anwendung "oneSearch Voice" für Smartphones mit Symbian- oder Windows-Mobile-Betriebssystem erhältlich. Auch Blackberrys und Apples iPhone werden unterstützt.
... mehr
Across Systems präsentiert Plattform für "Enterprise Language Intelligence"
26.05.2009, goodnews.de
Across Systems präsentierte auf der Localization World in Berlin mit Across v5 eine neue Plattform für die mehrsprachige Unternehmenskommunikation. In Across v5 werden Konzepte für das Übersetzungsmanagement adaptiert, Unternehmen erlangen so mehr Kontrolle über Sprachressourcen und über die oft komplexen Übersetzungsprozesse. Mechanismen des Text- und Data-Minings ermöglichen es, Fremdsprachenfassungen beliebiger Texte - z.B. Produktkataloge oder Bedienungshandbücher - mit maximaler Effizienz wiederzuverwenden. Gegenüber bisherigen Systemen soll dadurch der Aufwand für Übersetzungen weiter reduziert werden, bei gleichzeitiger Steigerung der Qualität.
... mehr
Wolfram Alpha - die Wissensmaschine ist online
16.05.2009, golem.de
Stephen Wolframs Wissensmaschine berechnet aus gegebenen Daten Antworten auf konkrete Fragen aus unterschiedlichen Wissensgebieten - von Mathematik und Statistik über Chemie und Medizin bis hin zu Sprache, Kultur und Medien. Wie bei Google & Co. kann in das Textfeld auf Wolfram Alphas Webseite eine Anfrage eingegeben werden. Das Ergebnis jedoch besteht nicht aus einer Liste von Links auf Webseiten, deren Text einen oder mehrere der Suchbegriffe enthalten, sondern aus einer übersichtlichen Zusammenfassung der passenden Fakten und Quellenangaben und je nach Thema zusätzlich aus Schaubildern, Diagrammen und Karten.

Die Frage nach einem Becher Orangensaft beantwortet Wolfram Alpha mit einer entsprechenden Nährwerttabelle. Wird aber nach einem Becher Orangensaft plus einer Scheibe Cheddar-Käse gefragt, so erhält der Nutzer die Summe der Nährwerte. Wer nach gelb plus rot fragt, bekommt orange als Antwort, nebst Daten wie RGB- und HSB-Wert sowie den entsprechenden Hexadezimalcode.

Was jetzt von Wolfram Alpha zu sehen ist, sei nur der Anfang, betont Stephen Wolfram. Es handle sich um ein langfristig angelegtes Projekt.
... mehr
Sprachsteuerungssoftware für indische Landwirtschaft
14.05.2009, heise online
Das Hochschulteam der TU Dresden "The Liaisoners" überzeugte im Deutschland-Finale des Imagine Cups in Berlin mit seinem "Talk to aAqua" Projekt. Die prämierte Software soll indischen Landwirten helfen, Ratschläge von Agrarexperten einzuholen. Viele der Bauern sind Analphabeten und können daher den SMS-basierten Beratungsdienst nicht nutzen, der zur Verbesserung ihrer Anbaumethoden eingerichtet wurde. Nun können sie via Sprachsteuerung mit den Experten in Kontakt treten. Ein telefonbasiertes Sprachdialogsystem überwindet die Barrieren des SMS-basierten Frage-Antwort-Dienstes und die Fragen werden per Sprachnachricht in einem Forum hinterlassen.

Der Imagine Cup wurde vor sieben Jahren von Bill Gates ins Leben gerufen und wird seither als internationaler Wettbewerb jährlich von Microsoft ausgerichtet. Das diesjährige Motto des Wettbewerbs lautete: "Technologie für eine bessere Welt".
... mehr
Der IRISnotes 1.0 spart Zeit, Nerven und liegt im Trend
13.05.2009, Firmenpresse
Der IRISnotes des belgischen Herstellers I.R.I.S. erkennt handgeschriebene Notizen bereits während des Schreibens und überträgt sie per Funk auf einen kleinen Empfänger. Über diesen Empfänger gelangt der Text dann via USB-Kabel zum Rechner. Dort kann er gespeichert und bei Bedarf weiterverarbeitet und wie jedes andere digitale Text-Dokument verwendet werden. Im Offline-Modus kann der handgeschriebene Text auf dem Empfänger gespeichert und später auf den Rechner übertragen werden. Mit dem Stift wird wie gewohnt auf Papier geschrieben. Die mitgelieferte Texterkennungssoftware erkennt handgeschriebenen Text in 22 Sprachen.
... mehr
Nuance präsentiert OmniPage 17
13.05.2009, Nuance Communications, Inc.
Die aktuelle Version der OCR-Software Omnipage bietet eine erhöhte Erkennungsgenauigkeit, erweiterte 3D-Korrekturtechnologien und neue Funktionen für Smartphone-Anwender. "Bei OmniPage 17 hat sich Nuance zuerst auf das wichtigste Element für die Dokumentkonvertierung konzentriert: die Erkennungsgenauigkeit. Die neue Version liefert bei der Konvertierung von Papierdokumenten in editierbare elektronische Dokumente daher eine erstaunliche Präzisionssteigerung von vierzig Prozent", kommentiert Robert Weideman, General Manager der Nuance Document Imaging Division.

OmniPage Professional 17 wird Ende Mai über das weltweite Händlernetzwerk von Nuance erhältlich sein. Der Preis für Einzelanwender von OmniPage Professional 17 beträgt EURO 299,00, OmniPage Standard 17 ist zu einem Preis von EURO 99,00 erhältlich. Außerdem wird OmniPage Professional 17 bis zum 30. Juni 2009 zum Einführungspreis von EURO 99,00 angeboten.
... mehr
Intelligentes Rückrufmanagement mit Voxtron Contact Center Suite agenTel
12.05.2009, Pressebox
Das agenTel Rückrufmanagement-Modul sichert durch seine automatische Wahlsteuerung korrekte Rufnummern und schützt vor Tippfehlern durch Agenten. Besetzte Anschlüsse, Anrufbeantworter und Faxgeräte identifiziert das System selbsttätig und verhindert unnötige Ausfallzeiten. Faxgeräte lassen sich automatisch mit einem Marker versehen. Technisch gesehen werden aktive und passive Rückrufe unterschieden. Passive Rückrufe reagieren auf Anrufe, die in der Warteschlange vom Anrufer abgebrochen wurden, während aktive Rückrufe über das integrierte Sprachportal angenommen werden. Als Teil der agenTel Contact Center Suite ist das neue Modul herstellerunabhängig an nahezu jeder Telefonanlage nutzbar.
... mehr
Das Internet der nächsten Generation
04.05.2009, FAZ.net
Stephen Wolfram hat erstmals seine Suchmaschine der Öffentlichkeit vorgestellt. Wolfram selbst bezeichnet seinen Dienst als Computational Knowledge Engine, der, anders als eine Suchmaschine wie Google, auf systematisch aufbereiteten Datenquellen aufbaut, die für natürlichsprachliche Anfragen durchsuchbar gemacht werden. Die Frage nach der Zahl der Internet-Nutzer in Europa etwa beantwortet Wolfram Alpha mit 289,9 Millionen, während Google einen Link zur Seite „Internetworldstats“ bringt, wo der Nutzer selbst weitersuchen muss.
... mehr
Elektronischer Horchposten mit Microsoft-Genen
04.05.2009, FAZ.net
Linguatec, das bislang die betagte IBM-Spracherkennung unter dem Namen Voice Pro vertrieben hat, setzt nun auf die in Vista eingebaute Spracherkennung von Microsoft und vertreibt das Programm als Voice Pro 12 zu Preisen von 70 bis 370 Euro. Michael Spehr probierte für die F.A.Z. die Premium-Variante für 170 Euro, die gegenüber dem kleinsten Paket ein Fachvokabular aus den Bereichen EDV, Wirtschaft, Sport, Wissenschaft und Technik mitbringt und die Outlook-Bedienung ebenso wie den Einsatz von Diktiergeräten erlauben soll. Fazit: Beschäftigt man sich länger mit Voice Pro 12, stößt man an Grenzen.
... mehr
"He, Nudlaug, wos is?" - Computer spricht jetzt Wienerisch
30.04.2009, derStandard.at
Im Rahmen des vom Wiener Wissenschafts-, Forschungs- und Technologiefonds geförderten Projekts sollten effiziente Methoden gefunden werden, um synthetische Stimmen für Sprachen zu entwickeln, die Varianten einer anderen Sprache sind. In der sprachgesteuerten Kommunikation wird die Natürlichkeit der Interaktion immer wichtiger. „Dafür brauchen wir eine qualitativ hochwertige Sprachsynthese für verschiedene Sprachen und deren Varianten“, so Projektleiter Dr. Michael Pucher. Zwei Jahre benötigten die Forscher des Forschungszentrum für Telekommunikation Wien, um eine TTS zu entwickeln, die verschiedene Wiener Dialekte beherrscht. Praktisch umgesetzt werden sollen die Forschungsergebnisse in einem mobilen Bezirksinformationssystem. Vorerst kann man den synthetisierten Wiener Dialekt nur im Rahmen eines interaktiven Restaurantführers für den ersten Wiener Bezirk unter der Wiener Rufnummer 890 40 55 70 51 hören.
... mehr
IBM-Computer soll Jeopardy gewinnen
28.04.2009, Focus online
In der populären amerikanischen Quizshow „Jeopardy“ will der Computerkonzern IBM zeigen, dass seine Computer Menschen schlagen können. Verglichen mit den Herausforderungen von Jeopardy ist Schachspielen für einen Computer geradezu ein Kinderspiel. Statt eine beschränkte Anzahl von Zügen vorherzuberechnen und zu analysieren, muss der Computer hier nämlich Entscheidungen treffen. „Um Entscheidungen zu treffen, muss der Computer riesige Mengen von Daten nach bestimmten Mustern durchsuchen, alle Auswahlmöglichkeiten abwägen und schließlich schnell und akkurat antworten“, erklärt IBM-Manager Samuel Palmisano.
Eine der größten Herausforderungen dabei ist die menschliche Sprache. Mit den unterschiedlichen Bedeutungen von Worten kommen Menschen prima klar, für Computer sind sie jedoch ein kaum zu überwindendes Hindernis. Kommen noch Wortspiele und subtile Irreführungen hinzu – wie bei „Jeopardy“ üblich – stoßen selbst Supercomputer an ihre Grenzen. Nicht pure Rechenkraft sondern eine intelligent programmierte Software soll das Problem lösen.
... mehr
Verständige Maschinen: Spracherkennung nach Vorbild menschlicher Kognition
22.04.2009, Informationsdienst Wissenschaft
Im Rahmen des Cognitive Systems Programms der EU leitet die Bremer Jacobs University ein dreijähriges Verbundprojekt zur Spracherkennung nach dem Vorbild menschlicher Kognition. Basierend auf den neuronalen Grundlagen menschlichen Sprachverstehens sucht das interdisziplinäre ORGANIC-Forscherteam nach völlig neuen Wegen in diesem Bereich der Künstlichen Intelligenz und verspricht Lösungen für die seit langem ungeklärten Probleme computergestützter Spracherkennung. Da Menschen das flexible Sprachverständnis spielend beherrschen, will das Team soviel wie möglich von menschlichen Gehirnen und den am Sprachverständnis beteiligten Prozessen lernen. Dies ist ein natürlicher, aber keineswegs selbstverständlicher Forschungsansatz: Alle heute existierenden Spracherkennungssysteme basieren auf Forschungen, die sich nie mit Biologie und Funktionsweise von Gehirnen beschäftigt haben. Grundlage war vielmehr eine rein mathematisch-statistische Analyse der Sprachsignale, wie sie von Mikrophonen aufgenommen werden - eine "nachrichtentechnische" Herangehensweise, die offensichtlich prinzipiell zu kurz greift. ... mehr
iPhone bald mit integrierter Sprachsteuerung?
21.04.2009, golem.de
Seit der Einführung des iPhones ist kritisiert worden, dass Apple keine Sprachsteuerung bereitstellt. Dies soll sich nun Gerüchten zufolge ändern: Es gibt Hinweise darauf, dass mit der neuen iPhone-Firmware Spracherkennung und TTS in das Betriebssystem integriert werden. Zum Einsatz kommen diese Technologien aller Voraussicht nach im Rahmen des Voice-Activated Dialing und im Rahmen der ebenfalls neu angekündigten Spotlight3.0-Suche. Bislang unklar ist, ob diese Neuerung auch auf bestehenden iPhones genutzt werden kann oder ob der Endkunde erst ein neues Gerät erwerben muss.
... mehr
Microsoft Exchange Server 2010: Multichannel-Lösung inklusive Voice2Text-Funktion
15.04.2009, heise online
Die Beta-Version des Microsoft Exchange Server 2010 steht seit wenigen Tagen zum Download bereit. Interessant an diesem Produkt sind vor allem die erweiterten Möglichkeiten im Zusammenspiel mit Voice: Durch die verbesserte Integration von Telefondiensten können Voice-Mails künftig auch direkt über Outlook angehört werden. Für die englische Sprache bietet Microsoft zudem eine Voice2Text-Funktion an, mit der Sprachnachrichten in Text konvertiert werden können. In der finalen Version, die für die zweite Jahreshälfte 2009 geplant ist, soll es zusätzlich möglich sein, einen Exchange-Server direkt vom Telefondienst-Anbieter als Voice-Mailbox adressieren zu lassen.
... mehr
OCR für Android und iPhone
14.04.2009, heise online
Die Firma Abbyy Europa hat ihr Produkt „Mobile OCR Engine 3.0 Software Development Kit“ jetzt auch in Android und iPhone integriert. Mithilfe dieser Software kann Text in Bildern erkannt und in maschinenlesbares Format transferiert werden. Ein beliebter Anwendungsfall ist beispielsweise das Einlesen von Visitenkarten. Da die Technologie von Abbyy bereits in allen anderen wichtigen mobilen Plattformen - Windows Mobile, Symbian und Linux - integriert ist, dürften sich in Zukunft funktionale Erweiterungen ausnahmslos auf das Produkt von Abbyy stützen.
... mehr
Philips SpeechMike und Dragon Naturally Speaking jetzt kompatibel
11.04.2009, FAZ.net
Für die Nutzerfreundlichkeit von Diktiersoftware kann es von großem Vorteil sein, wenn die Navigation nicht per Sprache, sondern über einen anderen Kommunikationskanal vorgenommen werden kann. Dies wird durch Produkte wie das SpeechMike von Philips möglich: Befehle wie Diktierbeginn- und Diktierende können damit per Knopfdruck an das System übermittelt werden. Leider war die weit verbreitet Diktiersoftware Dragon Naturally Speaking bislang nicht mit Mikrofonen von Marktführern wie Philips oder Olympus kompatibel. Philips bietet deshalb seit kurzem unentgeltlich eine Windows-Software, Speech-Control, an, mit der diese Lücke geschlossen wird. Neben Dragon Naturally Speaking lässt sich das SpeechMike, dank Speech-Control, auch für andere Diktier-Anwendungen verwenden.
... mehr
Hitachi nutzt multimodale Sprachlösung von Zetes
10.04.2009, autoid-ready
Für das neue Warenlager in den Niederlanden hat der Logistikanbieter Hitachi Transport Systems sich für eine multimodale Lösung von Zetes entschieden. Mit mobilen Sprachterminals und Scannern kommunizieren die Mitarbeiter direkt mit dem Zentralrechner. Neben der Mobilität, die mit dieser Lösung möglich wird, ist vor allem die geringe Fehleranfälligkeit zu erwähnen. Da alle Mitarbeiter mit dem gleichen System ausgerüstet sind, können außerdem bei Bedarf problemlos die Arbeitsbereiche gewechselt werden, was zu mehr Flexibilität und im Endeffekt zu höherer Produktivität führt.

Stef Wildschut, Manager Logistics Engineering Department von Hitachi Transport Systems, zeigt sich zufrieden mit der neuen Lösung: „Als Teil einer japanischen Unternehmensgruppe fiel die Entscheidung für die Einführung von Sprachtechnologie nicht ohne weiteres, da diese Technologie in Japan noch nicht so bekannt ist. Aus diesem Grund kombinieren wir, auf Wunsch eines unserer Kunden, Mitsubishi, nach wie vor Sprache und Scannen. Zetes überzeugte uns von den Vorzügen der Lösung und bisher wurden alle Erwartungen zu unserer vollsten Zufriedenheit erfüllt. Wir erwägen daher nun, Sprachtechnologie auch in anderen Gebieten einzusetzen.“
... mehr
Neue Innovationen im UC-Bereich: Voice, Web und Telefonie wachsen zusammen
31.03./06.04.2009, SpeechTechMag + Opusresearch
Die Technologien wachsen weiter zusammen – und Voice spielt weiterhin eine wichtige Rolle. Die Firma Jaduka hat jüngst ihr Produkt Jaduka Voice Notification vorgestellt, mit dem Sprachnachrichten per E-Mail direkt über den Telefonkanal verschickt werden können.

Die erste Vernetzung von Twitter mit Voice wurde von der Firma Quicktate ins Leben gerufen. Das Produkt TweetCall ist derzeit kostenlos und setzt gesprochene Twitter-Nachrichten in Text um. Dabei gilt, wie bei Twitter üblich, eine Begrenzung von 140 Zeichen, was in etwa 25 Wörtern entspricht. Laut Lee Dorfman, CEO von Quicktate, wird sich in Zukunft auch eine Integration von TTS, die in der Lage ist, den emotionalen Gehalt der Nachrichten widerzuspiegeln, in Twitter lohnen.
Neue alte Sprachsoftware: IBM Via Voice kehrt zurück
03.04.2009, Computerwoche
IBM Via Voice war in Sachen Spracherkennung viele Jahre der Gegenspieler zu Dragon Dictate. Dann verschwand das Produkt vom Markt, IBM hatte kein Interesse mehr an einer gemeinsamen Weiterentwicklung mit Linguatec. Mittlerweile hat Linguatec mit Microsoft einen neuen Kooperationspartner gefunden und bietet nun eine runderneuerte Version von Via Voice als Voice Pro an. Somit ist das Quasi-Monopol von Nuance’s Produkt Dragon Naturally Speaking vorerst wieder gebrochen.
... mehr
IBM treibt Unified Communications voran
02.04.2009, neuerdings.com
Durch IBMs neue Unified-Communications-Lösungen sollen Unternehmen nicht nur effektiver arbeiten und Kosten senken können – generell soll auch der Übergang zu Unified-Communications auf der bestehenden Infrastruktur erleichtert werden. Herzstück im Unified-Communications-Portfolio von IBM ist der Lotus Sametime Unified Telephony Server (SUT), der sowohl mit neuen als auch bereits installierten Systemen arbeitet. SUT bringt dadurch Sprachkommunikation in die am meisten genutzten Geschäftsanwendungen ein. Um sicherzustellen, dass Kunden SUT leicht in die bestehende IT-Infrastruktur implementieren können, kündigte IBM ein umfangreiches Validierungsprogramm an, an dem führende TK-Ausrüster wie Alcatel-Lucent, Avaya und Siemens teilnehmen.
... mehr
Telisma bringt Spracherkennung für Afrikaans und South African English auf den Markt
31.03.2009, Telisma
Gemeinsam mit einem lokalen Partner, CatchWorld, ein Pionier der Sprachtechnologie im südlichen Afrika, hat Telisma eine neue Spracherkennung für Afrikaans und South African English entwickelt. Die neue Software ist kompatibel mit den am häufigsten eingesetzten Voice-Plattformen, unter anderem Avaya, Cisco, Envox-Syntellect, Genesys, HP, Holly, OnMobile und Voxeo.

Die Einführung von Spracherkennung, speziell in Südafrika, dürfte sich lohnen: Mit über 42 Millionen Mobilkunden ist Südafrika eine der am schnellsten wachsenden Mobile Communities der Welt. Zudem wird Afrikaans bzw. South African English nicht nur in Südafrika, sondern auch in umliegenden Ländern wie Botswana und Angola aber auch in Australien und Neuseeland gesprochen.
... mehr
T-Mobile vs. Skype: Streit um die iPhone-App
30.03.2009, winfuture + heise online
Über den AppStore steht seit kurzem Skype für iPhone und iPod kostenlos zum Download zur Verfügung. Die Internettelefonie ist für iPhone-Nutzer aber nur über private oder öffentliche Funk-Netzwerke möglich - nicht aber über UMTS. T-Mobile will es so: Apples deutscher Partner lässt sich durch Skype seine Mobiltelefonie-Einnahmen nicht vermiesen.

“Smartphone kaufen, Datenflatrate abonnieren, billig per Skype telefonieren.” Genau das versucht T-Mobile zu verhindern. Offiziell begründet das Unternehmen die Skype-Blockade mit dem “Schutz der Netz-Performance”. “Dass durch die Skype-Nutzung das Netz überlastet wird, kann ebenso als vorgeschobenes Argument angesehen werden wie die Behauptung, dass Kunden sich bei T-Mobile beschweren würden. Ich glaube vielmehr, dass durch die Nutzung der VoIP-Software die etablierten Spielregeln in Gefahr geraten und T-Mobile seine Gatekeeper-Funktion mit aller Macht aufrecht erhalten will. So ist denkbar, dass Kunden den günstigsten iPhone-Tarif buchen und ihre Gespräch dann über Skype führen. Noch gravierender ist sicherlich der Kontrollverlust. Über Skype kann gechattet und weitere Zusatzdienste genutzt werden. Die Dose der Pandora hat sich also schon geöffnet”, erklärt der Düsseldorfer Unternehmensberater Bernhard Steimel von Mind Business Consultants.
Nortel mit neuen Produkten – speziell für den Healthcare-Bereich
27.03.2009, SpeechTechMag + TMC
Ungeachtet der wirtschaftlichen Lage entwickelt Nortel weiterhin neue Lösungen im Voice- und UC-Bereich: Das Contact Center 7.0 ist eine flexible UC-Lösung, die nun auch den Microsoft Office Communications Server (OCS) integriert.

Gerüchten zufolge will Nortel sich außerdem auch weiter im Healthcare-Markt etablieren. Aus Insider-Kreisen heißt es, dass hier 500 Millionen US-Dollar investiert werden sollen. Diese Investitionen sind Teil eines 5-Jahres-Plans, bei dem eine Reihe von Produkten für verschiedene vertikale Märkte entwickelt werden sollen.
Nandoo.net: Neue Software für das Semantic Web
23.03.2009, Meedia
CyberConsult und die Universität Potsdam, unter der Leitung des Linguisten Manfred Stede, arbeiten an einer neuen Software für semantische Analyse: Nandoo.net. Die intelligente Software spürt selbständig Nachrichtentexte zu einem bestimmten, vom Nutzer vorgegebenen Thema auf. Dadurch wird sie auch für den automatisierten Customer-Service relevant – etwa, wenn es um das Sortieren von Emails oder um das Auspüren von Kundenfeedback zu bestimmten Produkten geht. Zwar sind die Funktionen von Nandoo.net als solche keine Neuerung – neu ist aber laut Hersteller die Qualität der gelieferten Suchergebnisse: "...mit Unwichtigem werden Sie in Zukunft gar nicht mehr belästigt“, so Produktmanager Bernd Mrohs. Um die Performance der Suchmaschine stetig zu verbessern, können die Nutzer sie selbst auf einfache Weise trainieren.
... mehr
Aastra optimiert Prozesse in der Altenpflege durch mobile Technologien
20.03.2009, pressebox
Aastra hat dem Arbeiter- und Samariterbund (ASB) Mainz in diesen Tagen den Abschlussbereicht zum Projekt „Das intelligente Heim“ vorgelegt. Im Rahmen des vom Landesministerium für Soziales, Arbeit und Familie in Rheinland-Pfalz geförderten Modellprojekts hat Aastra eine Lösung realisiert, die den bürokratischen Aufwand in der Altenpflege spürbar reduziert – für die von Kürzungen und Einsparungen gebeutelte Branche eine große Stütze, zumal so mehr Zeit für die persönliche Patientenbetreuung bleiben soll. „Der Einsatz innovativer Technik zählt zu den Kernelementen, mit denen soziale Einrichtungen und Pflegeheime die sich ständig ändernden Bedingungen im Gesundheitswesen erfüllen und gleichzeitig eine qualitativ hochwertige und effektive Versorgung pflegebedürftiger Menschen gewährleisten können. Angesichts der gesetzlichen Vorgaben, der Medienbrüche zwischen verschiedenen Technologien und fehlender Handlungsleitlinien zur Pflegedokumentation verursachte die Dokumentation erbrachter Leistungen in der Altenpflege bislang einen erheblichen zeitlichen und bürokratischen Aufwand.“, erklärt Thomas Althammer, bei Aastra verantwortlich für HealthCare-Solutions. Besonders erwähnenswert ist die mobile Leistungserfassung per DECT-Telefon: Durch diese Technologie können zeitnah, beispielsweise vor Ort in Bewohnerzimmern, Patientenwerte erfasst und dokumentiert werden. Pflegeberichte können auf Wunsch per Spracherkennung eingegeben werden.
... mehr
Sprachtechnologie im Web: Blog-Einträge, News und Emails per TTS
16./19.03.2009, heise online + Marketing-Börse
Sprachtechnolgie und Internet wachsen zusammen. Ein einfaches Anwendungsszenario, welches vor allem für das Mobile Web wertvoll ist, ist das Readback von Web-Inhalten per TTS.

Die schwedische Firma Voicecorp stellt mit dem webReader ein solches Produkt vor. "Wir haben uns die Rückmeldungen einer Menge kleinerer Internetseiten und Blogs genau angeschaut. Daraufhin haben wir viel Arbeit investiert um ein Paket zu entwickeln, das zu diesen Kunden passt. Es gibt auch eine gebührenfreie, mit Werbebannern finanzierte Version speziell für kleine Internetauftritte und Blogs.", erklärt CEO und Firmengründer Niclas Bergström. Anwendung findet der webReader bereits auf der Seite der Techniker Krankenkasse oder auf heise online.

Ein ähnliches Produkt stellte die Firma Evalanche, eine Agentur für E-Mail Marketing vor. Das aktuelle Release V 3.1 bietet die Möglichkeit, sich Newsletter, News und Emails per TTS ausgeben zu lassen.
Optimales Suchmaschinenmarketing: Grundlagen des Natural Language Processing
16.03.2009, marketingpilgrim
Qualitativ hochwertige Suchmaschinen-Optimierung (SEO) und Marketing (SEM) stehen und fallen mit den Suchmaschinen – allen voran Google. Um hier optimale Ergebnisse zu erzielen, sind Grundkenntnisse im Natural Language Processing (NLP) sehr hilfreich: Dies ermöglicht das Anpassen von Website-Inhalten auf die am häufigsten genutzen Suchmaschinen. Marie-Claire Jenkins, Spezialistin für Sprachtechnolgie an der University of East Anglia, erklärt im Interview den Zusammenhang von NLP und SEO/SEM.
... mehr
Small Talk – der iPod shuffle spricht
11.03.2009, Apple
Stark in ihrer Größe reduzierte Interfaces und steigende Software-Komplexität stellen die mobile Technologie vor eine große Herausforderung. Hier wird Sprachtechnologie schon lange als vielversprechende Lösung gehandelt. Für den neuen iPod shuffle setzt Apple zwar keine Spracherkennung zur Systemsteuerung ein – wohl aber eine TTS für die Systemrückmeldungen. Bei einer Größe von 45,22 mm x 17,5 mm bleibt auch kaum eine andere Wahl: Der Nutzer navigiert mithilfe einer im Kopfhörerkabel eingelassenen Bedieneinheit, während Titel und Playlists per TTS ausgegeben werden. Insgesamt soll die Handhabung des Apple-Produkts gewohnt einfach sein – dies verspricht zumindest die Guided Tour auf der Homepage des Herstellers.
... mehr
Neue mobile Sprachapplikationen drängen auf den Markt
02.-09.03.2009, TMC, Nuance Communications, opusresearch, news.de, heise online
Stetig gibt es Neuerungen auf dem mobilen Voice-Markt, vor allem für Apples iPhone: Die Firma Metaphor Solutions stellt mit SayMedia eine Voice Search Anwendung für das iPhone vor. SayMedia ermöglicht die sprachgesteuerte Suche nach Medien wie Musiktiteln und Filmen, zum Beispiel bei Youtube, aber auch Filmkritiken und Kinoprogramme können mit SayMedia via iPhone abgerufen werden.

Ebenfalls für das iPhone entwickelt: ShoutOUT, die erste Voice-to-SMS Anwendung von Promptu Systems. Promptu plant darüber hinaus noch weitere Vorstöße in die mobile Voice2Text-Welt: Ausweitungen auf Twitter, Email oder Facebook sind laut Promptu-CEO Giuseppe Staffaroni schon in naher Zukunft denkbar.

Eine weitere iPhone-Anwendung, die demnächst auf den Markt kommen soll, ist Speeek!, ein Produkt von BB Softservice Corp. aus Tokio. Speeek! ist ein erweitertes Lexikon: Die Software erkennt gesprochene Lexikoneinträge, übersetzt sie in eine andere Sprache und gibt das Übersetzungsergebnis per TTS aus.

Einen ganz anderen Hintergrund hat die Anwendung TokTok von Ditech Networks. Diese Anwendung lässt sich per Spracherkennung, sogar während eines Telefongesprächs, aufrufen. Mit TokTok können Nutzer eigene Sprachnotizen verfassen und dank der Integration in web-basierte Dienste z.B. Sprachnachrichten via Facebook verschicken

Schließlich hat noch Nuance die Verfügbarkeit von Nuance Mobile’s VSuite 3 und XT9 auf Samsung Memoir angekündigt. Die integrierte Spracherkennung unterstützt bei der Navigation, während XT9 das Verfassen von Textnachrichten durch intelleigentes Vervollständigen (“predictive text support”) erheblich erleichtert. So wird nicht nur das Verfassen von SMS und Emails vereinfacht, auch das Eingeben von URLs wird erheblich komfortabler.

Und zu guter Letzt: Amazons umstrittener E-Book-Reader Kindle ist nun auch auf dem iPhone verfügbar. Der Streit um die Vertonungsrechte ist inzwischen ebenfalls beigelegt: Auf Wunsch der Autoren kann die Vorlesefunktion für die betreffenden Werke deaktiviert werden.
SpinVox verwandelt Skype-Voicemails in Textnachrichten
03.03.2009, Pressebox
Durch das Zusammenspiel von Spinvox und Skype wird eine noch höhere Erreichbarkeit gewährleistet – Spracherkennung und Multichannel-Technologie machen es möglich. Spinvox-Technolgie konvertiert Skype-Sprachnachrichten in Text und versendet diese per SMS auf das Mobiltelefon. Der Service ist für die Sprachen Englisch, Spanisch, Französisch und Deutsch verfügbar und bedarf keiner zusätzlichen Software auf dem Mobiltelefon.

"Durch SpinVox erhalten unsere Nutzer zusätzliche Flexibilität und mehr Bedienkomfort", sagt Mike Bartlett, Director of Product Strategy bei Skype. "Da die Menschen immer häufiger unterwegs und dabei auf ihre mobilen Geräte angewiesen sind, wollen sie auch ihre Skype-Unterhaltungen immer dabei haben. SpinVox bietet die großartige Möglichkeit, die empfangenen Nachrichten direkt und unmittelbar auf das Mobiltelefon gesendet zu bekommen und so Zeit zu sparen."
... mehr
Die IT wächst zusammen: Innovative Neuerungen in der Unified Communications
03./06.03.2009, Avaya, searchnetworking.de
Neuerungen im Bereich der Unified Communications lassen die Kommunikationstechnologie weiter zusammenwachsen: Avaya stellt das erste Media Phone der Produktfamilie Avaya one-X Deskphone (Serie 9600) vor. Mit diesem Gerät können Anwender über einen Farb-Touchscreen direkt auf Anwendungen und internet-basierte Informationen zugreifen. Das Gerät bietet integrierte Funktionen, die Anwender bislang von mobilen Geräten wie PDAs kennen - etwa den Zugriff auf eine QWERZ-Tastatur, Taschenrechner, Straßenkarten oder Wetterberichte. Zudem können Nutzer auf dem Bildschirm durch ihre Kontakte scrollen oder Bedienfelder aufrufen. Bei Bedarf können weitere Features aus dem Internet heruntergeladen werden

Ferrari Electronic hat mit dem OfficeMaster Gate UC ein neues Mediagateway angekündigt. Das von Microsoft zertifizierte Gerät verbindet klassische ISDN-Telefonie mit den IP-basierten Plattformen Office Communications Server 2007 und Exchange Server 2007. Auf Wunsch kann der OfficeMaster um die Dienste Fax, SMS oder Voicemail erweitert werden. „Durch das ausgereifte Zusammenspiel mit dem Office Communications Server 2007 können Unternehmen die Microsoft-/Ferrari-Technologien als vollwertige Telefonanlage oder als Ergänzung zur vorhandenen PBX einsetzen“, erläutert Christoff Wiethoff, Vertriebs- und Marketingleiter von Ferrari Electronic
Revolution in der Künstlichen Intelligenz? Neue Suchmaschine Wolfram Alpha vor der Markteinführung
10.03.2009, Spiegel online
Stephen Wolfram, bekannter Physiker, “Wunderkind” und Erfinder der Software Mathematica, will im Mai seine neue “Computational Knowledge Engine” Wolfram Alpha vorstellen. Glaubt man den Ankündigungen und dem Urteil namenhafter Semantic Web-Experten wie Nova Spivack, dann wird Wolfram Alpha Suchmaschinen wie Google weit in den Schatten stellen. Wolfram Alpha greift nicht bloß auf Datenbanken zurück, es “berechnet” die Antworten zu vom Nutzer gestellten Fragen. Genauer gesagt, werden aus natürlichsprachlich formulierten Anfragen Formeln generiert, welche auf eine Wissensbasis zugreifen. Laut Wolfram wird die Knowledge Engine “uns beinahe an den Punkt bringen, von dem die Menschen schon vor 50 Jahren dachten, dass Computer ihn erreichen würden". Die Erwartungen damals waren sehr hoch - man darf gespannt sein auf das GoLive im Mai 2009.
... mehr
Entwicklungswerkzeug für Sprachanwendungen: Das VoiceWorksModule von Telenet
09.03.2009, Telenet
Mit dem Entwicklungswerkzeug VoiceWorksMobile (Arbeitstitel) von Telenet können laut Hersteller in kürzester Zeit mit eigenem Personal multi-mandantenfähige und mehrsprachige Sprachanwendungen entwickelt und implementieret werden. Dadurch, dass VWM Java-basiert ist, kann es mit geringem Zeitaufwand einer breiten Masse von Entwicklern zugängig gemacht werden.
... mehr
Loquendo bringt neue Version von VoxNauta auf den Markt
23.02.2009, SpeechTechMag
Mit VoxNauta 7.1.0 hat Loquendo eine neue Version seiner VoiceXML/CCXML-Plattform auf den Markt gebracht – und das nur wenige Monate nach dem Release von Version 7.0.25. Zwar soll VoxNauta 7.0 nicht vom Markt verschwinden, aktiv angeboten wird in Zukunft jedoch lediglich Version 7.1.

Zu den Neuerungen zählen ein standardisierter CCXML-Interpreter nach aktueller W3C-Norm und die Möglichkeit, VoxNauta als Media Resource Function einzusetzen, wodurch im Rahmen eines RFC 4240 SIP Protokolls Conference-Calls initiiert oder Ansagen abgespielt werden können. Außerdem können Anwender nun via VXML alle Features der Loquendo-Technologien gezielt nutzen.
... mehr
Voice Pro 12 - verbesserte Spracherkennung von Linguatec
19.02.2009, Pressebox
Laut Linguatec wurde die Erkennungsgenauigkeit der neuen Version auf bis zu 99 Prozent verbessert. Um diese Quote zu erreichen, hat das Unternehmen die akustischen Modelle erheblich erweitert. Mit der neuen Funktion SpeechCorrect sollen auch Homophone kein Problem mehr sein. Eine Satz wie: "Nach Lektüre des logischen Empirismus von Friedrich Waismann weiß man wirklich mehr" soll demnach fehlerfrei in Text umgesetzt werden. Und die neuen SmartCommands erlauben dem Nutzer die Eingabe komplexer Anweisungen wie: "E-Mail schreiben an Jörg Hoppe mit Betreff Unser Meeting". Die Spracherkennungssoftware ist ab dem 27. März in fünf verschiedenen Versionen erhältlich.

... mehr
Emotions-Radar: Erkennen, was den Kunden bewegt
18.02.2009, Informationsdienst Wissenschaft
Kommerzielle Marken und Produkte sind immer stärker abhängig von über Online-Medien verbreiteten Trends und Meinungen – zu diesem Ergebnis kommt auch die aktuelle Studie von Genesys zur Generation der Millenials. Passend dazu bringt das Fraunhofer IAIS mit dem “Online-Emotions-Radar” ein wichtiges Instrument zur Erfassung von emotionalen Stimmungen zu Marken und Produkten auf den Markt. Der Emotions-Radar basiert auf einem statistischen Verfahren und ist auf verschiedenste Anwendungsdomänen optimierbar. Auf der CeBIT wird exemplarisch das Ergebnis einer Analyse zu bekannten Autoherstellern vorgestellt. Dazu wurden ca. 1 Million deutschsprachiger Online-Beiträge ausgewertet. Resultat ist eine Zuordnung der prominentesten Basisemotionen wie Ärger, Freude und Ablehnung zu den jeweiligen Marken.
... mehr
Microsoft Recite: Software für Sprachnotizen
16.02.2009, golem
Mobiltelefone, auf denen man Sprachnachrichten als akustische Notiz hinterlegen kann, sind nicht Neues. Mit Microsoft Recite können diese Notizen jetzt aber auch per gesprochener Sprache durchsucht werden. Aufnahme und Suche sind dabei ganz einfach über das Interface getrennt: Für eine Aufnahme drückt der Nutzer den Button „Remember“, für eine Suche den Button „Search“. Die Suche basiert dabei nicht auf klassischer Spracherkennung, sondern mit Voice Pattern Matching auf einer eigentlich eingeschränkteren Technologie. Stathis Papaefstathiou, Produktmanager bei Microsoft, sieht viele mögliche Szenarien, in denen Microsoft Recite zum Einsatz kommen könnte – zum Beispiel beim Aufsprechen von Einkaufslisten, Geburtstagen, Adressen oder spontanen Ideen.
... mehr
Sprachcomputer sollen Gefühle erkennen
16.02.2009, Informationsdienst Wissenschaft
Die Anstrengungen der Forschung zur maschinellen Spracherkennung beliefen sich bislang vornehmlich auf die Identifikation des rein linguistischen Gehalts im akustischen Sprachsignal. Neben der linguistsichen Komponente besteht ein Sprachsignal jedoch noch aus der sogenannten paralinguistischen Komponente, zu der neben permanenten Eigenschaften wie Alter und Geschlecht des Sprechers auch der emotionale Zustand gehört. Dieser emotive Aspekt des Sprachsignals wird schwerpunktmäßig am Lehrstuhl für Systemtheorie und Signalverarbeitung der Universität Stuttgart erforscht. Mithilfe von Sprachdatenbanken und statistsichen Verfahren werden Sprecher nach Basisemotionen wie Ärger oder Freude klassifiziert. Der Mehrwert für Anwendungsbereiche wie Automotive oder Service-Center liegt auf der Hand.
... mehr
ESTOS und Aastra zertifizieren Kommunikationsanwendungen für Unified Communications
13.02.2009, Aastra DeTeWe GmbH
Softwarehersteller ESTOS und Telekommunikationsspezialist Aastara haben zwei Anwendungen für Unified Communications mit CTI zertifiziert, welche sich nahtlos in die bestehende Infrastruktur mit bereits eingesetzten ERP- und CRM-Systemen einfügen. Dadurch soll die Konvergenz in der Unternehmenskommunikation weiter vorangetrieben werden. Einheitlichkeit in den Technologien wie z.B. VoiP und die konsequente Ausrichtung an Standards, z.B. SIP, gewährleistet die Integration von Kommunikationstechnologien in die klassischen IT-Anwendungen von Unternehmen. Eine zentrale Rolle spielt dabei die Computer Telephony Integration.
... mehr
Neue Version der Dialoganalyse-Software “Qualityobserver”
13.02.2009, funkschau
Die Firma Next Level Speech stellt den Qualityobserver 2.0 vor – eine aktualisierte Voice-Analytics Software. Nach Aussage von Next Level Speech zeichnet sich die neue Version vor allem durch eine verbesserte Spracherkennung aus. "In unserer Version 2.0 stecken Erkenntnisse aus über zwei Millionen echten Kundengesprächen", stellt Geschäftsführer Thomas Riegel fest. Voice-Analytics Software wie der Qualityobserver dient insbesondere dazu, “auffällige”, d.h. nicht einer bestimmten sprachlichen Norm entsprechende Telefongespräche, herauszufiltern, um anschließend die Agenten entsprechend “nachzuschulen”. Was dabei als Norm gelten soll und was nicht, kann der Anwender jeweils selbst festlegen. Als Input für die Analyse dienen dem Qualityobserver 2.0 nicht nur die Äußerungen des jeweiligen Service-Agenten, sondern auch die des Anrufers.
... mehr
Angel.com kombiniert SugarCRM mit Sprachtechnologie
02.02.2009, SpeechTechMag
SugarCRM, ein beliebtes Open Source Tool zur Pflege von Kundendaten, gibt es nun auch als Multichannel-Lösung. Dank der Integration von Sprachtechnologie durch Angel.com kann SugarCRM jetzt komplett via IVR gesteuert werden. Neben der mobilen Nutzung von Stammdaten sind noch weitere wertvolle Funktionen vorgesehen: Das Aufnehmen von Notizen, das Anlegen von Aufgaben und das Erstellen und Senden von E-Mails mithilfe von Spracherkennung. Ahmed Bouzid, Director of Partner Solutions bei Angel.com, betont vor allem den Vorteil der Kostenersparnis dieser neuen Voice-Lösung: Dadurch, dass der IVR Anrufer und Kontext des Anrufs jeweils bekannt seien, würden Anrufe von drei bis vier Minuten Länge im Schnitt auf 20 Sekunden reduziert, so Bouzid.

... mehr
Amazons neues Kindle
09./11.02.2009, FAZ.Net + golem.de
Amazon präsentierte am Montag dieser Woche das neue Modell seines E-Book-Readers Kindle auf einer Pressekonferenz in New York. Das digitale Lesegerät fällt mit 9 mm deutlich dünner aus als der Vorgänger, wiegt 289 Gramm und hat sich von seinem kantigen Design verabschiedet. Wer ein Kindle 2 besitzt, kann sich künftig den digitalen Lesestoff auch vorlesen lassen, anstatt ihn nur zum Lesen anzuzeigen. Das aber verletzt nach Ansicht des US-Schriftstellerverbandes Author's Guild die Urheberrechte der Autoren. "Sie haben nicht das Recht, ein Buch laut vorzulesen", sagte der Chef der amerikanischen Autorenvereinigung Paul Aiken. Amazon selbst bezeichnet die Ausgabe per TTS noch als experimentell.
... mehr
Intelligenter Raum hört und sieht Nutzer
05.02.2009, Pressetext Schweiz
Der im Rahmen des EU-Projektes CHIL bereits 2004 entworfene „Smart Room“ wird nun von Forschern der Universitat Politècnica de Catalunya (UPC) vor allem im Bereich Sprach- und Geräuscherkennung auf Vordermann gebracht. Das gesprochene Wort kann das System bereits ausreichend verstehen und entsprechend reagieren. Der Forschungsschwerpunkt liege deshalb auf der Erkennung akustischer Ereignisse, erklärt der projektbeteiligte Wissenschaftler Josep Ramón Casas. „Geräusche, die keine gesprochenen Worte sind, werden normalerweise nicht erkannt“, beschreibt Casas eine Einschränkung aktueller Systeme. Dabei sind für Menschen auch Schritte, das Geräusch einer Tür, die geöffnet wird, oder das Ablegen von Gegenständen Hinweise darauf, was um sie herum geschieht. In Zukunft werde eine Art Geräusch-Karte erstellt, mit der Sprecher lokalisiert werden können, so Casas über seine Forschung.
... mehr
Websites hören auf‘s Wort
04.02.2009, Computerzeitung
Die von Materna zum Patent angemeldete Technologie VoiceFlash soll dafür sorgen, dass Anwender ihre Websites ohne Tastatur und Maus per Sprachbefehl steuern können. Mit der Technologie sollen sich auch Webformulare vollständig ausfüllen lassen. VoiceFlash soll nicht nur auf dem heimischen Computer, sondern auch mobil - auf dem Handy oder Smartphone - zum Einsatz kommen. Die Interaktion mit Webinhalten via plattformübergreifender Sprachsteuerung bedeutet für Webentwickler auch die Möglichkeit, das Problem der Barrierefreiheit von Webseiten ein Stück weit zu entschärfen. VoiceFlash soll auf dem Mobile World Congress vom 16.-19. Februar in Barcelona vorgestellt werden.
... mehr
IBM: Computerstimmen sollen menschlicher werden
02.02.2009, Windows Online Magazin
Der Technologiekonzern IBM will die Ausgabe per Sprachsynthese deutlich natürlicher klingen lassen. Monotone oder abgehackt klingende Computerstimmen gehören damit der Vergangenheit an. In Zukunft werden TTS-Stimmen weniger steril wirken und bewusst nicht perfekt sein. So sorgt die neue Technologie beispielsweise dafür, dass das Sprechtempo variiert und an passenden Stellen Pausen eingefügt werden. Ein weiteres Mittel der „Vermenschlichung“ ist das Einstreuen der verbreiteten Fülllaute wie „äh“ und „hm“. Diese Laute werden in der Sprache für gewöhnlich nicht wahrgenommen, ihre Integration habe aber einen profunden psychologischen Effekt, so Andy Aaron vom Sprachforschungsteam bei IBM: Der Anrufer fühlt sich bei der Kommunikation mit dem Sprachcomputer deutlich wohler.
... mehr
Computer 'lernen' vom Menschen
30.01.2009, Informationsdienst Wissenschaft
Um Maschinen leidliches Sprachverstehen und intelligentes Verhalten zu ermöglichen, waren bislang oft regelbasierte Systeme im Einsatz. Derartige Systeme müssen von Experten in mühsamer Handarbeit erstellt und optimiert werden und sind meist hochkomplex. Seit Begründung der KI in den 1960er Jahren träumt die Wissenschaft daher davon, dass der Computer sich das nötige Wissen selbst aneignet und die gewünschten Fähigkeiten erlernt. Jetzt haben Informatiker der TU Darmstadt eine Software entwickelt, die es dem Computer ermöglicht, auf das eigentlich für menschliche Leser bestimmte Wissen in Online-Werken wie Wikipedia oder Wiktionary zuzugreifen. Diese Software bringt den Traum des automatischen Sprachverstehens der Realisierung näher.
... mehr
Sprechwissenschaftler erforschen Call Center Gespräche
28.01.2009, Martin-Luther-Universität Halle-Wittenberg
Das Seminar für Sprechwissenschaft und Phonetik der Martin-Luther-Universität Halle-Wittenberg beschäftigt sich unter der Leitung von Seminar-Direktor Prof. Dr. Baldur Neuber mit der „Erforschung und Optimierung der professionellen Telefonie“ in Call Centern. Erklärtes Ziel des Vorhabens ist es, im Bereich der Sprechwirkungsforschung Gesprächsverläufe in Call Centern zu beschreiben und zu optimieren.

Neuber und seine Mitarbeiter haben dafür Call Center besucht und Gespräche aufgenommen. Der Gesprächsverlauf wird analysiert und soll Aufschluss geben über mögliche Gesprächsoptimierungen, die Automatisierung von Prozessen mündlicher Kommunikation in der professionellen Telefonie sowie die Automatisierung mündlicher Kommunikation an der Mensch-Maschine-Schnittstelle.
... mehr
Spracherkennung erleichtert Mobilität und Arbeitsabläufe in Produktion und Logistik
28.01.2009, proLogistik, Vocollect
Spracherkennung setzt sich immer mehr als beliebtes Hilfsinstrument in Produktion und Logistik durch. Die Dortmunder Firma proLogistik beispielsweise bietet seit Kurzem den Mobilcomputer Voice-Client pL-Voice 8.25 an. Ein weiteres Indiz ist die Implementierung der Sprachsoftware Vocollect Voice auf dem CK3 - einem Mobilcomputer von Intermec für logistische Aufgaben. “Indem wir Vocollect Voice auf dem CK3 anbieten, können Kunden den CK3 in einem ‘händefreien’ Modus nutzen und so ihre Prozesse und ihre Produktivität im Lager erheblich verbessern.", so Barry Issberner, Vice President of Global Marketing bei Intermec.
... mehr
EU-Projekt Luna: Durchbruch bei der kontinuierlichen Spracherkennung?
28.01.2009, Innovationsreport
Ziel des EU-Projekts Luna ist es, die maschinelle Erkennung von spontan gesprochenen Äußerungen wesentlich zu verbessern. Dafür wurde der gewaltige Sprachkorpus, der das Rückgrat von Erkennung und Interpretation ist, allerdings auf drei Domänen begrenzt: Reiseauskünfte, IT-Probleme bei Endverbrauchern und Touristik-Informationen. Mit industriellen Partnern wie der France Telecom, Loquendo und CSI Piemonte wird dabei die Brücke zwischen Theorie und Praxis geschlagen.
... mehr
Dialogsystem schult Pharmazie-Studenten im Umgang mit Patienten
28.01.2009, Wissenschaft aktuell
Als neues Anwendungsfeld für Sprachtechnologie scheinen sich Dialogsysteme zum Erlernen kommunikativer Fähigkeiten herauszukristallisieren. Nach den virtuellen Avataren, die zum Verkaufstraining eingesetzt werden (vgl. Bericht in der VOICE Community), gibt es nun ein von britischen Forschern entwickeltes Dialogsystem, mit dem Pharmaziestudenten den Umgang mit Patienten erlernen können. „Der virtuelle Patient ermöglicht es, eine vollständige ärztliche Beratung des Patienten zu erleben und den Studenten aus Fehlern lernen zu lassen - und das in einer sicheren Umgebung, wie sie in der Realität nicht möglich wäre“, erläutert Stephen Chapman, Leiter der Keele's School of Pharmacy. Die Interaktion ist dabei sowohl per Spracherkennung als auch per Tastatur möglich.
... mehr
Loquendo bringt russische Spracherkennungssoftware auf den Markt
28.01.2009, Wissenschaft aktuell
Die russische Sprache hat europaweit die meisten Sprecher. Deshalb ist Russland auch für den Sprachtechnologiemarkt interessant. Nach Einführung einer TTS für Russisch im Oktober 2008 hat Loquendo nun auch eine russische Spracherkennungs-Software auf den Markt gebracht.
... mehr
Nuance präsentiert Dragon NaturallySpeaking Legal 10
14.01.2009, Nuance Communications, Inc.
Nuance Communications gibt die Markteinführung von Dragon NaturallySpeaking Legal 10 bekannt - eine Spracherkennungssoftware speziell für Rechtsabteilungen großer Unternehmen, Behörden sowie Anwaltskanzleien. Die neue Version Nr. 10 zeichnet sich vor allem durch eine weiter verbesserte Erkennungsgenauigkeit sowie den Wegfall eines aufwendigen Sprachtrainings aus. Sprachgesteuertes Surfen im Internet ist mit Dragon NaturallySpeaking Legal genauso möglich wie das Diktieren in Microsoft Word, Excel, Corel WordPerfect und in den meisten anderen Windows-Anwendungen. Mit Nuance RealSpeak 2, die Text-to-Speech-Anwendung mit einem natürlichen Sprachklang, können E-Mail-Nachrichten und Dokumente laut vorgelesen werden. Dragon NaturallySpeaking lässt sich außerdem in andere Anwendungen integrieren: elektronische Berichtsmanagementsysteme, elektronische Formulare sowie Programme zur Berechnung von Rechts- und Gerichtskosten.
... mehr
Virtueller Avatar soll Verkäufer schulen
14.01.2009, Speech Technology
Die Firma Knowledgeshift hat mithilfe eines IVR-Systems von Ifbyphone eine multimodale Rollenspiel-Anwendung entwickelt: Verkäufer können mit einem virtuellen Avatar Kundengespräche trainieren. Das Gespräch kann dabei aufgezeichnet und anschließend im Detail analysiert werden. Allerdings ist eine echte Interaktivität bislang noch nicht gegeben – das System handelt, zumindest unter der Nutzer-Oberfläche, unabhängig von der Eingabe des Nutzers. Knowledgeshift plant jedoch für die zukünftigen Versionen eine Einbeziehung der Nutzereingaben in die Systemhandlungen.
... mehr
Multichannel-Lösung aus einer Hand – Aastra prästentiert Aastra Smart Center 4.0 und Astra Voice Portal 7.5
14.01.2009, Aastra DeTeWe GmbH
Hilfreich auf dem Weg zum "Unified Customer Service": Die neuesten Versionen der Aastra Call Center Lösungen: Aastra Smart Center 4.0, Aastra Smart Dialer 3.0 und Aastra Voice Portal 7.5. Die neuen Produktversionen helfen, die Prozesse im Call Center noch weiter zu optimieren. Das neue ASC 4.0 integriert nahtlos alle Medien. Alle eingehende Nachrichten – per Telefon, Fax, E-Mail, Web oder Sprachbox – werden medienunabhängig schnell und flexibel an die verfügbaren Agenten verteilt. In Verbindung mit dem Aastra Smart Dialer lässt sich das ASC auch für Outbound-Kampagnen nutzen und mit dem multimedialen Sprachdialogsystem Aastra Voice Portal 7.5 lässt sich das ASC jederzeit um IVR-Funktionen erweitern.
... mehr
VoiceObjects stellt die VoiceObjects Developer Edition 7.4 zum Download zur Verfügung
12.01.2009, VoiceObjects
Voice Objects hat die VoiceObjects Developer Edition Version 7.4 zum Download bereitgestellt. Neu bei dieser Version ist vor allem die Integration von SMS, wodurch Anwendern die Möglichkeit gegeben wird, Ihre Self-Service-Kanäle zu erweitern. Außerdem ist das Produkt nun mit zwei weiteren Plattformen kompatibel: Nortel ICP und Voxeo Prophecy 9.0. Daneben wurden Verbesserungen in der Sicherheit vorgenommen und neue Funktionen integriert, um die Handhabung zu erleichtern.
... mehr
Hausroboter in Japan: Sprachgesteuerte Helfer im Alltag
14.01.2009, SpeechTechBlog/Mitsubishi
Sie sehen rund und niedlich aus und sie sind immer für Ihre Mitbewohner da: Hausroboter in Japan. Zurzeit machen zwei Exemplare besonders von sich reden: Wakamaru von Mitsubishi und Apripoko, den Toshiba demnächst auf den Markt bringen will. Diese beiden kleinen Wesen sind auch von ihrem Äußeren her dazu angelegt, “mit den Menschen zu leben”. Sie können Personen anhand von Gesicht und Stimme erkennen und lernen, indem Sie zuschauen und zuhören.
... mehr
Nuance und GE Healthcare integrieren SpeechMagic erstmals in Citrix-fähiges Radiologieinformationssystem
17.12.2008, VOICE Community
Nuance gab kürzlich bekannt, dass seine Spracherkennungstechnologie SpeechMagic in das Centricity Radiologieinformationssystem (RIS) von GE Healthcare integriert wurde. Erstmals ist es damit möglich, vollwertige Spracherkennung innerhalb des RIS, sowohl im Front-End- als auch im Back-End-Betrieb, in einer Citrix-Umgebung zu nutzen. Krankenhäuser, Radiologiezentren und Versorgungsnetzwerke können damit unabhängig von der bestehenden Netzwerkstruktur einen digitalen radiologischen Arbeitsablauf umsetzen. Nuance erwartet, dass die neue Lösung die Anwendung von Spracherkennung in der Radiologie signifikant erhöhen wird.
... mehr
Neuer Nuance Webcast: Benchmarking von Anrufererfahrungen
17.12.2008, VOICE Community
In diesem 15-minütigen on-demand Webcast beschreiben der prämierte Tech-Writer Stan Gibson und Christy Murfitt von Nuance, wie Sie durch Benchmarking die Qualität Ihres Call Centers mit der Ihrer Wettbewerber vergleichen können. Lernen Sie zudem, welchen ROI Ihr Benchmark zeitigen kann und wie er Ihnen dabei hilft, Optimierungspotenziale zu heben und erfolgreich neue Call Center-Anwendungen als Ergebnis Ihres Benchmarks zu implementieren.
... mehr
EMMA: Extensible MultiModal Annotation Markup Language steht zur Diskission
17.12.2008, VOICE Community
Die Multimodal Interaction Working Group des W3C hat eine Empfehlung für EMMA, die Extensible MultiModal Annotation Markup Language publiziert. Dieses Dokument ist Teil eines Satzes von Spezifikationen für multimodale Systeme und enthält Details einer XML Markup Language für die Erfassung und Zuordnung von Nutzereingaben. Kommentare zu der Empfehlung sind willkommen bis zum 15 Januar 2009.
... mehr
Update für Loquendo VoxNauta VoiceXML/CCXML Platform
17.12.2008, VOICE Community
Loquendo publiziert mit Loquendo VoxNauta 7.0.25 eine neue Version seiner VoiceXML/CCXML platform. Loquendo VoxNauta ist laut Anbieter eine mächtige, voll skalierbare leicht zu nutzende Plattform, die von vielen Carriern, Unternehmen, Service Providern und Innovatoren eingesetzt werde, um IVRs und sprachgesteuerte Applikationen zu entwickeln, die auf den W3C VoiceXML and CCXML Standards beruhen.
... mehr
Thumbtack - moderne Bookmarksammlung von Microsoft
17.12.2008, golem.de
Mit Thumbtack startet Microsoft im Rahmen seiner Live Labs einen Dienst, um Links, Fotos und alles was sich sonst im Web findet, an einem Platz zusammenzuführen und in sogenannten Collections zu gruppieren. Dazu werden zuerst die Webschnipsel markiert, dann kopiert und in Thumbtack eingefügt - und schon steht dort eine Zusammenfassung des Fundstücks bereit. Microsoft setzt dabei auf lernende Algorithmen und natürliche Spracherkennung, um beispielsweise Adressen aus dem markierten Text hervorzuheben und diese auf einer Karte darzustellen.
... mehr
Technologien von morgen für Applikationen von heute
10.12.2008, Speech Technology Magazine
Innovative Sprachapplikationen erfordern neue Sprachtechnologien. Die bekannten Sprachverarbeitungstechnologien kontext-unabhängiger Grammatiken und statistische Sprachmodelle leisten gute Dienste in aktuellen Sprachapplikationen. Aber diese Technologien begrenzen unser Denken und somit auch die Bandbreite möglicher Applikationen. Zwei grundlegende Technologien werden die Möglichkeiten von Sprachapplikationen massiv ausweiten: Natürliche Spracherkennungsalgorithmen und semantische Repräsentationssprachen.
... mehr
“Brutkasten”-Gruppenbericht: Elemente einer “Emotion Markup Language 1.0”
10.12.2008, W3C
Die Emotion Markup Language Brutkasten-Gruppe publizierte ihren Abschlussbericht: Mit der zunehmenden Allgegenwärtigkeit des Internets, der zunehmenden Interaktivität und Multimodalität muss sich die Technologie immer häufiger mit menschlichen Faktoren wie Emotionen auseinandersetzen. Der Abschlussbericht beschreibt Elemente einer Emotion Markup Language und schafft so eine Balance zwischen wissenschaftlichen Grundlagen und praktischer Anwendbarkeit. Die Sprache kann als "plug-in" für drei Themenfelder eingesetzt werden: (1) für die händische Anreicherung von Daten, (2) für die automatische Erkennung von Emotionen durch Interpretation des Nutzerverhaltens und (3) für die Generierung “emotionalen” Systemverhaltens.
... mehr
Hilfe, mein Computer spricht!
03.12.2008, funkschau.de
Während einerseits das Thema Spracherkennung derzeit großes Medieninteresse erfährt, hat sich andererseits fast unbemerkt eine Technologie verbreitet, die genauso spektakulär ist: die Sprachsynthese. funkschau beleuchtet, auf welchen Prinzipien sie basiert und sagt Ihnen, ob diese Technik auch für Sie in Frage kommt. Ansagen auf Bahnhöfen und Flughäfen werden längst nicht mehr von Menschen gesprochen. Das, was durch die Lautsprecher ertönt, wird bis auf wenige Ausnahmen durch Sprachsynthese erzeugt. Die Technik hat sich so weit entwickelt, dass nicht mehr blecherne und abgehackte Stimmen die Hörorgane schädigen, sondern dass diese künstlichen Stimmen kaum bis gar nicht mehr von menschlichen Stimmen zu unterscheiden sind. Das hat wiederum zur Folge, dass Sprachsynthese mittlerweile auch in Callcentern von Banken, Hotlines, Telekommunikationsunternehmen und Fluglinien eingesetzt wird.
... mehr
Tomorrow's Technologies, Today's Applications
03.12.2008, Speech Technology Magazine
Innovative speech applications require new speech technologies. Our current speech recognition technologies of context-free grammars and statistical-language models have served us well for today’s voice recognition applications. But these technologies limit our thinking and the kinds of speech applications that are possible. Two basic technologies will greatly extend the capabilities of speech applications: natural language understanding algorithms, and semantic representation languages.
... mehr
Incubator Group Report: Elements of an EmotionML 1.0
03.12.2008, W3C
The Emotion Markup Language Incubator Group published their final report. As the web is becoming ubiquitous, interactive, and multimodal, technology needs to deal increasingly with human factors, including emotions. The report provides elements for an Emotion Markup Language striking a balance between scientific well-foundedness and practical applicability. The language is conceived as a "plug-in" language suitable for use in three different areas: (1) manual annotation of data; (2) automatic recognition of emotion-related states from user behaviour; and (3) generation of emotion-related system behaviour.
... mehr
Google mobile arbeitet mit Näherungssensor
26.11.2008, Maclife.de
Obwohl Google ein eigenes Mobilfunk OS im Ärmel hat, beteiligte sich der Suchmaschinenriese ebenfalls eifrig an der Entwicklung von iPhone-Anwendungen und überraschte die Öffentlichkeit kürzlich mit einer sprachgesteuerten Version von Google Mobile. Was die Nutzer erfreut, ärgert jedoch die Konkurrenz: Denn Google greift mit der App auf den Näherungssensor des iPhones zurück um die Sprachsuche zu starten - ein Hilfsmittel, das anderen Entwicklern bisher verwehrt blieb.
... mehr
RFID trifft Sprache
26.11.2008, tecCHANNEL
Pick-by-Voice-Lösungen in der Kommissioniertechnik sind längst nichts Neues mehr. Die von Vocollect jetzt auf den Markt gebrachte Kombination aus Sprach- und Radio-Frequency-Identification- (RFID-) Technik direkt am Körper des Kommissionierers hat das Potenzial, den Kommissioniervorgang im Lager noch einmal deutlich schneller und sicherer zu gestalten. Verwenden die Kommissionierer diese RFID-Leseeinheit, entfallen die für sie störenden Arbeitsschritte zur Identifikation von Produkten, Behältern, Paletten oder Orten. Die Logistik-Mitarbeiter können so noch schneller und fehlerfreier Artikel zusammenstellen. Darüber hinaus ergeben sich neue Möglichkeiten für das Lagerverwaltungssystem bezüglich der Transparenz von Daten und Produktbewegungen.
... mehr
"Mamtam" durchsucht gesprochenen Text in Handy-Videos
26.11.2008, diePresse.com
Mit einem getippten Suchbegriff kann dank einer österreichischen Software der gesprochene Text von Videos auf einem Handy durchsucht werden. Zunächst findet "Mamtam" nur ORF-Videos. Videos am Handy haben großes Potential. YouTube ist mittlerweile auf nahezu jedem Smartphone verfügbar und TV-Inhalte können entweder per UMTS gestreamt oder per DVB-H auf das Handy geholt werden. Um das Finden des gewünschten Videos leichter zu machen, wurde auf der TU Graz ein innovatives Programm entwickelt: "Mamtam" findet auf Basis eines getippten Suchbegriffs alle Videos in denen dieser als gesprochenes Wort vorkommt. Die Software arbeitet mit Spracherkennung, die zuletzt auch von Google für die Suche auf Handys entdeckt wurde.
... mehr
Google Technology Round Table: Human Language Technology
19.11.2008, VOICE Community
Google macht sich für den Transfer von Expertenwissen in die Öffentlichkeit verdient. Dazu veranstaltet der Suchmaschinengigant in loser Regelmäßigkeit den „Google Technology RoundTable”, eine im Internet veröffentlichte Expertenrunde. Thema dieser Episode ist „Human Language Technology”. Die Experten aus dem Hause Google Franz Josef Och, Research Scientist Lead - Machine Translation, und Mike Cohen, Manager Speech Technology, diskutieren ihre Forschungsergebnisse in den Bereichen maschinelle Übersetzung und Sprachtechnologie mit Alfred Spector, VP of Research and Special Initiatives.
... mehr
Wissenschaftler lesen Muster aus dem Gehirn
19.11.2008, VOICE Community
Wissenschaftler der Universität in Maastricht haben eine Software entwickelt, die anhand der Gehirnwellen erkennt, mit wem sich ein Mensch unterhält und was er gesagt bekommt. Ihre Entdeckung könne, so die Wissenschaftler, zur Entwicklung besserer Systeme zur Erkennung von Sprache beitragen. Es ist ein alter Menschheitstraum, sich nicht nur mit seinem Gegenüber zu unterhalten, sondern auch seine Gedanken lesen zu können. Ein Team aus vier Neurowissenschaftlern der Universität in Maastricht ist diesem Traum einen Schritt näher gekommen: Sie haben ein System entwickelt, mit dessen Hilfe sie aus Gehirnwellen den Inhalt einer Unterhaltung herauslesen und erkennen können, wer der Gespächspartner ist. Dazu haben die Wissenschaftler ein bildgebendes Verfahren, die funktionelle Magnetresonanztomographie (fMRT), mit einem Dataminingsystem kombiniert. Ihre Erkenntnisse haben sie im Wissenschaftsmagazin Science beschrieben.
... mehr
iPhone: Google versteht Sprachanfragen
14.11.2008, chip.de
Google hat eine iPhone-Applikation entwickelt, die Suchanfragen per Sprachbefehl ermöglichen soll. Dabei wird die Spracheingabe digitalisiert, an die Google-Server gesendet und dort in Text umgewandelt. Das Ergebnis der Suchanfrage wird dann wieder zurück an das iPhone gesendet. Auch wenn es dabei vorkommen kann, dass Anfragen von dem System nicht verstanden werden - in den allermeisten Fällen soll die Spracherkennung einwandfrei funktionieren. Das iPhone-Tool digitalisiert allerdings nicht nur die Spracheingabe, sondern nutzt bei Bedarf auch den GPS-Empfänger des iPhones, um die Suchanfrage um Ortsangaben zu ergänzen. So ist es beispielsweise möglich, Ergebnisse für die Anfrage "Wo ist der nächste Starbucks?" zu erhalten.
... mehr
Sprachtechnologischer Exkurs: Die Evolution der Sprachentstehung
19.11.2008, faz.net
Zur Sprachentstehung äußerte sich Charles Darwin mit der gebotenen Vorsicht, wurde die Sprache doch immer wieder als hervorstechender Beleg für die evolutionsgeschichtliche Sonderstellung des Menschen angeführt. Die menschliche Sprache, schrieb Darwin, sei aus dem Singen entstanden, die Musikalität so eine der bedeutendsten menschlichen Fähigkeiten. Demgegenüber steht eine These, dass dem Sprachvermögen die Gesten voraus gingen. Aus dem Bereich der Evolutionsbiologie erhält Darwins Hypothese in den letzten Jahren Unterstützung. In einem kurzen Exkurs erläutert die FAZ die derzeit wahrscheinlichste Evolutionstheorie.
... mehr
SVOX präsentiert polyglotte TTS
19.11.2008, Speech Technology Magazine
SVOX präsentierte eine neue Funktionalität für Mehrsprachigkeit in ihren Text-to-speech (TTS) Produkten. Die sogenannte “Polyglot SVOX TTS” unterstützt SVOX Corporate, SVOX Automotive Pro, SVOX Automotive, SVOX Mobile Pro uand SVOX Mobile TTS und sorgt dafür, dass zum Beispiel englische Begriffe auch von einer auf deutsch eingesetzten TTS nun korrekt “ausgesprochen” werden können.
... mehr
W3C veröffentlicht neue Empfehlung für Speech Synthesis Markup Language (SSML), Version 1.1
12.11.2008, W3C
Die Voice Browser Working Group empfiehlt die Speech Synthesis Markup Language (SSML), Version 1.1 als Standard. Die Speech Synthesis Markup Language Specification wurde entwickelt, um eine reiche, XML-basierte Markup Language zur Unterstützung von synthetischer Sprache im Web und in anderen Anwendungen. Die wichtigste Aufgabe dieser Markup Language ist, Autoren synthetisierbarer Inhalte eine standardisierte Möglichkeit zu bieten, Aspekte von Sprache wie Aussprache, Lautstärke, Pitch, etc. auf verschiedenen Synthese-Plattformen zu vereinheitlichen.
... mehr
Vierbeinige Assistenten inspirieren Roboterforscher
12.11.2008, heise-online
Speziell trainierte tierische Assistenten öffnen Türen, schalten Lichter ein und führen andere nützliche Aufgaben aus, um Menschen mit Behinderung zu helfen – und das schon seit vielen Jahren. Wissenschaftler am Georgia Institute of Technology haben sich davon nun inspirieren lassen und einen Roboter entwickelt, der die Beziehung zwischen Hilfebedürftigen und Assistenzhunden nachbilden soll. Die neueste Version von El-E wurde nun so verbessert, dass er nicht nur auf das Training mit einem Laserstift reagieren kann, wie es bei der Ausbildung von tierischen Assistenten üblich ist, sondern auch gesprochene Befehle versteht und eine größere Anzahl von Kommandos beherrscht.
... mehr
Nuance's VSuite 3 jetzt auch für die neue Katana Serie von Sanyo
29 October 2008, VOICE Community
Nuance gab bekannt, dass die neueste VSuite Software jetzt auch für die neuesten Mobiltelefone der Sanyo Katana-Reihe zur Verfügung steht. VSuite 3 liefert damit Sprachsteuerung auch für die Modelle Katana Eclipse and Katana LX. Kunden, die die Software auf ihr Katana-Phone herunterladen, erhalten gleichzeitig Nuances T9 Predictive Text-Software.
... mehr
Emotion ist der Schlüssel zu intelligentem Design: VUIs sollen natürlicher und ausdrucksstärker werden
05.11.2008, VOICE Community
In diesem Artikel beleuchtet Sheyla Militello von Loquendo die Bedeutung, die ausdrucksvolle Sprachdialogsysteme für eine positive Kundenerfahrung haben. Dabei vertritt sie die These, dass es möglich ist, eine telefonsche Serviceleistung so zu gestalten, dass sie beim Anrufer keine Wünsche offen lässt – solange die VUI entsprechend designt wird und auch natürliche Emotionen und Ausdrucksweisen verarbeiten kann.
... mehr
OPAS Mobil drei Phone von Aastra optimiert die Pflegedokumentation
04.11.2008, xdial.de
Die Software-Applikation OPAS Mobil drei Phone von Aastra sorgt für Mobilität in der Pflegedokumentation. Dank der Datenerfassung mit schnurlosen DECT-Telefonen von Aastra, wie sie bereits in vielen Alten- und Pflegeheimen eingesetzt werden, lassen sich Arbeitsabläufe effizienter gestalten und die Wirtschaftlichkeit steigern. Das Pflegepersonal erfasst mit schnurlosen Telefonen Leistungsnachweise, Vitalwerte, Ein-/Ausfuhrwerte und Informationen über Lagerung sowie optional sogar Pflegeberichte per Spracherkennung direkt und das bei intuitiver Bedienung über das Display der Telefone.
... mehr
W3C Standard vereinfacht die Umsetzung von sprachgesteuerten Web Applikationen
29.10.2008, W3C
Die W3C-Organisation publizierte einen Standard, der die Entwicklung sprachgesteuerter Webseiten vereinfachen soll. Der “Pronunciation Lexicon Specification (PLS) 1.0“ getaufte Standard ist das neueste Stück des W3C Speech Interface Framework zur Schaffung von sprachgesteuerten Web Applikationen. PLS soll die Kosten solcher Entwicklungen senken, indem es Entwicklern ermöglicht, Aussprachevokabularien zu nutzen und auszutauschen. "Es gibt zehn mal mehr Telefone in der Welt als internetfähige Rechner, daher werden Telefone in Zukunft zum Haupteingang zum Web," ist sich James A. Larson sicher, der stellvertretende Vorsitzende der Voice Browser Working Group, die den neuen Standard entwickelte.
... mehr
W3C publiziert das fünfte Arbeitspapier (Empfehlung) für multimodale Architekturen und Interfaces
29.10.2008, W3C
Die Arbeitsgruppe für “Multimodal Interaction” der W3C hat ein Update des Arbeitspapiers “Multimodal Architecture and Interfaces“ (kurz: “MMI Architecture”) vorgelegt, das eine lose zusammengefügte Architektur für multimodale User Interfaces beschreibt. Hauptänderung zum letzten Arbeitspapier ist das Hinzufügen der Regeln und Leitlinien, die Modality-Experten erlauben, die Funktionalitäten, Möglichkeiten und APIs für spezifische Komponenten in ausreichender Detailliertheit so zu beschreiben, dass die Komponenten innerhalb einer Multimodalen Architektur kompatibel sind.
... mehr
Aspect kündigt Aspect Unified IP 6.6 für Dezember an
29.10.2008, VOICE Community
Aspect kündigt die allgemeine Verfügbarkeit der integrierten Contact Center-Lösung Aspect Unified IP 6.6 für den Monat Dezember an. Die neue Produktversion verfügt über eine ganze Reihe wesentlicher neuer Leistungsmerkmale, dazu zählt eine “Ask-an-Expert”-Funktion, die die Instant Messaging und Präsenzfunktionen des Microsoft Office Communications Server 2007 nutzt. Mit dieser Funktion kann gezielt Echtzeit-Präsenzinformation über Spezialisten im ganzen Unternehmen abgefragt werden. So kann direkt im Kundendialog Hilfe geleistet und die Quote der Kundenanfragen, die beim ersten Kontakt zufriedenstellend abgeschlossen werden, erhöht werden. Aspect Unified IP 6.6 führt Inbound-, Outbound- und gemischte Kontakte (einschließlich Sprache, E-Mail, Web, Workflow und Fax) in einer einzigen, skalierbaren SIP (Session Initiation Protocol)-basierten VoIP (Voice over IP)-Softwareplattform zusammen.
... mehr
Whitepaper von VoiceObjects: Produktivität verdoppeln durch verbesserte Wartung von Sprachanwendungen
22.10.2008, VOICE Community
Die aktuellen Turbulenzen auf den Finanzmärkten sind ein guter Grund, über Kostensenkungen durch den Einsatz von Sprachdialogsystemen nachzudenken. Dr. Ingo Bors erläutert, wie sich ungenutzte Einsparpotenziale heben lassen und die Produktivität sich verdoppeln kann, wenn State-of-the-art-Sprachportale bestmöglich gewartet werden. Dieses Paper beschreibt die verschiedenen Elemente der Wartung von Sprachportalen und vergleicht die zwei Ansätze “handcodierter Java/VXML Systeme” mit dem objektbaiserten, einfach zu bedienenden System von VoiceObjects.
... mehr
MacSpeech bringt Update der Diktiersoftware für Mac OS
22.10.2008, Speech Technology Magazine
MacSpeech präsentierte sein neues Produkt MacSpeech Dictate v1.2. Zu den Verbesserungen von MacSpeech Dictate gehören laut Angaben des Anbieters u.a.:
* der Buchstabiermodus, mit dem auch Worte, die das System nicht erkennt, durch einfaches Buchstabieren eingegeben werden können,
* das Phrasen-Training, das die Erkennungsakkuratesse mit jeder Nutzung weiter verbessert,
* der “Move"-Befehl, mit dem sich der Cursor zur einfacheren Bearbeitung von Dokumenten steuern lässt.
... mehr
Victrio bringt sprachbasiertes Call Screening System auf den Markt
22.10.2008, Speech Technology Magazine
Victrio präsentierte eine neue Voice Risk Management Solution, die Betrugspotenziale bei Anrufern auf Kundenserviceleitungen im Handel oder bei Finanzdienstleistern aufdecken kann, indem sie die Stimmprofile der Anrufer mit denen von bekannten Kriminellen, die in einer Datenbank erfasst sind, vergleicht. Werden Übereinstimmungen festgestellt, kann die Authorisation einer Transaktion verhindert werden, bevor ein Schaden entsteht. Die Lösung wird als Managed Service (SaaS) angeboten und adressiert vor allem große online-Verkäufer, Banken oder Kreditkartenanbieter.
... mehr
Best Practice im Fokus: Dialog - 0800 VOLKSWAGEN
15.10.2008, VOICE Community
Die DiaLog 0800-Volkswagen-Sprachanwendung ermöglicht bei Anfragen von VW-Kunden die Vorselektion nach Modellabfrage (Polo, Phaeton etc.) und stellt dann zum entsprechenden Operator durch. Jeder zwölfte Anrufer bekommt zudem die Möglichkeit, an einer sprachgesteuerten Zufriedenheitsbefragung teilzunehmen. Zusätzlich zur Automatisierung der Vorqualifizierung wird eine thematische Fokussierung vorgenommen und die Anzahl interner Weiterleitungen minimiert. Somit wird ein optimierter Einstiegspunkt für den Call Center-Agenten geschaffen. Damit soll zugleich die Servicequalität verbessert werden.
... mehr
Babylon setzt auf ‘Language Weaver’ für Online-Translation-Lösung
15.10.2008, TMC.net
Babylon, Anbieter von Single-Click Translation und Dictionary Software will in Zukunft auf Language Weaver setzen, eine Translation On-Demand Human-Communication-Lösung. Diese soll in die Single-Click Translation und Dictionary Service Suite von Babylon integriert werden und Anwendern einen Zugriff auf automatisierte High-Speed Übersetzungstechnologie auf Basis offener Standards wie HTTP, SSL und XML bieten.
... mehr
Nuance stärkt Technologieentwicklung
09.10.2008, VOICE Community
Nuance und Nokia haben den Vertragsabschluss für ihre auf mehrere Jahre ausgelegte Zusammenarbeit bekannt gegeben. Das Abkommen der beiden Unternehmen umfasst u.a. die strategische Zusammenarbeit und die Implementierung eines Rahmensystems, um die Technologieentwicklung und Innovation in einem größeren Kreis von Entwicklern voranzutreiben. So sollen offene Protokolle entwickelt werden, mit denen Entwicklungspartner weitere umfassende multimodale Features, Anwendungen und Nutzererfahrungen auf Nokia-Geräten schaffen können. Durch eine Reihe offener Programmier-Schnittstellen, Sprachmodelle und Entwicklungstools können diese Partner Zugang zu einer dynamischen Entwicklungsumgebung haben, in der sie mobile Innovation rund um fortschrittliche, multi-modale Nutzeraktionen entwickeln können.
... mehr
VOICE Days 2008: Guided Tours zeigen die richtigen Lösungen und die passenden Anbieter
01.10.2008, Initiative VOICE BUSINESS
Die Initiative VOICE BUSINESS bietet auch in diesem Jahr geführte Touren durch den Best Practice Park, den Messe- und Ausstellungsbereich der VOICE Days. Über 250 Besucher haben auf den VOICE Days 2007 das Angebot genutzt, auf direktem Wege die Anbieter und Wettbewerber kennen zu lernen - und waren begeistert! Lernen Sie am ersten und zweiten Veranstaltungstag in Begleitung unabhängiger Marktexperten die erfolgreichsten Lösungen und Anbieter Ihrer Branche oder Ihres Anwendungsbereichs kennen. Wählen Sie die für Sie passende Guided Tour aus den drei Kategorien aus: Allgemeine Touren (Einsteiger Tour, Award Nominees und Award Gewinner), Branchentouren (Call Center Performance, Financials und Telco & Carrier) und Thementouren (Auskunft & Vermittlung, Self Service und Voice Biometrics).
... mehr
MIT entwickelt sprachgesteuerten Rollstuhl
01.10.2008, Speech Technology Magazine
Forscher des Massachusetts Institute of Technology arbeiten an einem selbststeuernden Rollstuhl, der in der Lage ist, seinen Nutzer per Sprachbefehl zu bestimmten Orten in einer Immobilie zu bringen. Spracherkennungstechnologie ermöglicht dem Nutzer, seinen Rollstuhl durch Befehle wie “Bring mich ins Bad” oder “Fahr in die Küche” zu steuern – der selbstlernende Rollstuhl nutzt dann eine Karte, die er bei einer Guided Tour seines Nutzers selbst erstellt Prototyp nutzt ein W-Lan-System mit verschiedenen W-Lan Knoten, um seine Karten zu erstellen und auf deren Basis sicher navigieren zu können.
... mehr
Jetzt drei Ausgaben der Technology Review testen!
23.09.2008, VOICE Community
Lernen Sie heute kennen, was morgen wichtig wird. Technology Review spürt monatlich die wichtigsten Trends auf, erläutert Hintergründe und schlägt als einziges Magazin Deutschlands die Brücke zwischen Wissenschaft und Wirtschaft. Als Publikation des renommierten M.I.T.-Magazins für Innovation zeigen wir Perspektiven für wirtschaftliches Wachstum und geben Ihnen Antworten auf die Fragen der Zukunft.
Testen Sie Technology Review jetzt 3 Ausgaben kostenfrei und bestellen Sie hier
Google sucht jetzt auch in Audio und präsentiert “Android”#
23.09.2008, Speech Technology Magazine
Google hat ein neues Tool zur Indizierung von Audio-Inhalten vorgelegt, dass den Nutzern erlaubt, gesprochene Worte in Videos zu finden. Zudem stellte Google am 23.09. gemeinsam mit T-Mobile das erste Handy mit seinem “Android”-Betriebssystem vor. Google Audio Indexing (GAUDI) wurde von den Google Labs entwickelt und benutzt die selbe Technik, die auch bei Googles Elections Video Search-Tool zum Einsatz kam. Mit der neuen Technologie können User gesprochene Worte in Video Clips suchen und sofort zu der betreffenden Stelle springen, an der das gesprochene, gesuchte Wort zu hören ist.
... mehr
Alternative zum Abschreiben
23.09.2008, faz.net
Kann man eine Spracherkennung am PC auch zur Verschriftlichung von Interviews einsetzen? Diese Frage wird uns immer wieder gestellt, nicht nur von Kollegen aus dem journalistischen Umfeld, sondern auch von Studenten, die in der Sozialforschung oder Psychologie lange Wortinterviews transkribieren müssen. Wer seine Aufzeichnungen von einem Dienstleister abschreiben lässt, zahlt ungefähr 150 bis 200 Euro je Stunde Gesprächszeit und wartet mehrere Tage auf die Datei. So liegt der Einsatz pfiffiger Software also nahe. Das Standardsystem Dragon Naturally Speaking für Windows erreicht zudem eine nahezu perfekte Erkennungsleistung, bei geübten Diktierern. Mit diesem Nebensatz sind die Probleme schon angesprochen. Dragon ist ein Diktiersystem. Es erwartet, dass der Sprecher ein kurzes, etwa fünf- bis zehnminütiges Training absolviert hat, bei dem die Eigenheiten seiner Aussprache erfasst und in einem Benutzerprofil gespeichert werden. Es setzt weiterhin voraus, dass man sein persönliches Vokabular einspeist und vor allem kontinuierlich korrigiert, denn Dragon lernt aus seinen Fehlern.
... mehr
Voice Days 2008: ITCV Multichannel ACD verarbeitet auch Brief-Post
23.09.2008, VOICE Community
Selbst klassische Briefe integriert die neue MultichannelACD, die ITCV auf den Voice Days 2008 am 15. und 16. Oktober 2008 in Wiesbaden zeigt. Die Multichannel ACD ist eine virtuelle Contact Center Lösung, die zentral gehostet eine beliebige Anzahl von Agenten mit unterschiedlichsten Skills integrieren kann. Die neue Multichannel ACD verteilt Skill-basiert Anrufe, Faxe und E-Mails an eine beliebige Anzahl eingebuchter Agenten. Auch SMS und klassische Briefpost lassen sich integrieren, letztere benötigen zusätzlich eine zentrale Erfassungsstelle im Unternehmen. Zusätzlich zu Inbound-Calls unterstützt die Contact Center Lösung auch Outbound-Telefonie und bietet hierfür als Hilfe eine Tastatur auf dem Bildschirm. Ein Dialer gehört ebenfalls zu den optionalen Erweiterungen.
... mehr
Neues Whitepaper in der VOICE Community: Mehr Mensch als Maschine - Zur Natürlichkeit von Sprachdialogsystemen
17.09.2008, VOICE Community
Wenn es um das Design von Sprachdialogsystemen geht, wird häufig gefordert, diese möglichst „natürlich“ und „menschlich“ zu gestalten. Denn - so wird angenommen - nur ein besonders menschliches System sei auch ein gutes System. Aber ist das wirklich der Fall? Oder kann Menschlichkeit auch zum Nachteil werden? Und was bedeutet „Menschlichkeit“ überhaupt? Die Autoren Manja Baudis und Zeno Wolze erläutern Faktoren, die die einzelnen Äußerungen beteiligter Gesprächspartner in einem Dialog beeinflussen und verdeutlichen diese anschaulich durch das Vier-Seiten-Modell von Friedemann Schulz von Thun, das auf das Organon-Modell von Karl Bühler zurückgeht. Die vier Faktoren heißen hier Sache, Symptom, Beziehung und Appell.
... mehr
Customer Care Webcast Serie von Nuance
10.09.2008, VOICE Community
Die “Take Five” Webcastserie von Nuance und Speech Technology Magazine beleuchtet 5 wichtige Themen für CC-Manager, 3 Webcasts sind bereits verfügbar. 1. Sei ein schlauer Zuhörer – Verbesserung der IVR-Erkennungsraten, um mehr aus bestehenden Applikationen zu holen. 2. Besser als Passwörter: Voice Biometrie - eine zuverlässige und einfach anzuwendende Methode zur Anruferverifizierung. 3. Kenne deinen Anrufer: Anrufer-Authentifizierung – die Balance zwischen Sicherheit und Komfort.
... mehr
Apple beantragt Patent auf multiple Eingabe
10.09.2008, Heise.de
Der IT-Konzern Apple will sich vom US-amerikanischen Patentamt eine Technik schützen lassen, bei der verschiedene Eingabemöglichkeiten miteinander kombiniert werden können. In dem Antrag auf ein Patent für eine "Multitouch Data Fusion" schreibt Apple, neben der Eingabe mit mehreren Fingern könnten hier auch Sprachsteuerung und biometrische Daten wie Handgröße, Fingerabdrücke, Körpertemparatur, Pupillengröße, Hautwiderstand sowie Gesichtsausdruck berücksichtigt werden. Der Antrag wurde kurz vor Weihnachten 2007 eingereicht und am 4. September 2008 veröffentlicht.
... mehr
Turning Technologies präsentiert Web-basiertes Umfrage-System
10.09.2008, TMCnet
Turning Technologies hat “ResponseWare Web”, ein Umfragetool, veröffentlicht, das Nutzern erlaubt, PowerPoint Folien interaktiv zu Diskutieren - per iPhone und BlackBerry, anderen Mobilen Endgeräten, Laptops und Computer. Das über Telekom-Provider vertriebene Produkt setzt unter anderem auf Sprachtechnologie zur Führung des Dialogs.
... mehr
Moviefone refinanziert Bestellhotline jetzt mit Werbung
10.09.2008, Speech Technology Magazine
Ab Herbst wird Moviefone, die telefonische Filmbestellung von AOL, auf Basis von Apptera Technologie das Call-Aufkommen von 40 Millionen Anrufen im Jahr auf der Hotline 777-FILM für Werbung nutzen und gleichzeitig ein verbessertes Voice User Interface präsentieren.
... mehr
Call Recording jetzt auch für KMU
10.09.2008, Speech Technology Magazine
CallCopy, Anbieter von Call Recording und Quality Monitoring-Lösungen, bietet mit dem neuen Produkt “Essential” eine Software (alternative: eine Software), die speziell kleinere Kundenserviceorganisationen adressiert. CallCopy Essential ist eine Voice over Internet Protocol (VoIP) Call Recording-Lösung, die laut Anbieter KME die selben Mittel für die Verbesserung ihres Kundenservices bietet, wie ihren großen Wettbewerberber.
... mehr
IBM auf der IFA 2008 in Berlin: CE-Produkte mit Sprachsteuerung
03.09.2008, Presseportal
Auf der IFA präsentiert IBM unter anderem einen leistungsstarken Hybridserver für anspruchsvolle Simulationen und virtuelle Welten, eine neue Generation von Lösungen für virtuelle Meetings, Spracheingabe-Tools für Consumer Electronics (CE) Produkte und Echtzeit-Übersetzungslösungen. Gezeigt werden die neuesten Technologien für Spracherkennung und Dialogmanagement für natürlich gesprochene Sprache. Gezeigt wird unter anderem eine Sprachlösung zur Steuerung eines Fernsehgeräts. Der IBM Speech to Speech Translator ist eine Übersetzungslösung, die sich ähnlich wie ein menschlicher Simultan-Dolmetscher verhält. Auf der IFA zeigt IBM ihre Lösung für die Sprachen Englisch und Mandarin - integriert in die virtuelle Online-Welt von Second Life. Zu finden ist IBM im Technisch-Wissenschaftlichen Forum in Halle 5.3 am Stand TWF 06.
... mehr
Sensory unterstützt erstes sprachgesteuertes Bluetooth Headset
03.09.2008, TMC.net
Das BlueGenie Voice Interface von Sensory bietet sowohl Spracherkennung als auch –synthese und soll demnächst im BlueAnt V1 Bluetooth Headset zum Einsatz kommen. Dadurch brauchen Headset-Nutzer bald nicht mehr auf Knöpfe oder Signale achten. Stattdessen können mittels einfacher Phrasen Anrufe initiiert, angenommen oder abgewiesen werden, Call Backs und Wahlwiederholungen angewiesen werden oder auch der Status des Systems erfragt werden. Dadurch soll laut Unternehmensangaben erstmals eine vollständig sprachbasierte Steuerung eines solchen Gerätes möglich sein.
... mehr
Sprachtechnologie im Amt
03.09.2008, Callcentre.co.uk
Die Angestellten des Bürgeramtes im englischen Warwickshire mussten vor Kurzem ihre Namen in ein Spracherkennungssystem einsprechen. Ziel ist es, eingehende Anfragen automatisiert und direkt zum erbetenen Gesprächspartner durchzustellen. Das von Macfarlane entwickelte System wird Anrufer von nun an nach dem Namen des gewünschten Gesprächspartners fragen. Anschließend erfolgt ein Abgleich mit den vorhandenen Namen in der Datenbank und die Weiterleitung an passende Durchwahl. Die Gemeinde in Warwick erwartet vom Einsatz der Technologie, die bereits seit Januar dieses Jahres getestet wird, Entlastung um rund 30% der Anrufe, die derzeit in den Vermittlungsstellen auflaufen.
... mehr
Genesys Voice Platform 8 erhältlich
27.08.2008, VOICE Community
Genesys hat auf der SpeechTEK seine Genesys Voice Platform (GVP) 8 vorgestellt. Die neue Version nehme nach Unternehmensangaben eine strategische Position ein, da sie als „integrierte Plattform“ dem „Stand-Alone-Charakter“ sprachbasierter Self Services ein Ende setzen soll. In die Plattform sind das Session Initiation Protocol (SIP) und die intelligent Customer Front Door (iCFD) Lösungen des Unternehmens integriert. Den iCFD Lösungen komme dabei die Rolle zu, sprachbasierte Kontaktversuche in die geschäftsweiten Logiken, Regeln und Applikationen zu integrieren. Des Weiteren werden sprachbasierte Kontaktkanäle gestärkt durch die Implementierung zentraler Technologien wie SIP, Web-Integration und Voice Security Software.
... mehr
Secure Communication Systems entwickelt Systemhardware für Speech-to-Speech-Übersetzungen
27.08.2008, Speech Technology Magazine
Secure Communication Systems, Entwickler von “rugged” Handhelds und portablen Computersystemen, hat sich einen Auftrag über Forschungs- und Entwicklungsdienstleistungen für BBN Technologies gesichert. Im Detail geht es dabei um die Leistungsverbesseurng der Spoken Language Communication and Translation System for Tactical Use (TRANSTAC) und die Anwendbarkeit dergleichen auf „ruggedized“ portablen und mobilen Geräten. Der Auftrag ist Teil einer breiteren Initiative der Defense Advanced Research Projects Agencys (DARPA) TRANSTAC Speech-to-Speech (S2S) Translation Programm, die auf die Entwicklung bidirektionaler, formloser und Sprecher unabhängiger S2S-Übersetzungssystemen zielt.
... mehr
BigHand unterstützt iPhone
27.08.2008, Speech Technology Magazine
BigHand, Entwickler von digitalen Diktations-Workflow-Systemen für juristische Anwendungen, hat die Unterstützung der beiden Sound-Formate AIFF und CIF von Apples iPhone angekündigt. Dadurch sollen professionelle Anwender Audio Files auf ihren iPhones aufnehmen können und per Email an ihr BigHand Digital Dictation Workflow System versenden können, wo sie archiviert, verwaltet und bearbeitet werden können.
... mehr
Nuance Notification Hub für proactive Kundenansprache
20.08.2008, VOICE Community
Nuance hat seinen Nuance Notification Hub vorgestellt, eine Plattform für proaktive Mitteilungssoftware, die weltweit verfügbar ist. Mit der Hilfe des Notification Hub können zeit-, ereignis-, und datenbankabhängige Mitteilungen an Kunden kommuniziert werden. Falls notwendig lassen sich die Mitteilungen auch an Mitarbeiter zur Weiterbearbeitung übermitteln oder per SMS, Email oder Voice direkt an die Kunden. So kann z.B. ein Betrugsversuch beim Auslösen eines Alarms im System dazu führen, dass eine Kunde umgehend angerufen wird, um die entsprechende Transaktion zu bestätigen. Tut er dies, würde der Anruf komplett automatisch abgewickelt. Tut er es nicht, könnte der Angerufene direkt zu einem Spezialisten für Identitätsdiebstahl verbunden werden. Die Lösung soll als On-Premise- oder auch als On-Demand-Version zur Verfügung stehen.
... mehr
Automatisierte Sprachdialogsysteme für SAP Utilities
20.08.2008, VOICE Community
Die Anbindung von automatisierten Sprachdialogsystemen an SAP for Utilities hat das IT-Beratungsunternehmen DSC gemeinsam mit Sikom Software realisiert. Sie ermöglichen damit Energieversorgungsunternehmen, ihren Kunden zahlreiche Services rund um die Uhr anzubieten. Das automatisierte Sprachdialogsystem unterstützt die Energieversorger bei der telefonischen Kundenbetreuung, indem sich häufig wiederkehrende Prozesse nun automatisiert abwickeln lassen. Seit Sommer dieses Jahres sind verschiedene Prozessmodule für die Anbindung an SAP for Utilities verfügbar. Bei einem Pilotkunden wird das Sprachdialogsystem bereits implementiert und soll innerhalb von vier Wochen live geschaltet werden.
... mehr
W3C: Pronunciation Lexicon Specification (PLS) 1.0 zur ‘Proposed Recommendation’ aufgewertet
20.08.2008, VOICE Community
Die Voice Browser Working Group des w3C hat die ‘Pronunciation Lexicon Specification’ (PLS) Version 1.0 als ‚Proposed Recommendation’ veröffentlicht. Zuvor handelte es sich zunächst noch um eine ‚Candidate Recommendation’. Mit der Aufwertung einher geht der Aufruf zur Kommentierung des aktuellen Status. Änderungen zum vorherigen Status finden sich im Anhang D, Kommentare können bis zum 18. September eingereicht werden. Zur Erklärung: Die Spezifikation definiert die Syntax zur Spezifizierung von Aussprache-Lexika für Speech Recognition- und Speech Synthesis-Engines in Voice Browser-Anwendungen.
... mehr
Loquendo Embedded TTS und ASR für iPhone 3G verfügbar
20.08.2008, VOICE Community
Loquendo hat bekannt geben, dass seit letztem Monat Loquendo Embedded TTS und ASR für Entwickler von Multimedia-Applikationen auf Apples 3G iPhone verfügbar seien. Diese ergänzten ideal die bereits vorhandenen Möglichkeiten des iPhone, um multimodale Multitasking-Aufgaben damit zu bewältigen. So könnte die gleichzeitige Bedienung mit grafischen und Sprachbefehlen deutlich mehr Komfort und Effizienz bieten, wenn etwa Nachrichten und Email laut vorgelesen würden oder Musikstücke per Spracheingabe gesucht werden könnten. Gleichzeitig ist gerade das Verwalten und Editieren von Nachrichten, Dateien etc. grafisch sehr viel effizienter als per Sprache.
... mehr
Dragon NaturallySpeaking 10 von Nuance
13.08.2008, VOICE Community
Nuance stellt mit Dragon NaturallySpeaking 10 die neue Version der Spracherkennungs-Software vor. Dragon wandelt natürliche Sprache in Text um und das mit einer Geschwindigkeit von bis zu 160 Wörtern pro Minute. Dragon NaturallySpeaking erreicht eine Erkennungsgenauigkeit von bis zu 99 Prozent und funktioniert auch ohne vorheriges Sprachtraining. Die Software ermöglicht Anwendern Dokumente dreimal schneller als durch Tippen zu erstellen und ihr sollen dabei keine Rechtschreibfehler unterlaufen. Anwender können per Sprache Dokumente sowie E-Mail-Nachrichten erstellen, aber auch im Internet surfen und Suchaufträge starten sowie den PC steuern. Neuheiten sind eine verbesserte Erkennungsleistung, optimierte Sprachbefehle, schnelle Textformatierung durch Sprachbefehle, Texteingabe so schnell Sie sprechen und drahtloses Arbeiten mit dem PC.
... mehr
Voice Extensible Markup Language (VoiceXML) 3.0 Requirements
13.08.2008, W3C
Die Voice Browser Working Group hat den ersten öffentlichen Working Draft für die Voice Extensible Markup Language (VoiceXML) 3.0 Requirements veröffentlicht. VoiceXML 2.0 ist dafür entwickelt worden, Audiodialoge zu gestalten, die Synthetische Sprachausgabe, digitalisierte Audios, Spracherkennung oder DTMF-Input, Aufnahmen von gesprochener Sprache, Telefonie und Mixed-Initiative-Konveresationen nutzen. VoiceXML 3.0 ist der offizielle Nachfolger von VoiceXML 2.0. Die Zielsetzung der neuen Version ist es, neue, leistungsstarke Dialogfunktionalitäten für fortschrittliche Sprachanwendungen zu ermöglichen und die einfache, problemlose Integration in andere W3C-Sprachen.
... mehr
ASC präsentiert neue Version ihrer Quality Monitoring Software
13.08.2008, VOICE Community
Die ASC telecom AG präsentiert die neue Version 8.1 der Quality Monitoring Software INSPIRATIONpro auf der diesjährigen Call Centre Expo im britischen Birmingham (16. bis 17. September im National Exhibition Centre in Birmingham). Die erweiterten Sprachanalyse-Fähigkeiten von INSPIRATIONpro 8.1 empfehlen sich insbesondere für Unternehmen mit hohem Gesprächs-Aufkommen. Dank intelligenter Audioerkennung können sie dann beispielsweise Keyword Spotting nutzen oder gesprochene Sprache automatisch in geschriebenen Text konvertieren. Gespräche lassen sich nach unterschiedlichen Kriterien kategorisieren und bieten so die Basis für ausgefeilte Business Intelligence Anwendungen.
... mehr
Jajah Babel: Live-Übersetzung am Telefon
13.08.2008, Berliner Morgenpost
Wer zu den Olympischen Spielen in Peking auf der Straße steht und nur noch Chinesisch versteht, kann sich jetzt mit einem Anruf weiterhelfen. Ein neuer Dienst des Internettelefonieanbieters Jajah bietet Live-Übersetzungen am Telefon, wie das Unternehmen mitteilte. Die Pilotphase des neuen Systems sollte mit Beginn der Spiele in Peking am Freitag auf Englisch und Chinesisch starten. Interessierte wählen eine lokale Rufnummer in China, sprechen dort auf Englisch mit einem Sprachcomputer und dieser übersetzt dann auf Tastendruck das Gesagte ins Chinesische – und umgekehrt. In den kommenden Monaten soll das Angebot auch andere Sprachen verstehen. Deutsch habe dabei hohe Priorität, erklärte ein Unternehmenssprecher. Längerfristig sollen das Angebot dann etwa auch Geschäftsleute in Telefonkonferenzen nutzen können.
... mehr
Visual Voice Mail von Verizon Wireless
13.08.2008, VOICE Community
Verizon hat unlängst Visual Voice Mail vorgestellt, eine neue Applikation, mit deren Hilfe Anwender Voice Mails auf ihrem Mobilgerät verwalten können. Die Applikation ist zunächst auf dem Voyager von LG erhältlich und kommt mit einem Touch Display daher, über das die visuell dargestellten Voice Mails mittels eines Knopfdrucks ansteuerbar sind. Visual Voice Mail bietet die Darstellung aller Sprachnachrichten in einer übersichtlichen Liste mit zentralen Informationen wie Datum und Uhrzeit des Anrufs sowie der Länge der Nachricht, um diese direkt von Handy aus sinnvoll priorisieren und verwalten zu können. Beim Eintreffen einer neuen Nachricht signalisiert ein Popup-Fenster dem Benutzer den Erhalt. Weitere Funktionalitäten sind Call-Backs, Antworten, Weiterleiten, Hinzufügen zu Kontakten und Archivieren der Nachrichten.
... mehr
Der Nutzen von CCXML
06.08.2008, TMCnet
CCXML, oder auch Call Control eXtensible Markup Language, ist die Standard-Auszeichnungssprache des W3C zur Steuerung, wie Telefonanrufe zugewiesen, beantwortet, übermittelt, zusammengelegt und vieles mehr werden. CCXML wird oft in Zusammenhang mit VoiceXML erwähnt. VoiceXML adressiert hierbei das Voice Interface und das User Interface, während CCXML sich auf Steuerungsfunktionalitäten bezieht. Die beiden Standards ergänzen einander, um variable Teile von Telefonieapplikationen anzusprechen. Lesen Sie in diesem Artikel von TMCnet die Ergebnisse eines Interviews von Greg Galitzine,
Group Editorial Director bei TMCnet, mit R.J. Auburn, dem Vorsitzenden der W3C CCXML Working Group, über die Rolle von CCXML und die Vorteile, die die Auszeichnungssprache für Entwickler bietet.
... mehr
Personalisierte Marketingnachrichten von der Stange
06.08.2008, Speech Technology Magazine
Callbright, ein Call Management Dienstleister, hat eine gute Nachricht für Markteers: Ein Upgrade des Broadcast Message Manager macht es möglich, personalisierte Kampagnen „von der Stange“ anzubieten. Anstatt eigene Voice Recordings zu erstellen, müssen an die Unternehmensdatenbank angeschlossene Kunden nur noch den gewünschten Text eingeben, die Lösung erzeugt daraus eine individuelle Sprachausgabe. Möglich macht das eine Kombination aus Speech-to-Text-Technologie mit der Unternehmensdatenbank, die Informationen daraus dynamisch verarbeiten kann. Die Ansprache „Vielen Dank für den Besuch unsers Shops.“ Könnte dadurch personalisiert werden zu „Hallo John, schön dass Du wieder unseren Shop besuchst.“
... mehr
Loquendo mit gleich zwei Update-Versionen: MRCP Server & TTS Director
06.08.2008, VOICE Community
Loquendo hat mit kurzem Abstand gleich zwei Updates veröffentlicht. Loquendo TTS 7.5 ist die neue Version der TTS-Lösung, unterstützt nun auch das aktuelle Release von Red Hat Enterprise Linux (RHEL) und bietet den überarbeiteten TTS Director, Loquendos Prompt-Authoring Suite. Ebenfalls neu ist die aktuelle Version des Loquendo MRCP Server. Diese bietet nun u.a. ein automatisches Konfigurations-Tool für eine bessere Kompatibilität mit gängigen Sprachplattformen und neuartigen Open Source MRCP Clients. Zur umfassenden Präsentation der beiden Neuheiten bietet das Unternehmen nun zwei Fachartikel als PDF, die gezielt die neuen Funktionalitäten erläutern.
…mehr über den MRCP Server
…mehr über den TTS Director
Neue Publikation: Voice Security
06.08.2008, openPR.de
Sprache ist neben der heute gängigen Kommunikation via E-Mail die in Geschäftsprozessen am meisten verwendete Technologie für die Kommunikation. Da die Kommunikation oftmals sensible oder firmenkritische Themen beinhaltet, ist ein angemessener Schutz der kommunizierten Inhalte von großer Bedeutung. Ein soeben erschienenes Buch will unter dem Titel „Voice Security“ hier Schützenhilfe geben. Nach einer Einführung in aktuelle Sprachtechnologien wird die Sicherheit dieser Technologien beschrieben und analysiert. Der Fokus liegt dabei auf Voice over IP (VoIP) unter Einbeziehung von Festnetz- und Mobilkommunikation mittels GSM, UMTS und WiMAX. Die erreichten Sicherheitseigenschaften und mögliche Einschränkungen dieser Ansätze bilden die Basis für das Verständnis der entsprechenden Risiken in der Unternehmenskommunikation.
... mehr
HypoVereinsbank stärkt Übersetzungsqualität durch Sprachtechnologie
06.08.2008, firmenpresse.de
Als Mitglied der UniCredit Group ist für die HypoVereinsbank Mehrsprachigkeit essenziell für die gesamte Unternehmenskommunikation. Eine Vielzahl der Dokumente wird standardmäßig auf Deutsch, Englisch und Italienisch vorgehalten. Die mehr als 3.000 jährlich anfallenden Übersetzungsaufträge werden in Abhängigkeit von Textart, Endtermin und Zielsprache entweder an interne Übersetzer oder an ausgewählte externe Sprachdienstleister vergeben. Unabhängig von interner oder externer Bearbeitung sind alle beteiligten Akteure nun direkt mit dem Language Server der HypoVereinsbank verbunden und greifen auf die dort zentral hinterlegten Sprachressourcen zu. Diese Arbeitsweise maximiert zum einen die Konsistenz der Übersetzungen, stellt damit ein einheitliches Corporate Wording im Unternehmen sicher, und minimiert zum anderen aufgrund der Wiederverwendbarkeit bereits übersetzter Textsegmente die Übersetzungskosten.
... mehr
Nuance präsentiert neuartige Customer Care Applikation
30.07.2008, WirelessWeek
Nuance hat ‘Nuance Mobile Care’ vorgestellt, eine mobile Telefonieapplikation, die laut Unternehmensangaben eine „revolutionäre Kundendiensterfahrung“ ermögliche. Zudem sei bereits der erste Vertrag mit einem großen Carrier unterzeichnet, wenngleich dieser bislang ungenannt blieb. Mithilfe der Lösung können Anwender die Kundendienst-Hotline ihres Mobilfunkanbieters wählen und direkt vom Bildschirm ihres Mobilgerätes Konten abfragen, Rechnungen begleichen oder andere Funktionalitäten nutzen. Der Anruf der Nummer aktiviert dabei eine Datenanwendung auf dem Mobilgerät, anstatt eine Verbindung zum nächsten Live-Agenten aufzubauen. Eine Verbindung zum Live-Agenten kann jedoch jederzeit initiiert werden. Für die Zukunft plant Nuance außerdem, Sprachfunktionen zu implementieren, um die Wahl weiterer Interaktionsmodi zu ermöglichen.
... mehr
Pensieve - Gedächtnisassistent von IBM
30.07.2008, Golem.de
Mit einer mobilen Software will IBM Menschen helfen, ihre persönliche Informationsflut zu bändigen. Dazu speichert "Pensieve" Bild-, Ton- und Textdaten auf mobilen Endgeräten und wertet diese aus. Die Software entstand an IBMs israelischem Forschungslabor in Haifa und nutzt assoziative Erinnungstechniken, um Verbindungen zwischen verwandten Informationen herzustellen. So sei es möglich, die auf ein Ereignis bezogenen Daten miteinander zu verknüpfen, woraus letztendlich ein persönlicher "Gedächtnisassistent" entstehen soll. Fotos einer Person, ihrer Visitenkarte sowie eine Sprachnotiz mit dem Handy sollen erfasst, dank integriertem GPS-Empfänger mit einer Ortsangabe verknüpft und mit einem Zeitstempel versehen werden können. Am PC werden die Informationen dann mittels Zeichen- und Spracherkennung ausgewertet - und mit dem eigenen Adressbuch und Kalender abgeglichen. Die Software kann die Daten so miteinander verknüpfen, dass sie auf unterschiedliche Weise abrufbar sind, nach Zeit, Ort oder Person.
... mehr
Angriff der Spitter
30.07.2008, tecCHANNEL
SPIT droht zu einer ähnlich schadensträchtigen Belästigung zu werden wie Spam. Möglich wird diese Art von Werbung durch VoIP. „Dadurch sinken die Kosten für einen Anrufer enorm, und das können auch unseriöse Geschäftemacher oder Saboteure nutzen, um mit Hilfe von Computern massenhaft automatisierte Anrufe zu tätigen“, sagt Nicolai Kuntze vom Fraunhofer-Institut für Sichere Informationstechnologie. Kuntze und seine Kollegen haben eine Simulationssoftware entwickelt, mit der sich die Verwundbarkeit von VoIP-Anlagen testen lässt. Erste Versuche zeigen: Alle Typen von VoIP-Anlagen sind betroffen, und es gibt noch keinen wirksamen Schutz. Weitere Details enthält die Studie „SPAM over Internet Telephony and how to deal with it“ von Dr. Andreas U. Schmidt, Nicolai Kuntze (beide Fraunhofer SIT) und Rachid El Khayari von der TU Darmstadt. Sie ist unter www.sit.fraunhofer.de zugänglich. Den Quellcode des SXSM-Werkzeugs kann man unter code.google.com/p/sxsm herunterladen.
... mehr
OKI bietet TTS mit einer einzigartigen Stimme
30.07.2008, Speech Technology Magazine
Das japanische Telekommunikationsunternehmen OKI Electric Industry hat kürzlich Polluxstar präsentiert, eine Text-to-Speech-Software, mit deren Hilfe Nutzer ihre eigene Stimme synthetisch reproduzieren können. Anschließend kann die Softare auf einem Computer genutzt werden, um mit der eigenen Stimme beliebig zu kommunizieren - mit all ihren Tonarten und dem individuellen Tonfall. Dazu braucht OKI vorgeschriebene Stimmdateien von den Nutzern, die wahlweise auf der Homepage hochgeladen oder in einem der offiziellen OKI Tonstudios aufgenommen werden kann. Danach werden die Stimmdateien in die unternehmenseigene Datenbank eingegeben, die zum erworbenen Software-Paket gehört, und kann beliebig zur Erzeugung einer realistisch klingenden, synthetischen Stimme abgerufen werden.
... mehr
Der Weg zu einem erfolgreichen Multichannel-Kundenerlebnis
30.07.2008, Speech Technology Magazine
Beinahe 60% aller Kundenkontakte werden über mehr als einen Kanal und zu verschiedenen Zeitpunkten abgewickelt. Das gesamte Kundenkontakterlebnis ergibt sich daher aus der Summe der einzelnen Interaktionen. Doch in vielen Unternehmen werden die Kontaktkanäle gänzlich isoliert betrachtet und gesteuert: Präsenzfilialen, Websites, IVRs und Contact Center. Eine Kundenkontaktstrategie personalisiert, menschlich und dazu sowohl kontext- wie auch kundenorientiert zu gestalten, kann daher nur erfolgreich sein, wenn alle diese Kanäle als ausschlaggebende Faktoren berücksichtigt werden. Nur so können die größten Stolpersteine vermieden werden, die verantwortlich sind für unzufriedenen Kunden.
... mehr
Neue Standard-Schnittstelle für computerbasiertes Qualitätsmanagement von Sprachapplikationen
23.07.2008, Call Center Profi
Eine gut designte und ausfallsichere Sprachapplikation ist wichtig, aber nur die halbe Miete, wenn es um den dauerhaften Erfolg einer solchen Technologie geht. Mindestens genau so wichtig ist ein nachvollziehbares, permanentes und vor allem messbares Qualitätsniveau nach der Einführung der Lösung. Ein kontinuierliches Qualitätsmanagement tut Not. Wie Sikom vermeldete, wurde diese Brücke nun zusammen mit dem Partner solvtec und dem Fraunhofer Institut für Produktionstechnik und Automatisierung (IPA) geschlossen und im Rahmen des vom Wirtschaftsministerium Baden-Württemberg geförderten Verbundprojektes „Voice-CAQ-API,“ kurz VCA, eine Standardschnittstelle entwickelt. Sie setzt auf bewährte Web-Technologien wie den SOAP-Standard (Simple Object Access Protocol) und Voice-XML und verbindet damit auf universelle Weise beide Welten.
... mehr
Voice Portal der Dresdner Bank verbessert den Kundenservice
23.07.2008, EU-Marketingportal
Entlastung der Mitarbeiter von Standardvorgängen, mehr Zeit für beratungsintensive Aufgaben und jederzeitige Erreichbarkeit: Das sind die relevanten Faktoren, die Banken zum Einsatz von Sprachdialogsystemen bewegen. Die gezielte Vorqualifizierung von Kundenwünschen, die Möglichkeiten der personalisierten Dialogführung und die Automatisierung von Prozessabläufen im Callcenter entwickeln sich darüber hinaus zu einem entscheidenden Erfolgsfaktor im Kundenservice. So hat die Dresdner Bank das größte deutsche Filialportal in Betrieb genommen, eine modulare, natürlich-sprachliche Voice Portal Lösung zur Vorqualifizierung der Servicewünsche und zur Automatisierung der täglichen Routineaufgaben. Das Sprachdialogsystem habe binnen kürzester Zeit eine hohe Akzeptanz bei den Kunden erzielt.
... mehr
Cloud Computing für Sprachanwendungen?
23.07.2008, TMCnet
Ein neues Schlagwort bewegt die Szene: Cloud Computing. Dabei handelt es sich um die Fähigkeit, eigene Anwendungen in einem Netzwerk auf der Computerplattform eines Anbieters zu betreiben. Das bietet Vorteile für den Betrieb von IVR-Systemen (Interactive Voice Response), wirft aber auch neue Fragen zur Sicherheit und bei der Auswahl eines Anbieters auf, der die eigene Anwendung in die „Cloud“ verbinden soll. Eine entscheidende Rolle spielen dabei offene Standards, will man sich nicht an einen Anbieter binden. Und wie jedes IT-Projekt erfordert auch das Cloud Computing explizite Planungsschritte, um erfolgreich zu sein.
... mehr
Ein besseres Kundenerlebnis dank Personalisierung
23.07.2008, Speech Technology Magazine
Die technische Verbesserung des Kundenerlebnisses gehört zu den zentralen Aufgaben von Contact Centern. Doch wurde es bisher vor allem in der Perfektionierung von Grammatiken, der Spracherkennung, der Promptgestaltung und effizienten Call Flows gesucht. Doch auch der beste Call Flow impliziert, dass das Erledigen eines Kundenanliegen mehrerer Schritte bedarf. Da sich Unternehmen zudem den Vorzügen automatisierender Lösungen immer bewusster werden, droht ein solcher Vorgang zudem stets komplizierter zu werden. Ein Weg aus dieser Misere kann „Personalisierung” heißen. Das bedeutet jedoch nicht einfach, Unmengen von Daten über seine Kunden anzuhäufen. Die beiden wichtigsten Kernaufgaben dieser Strategie lauten, den Anrufer zu identifizieren und seinen Kenntnisstand bzgl. des Systems zu ermitteln. Handelt es sich um einen regelmäßigen Nutzer, sollte sich dann der gesamte Ablauf des Dialogs anpassen und auf dem kürzest möglichen Weg zu den gewünschten Informationen führen.
... mehr
blinkx gibt Videosuche frei
23.07.2008, BusinessWire
blinkx hat kürzlich die Verfügbarkeit von blinkx Red Label angekündigt, einer flexiblen Lösung mit deren Hilfe sich Kunden das Video Web zunutze machen und Profit aus dem florierenden Online-Video-Werbemarkt generieren können. Gemäß der Red Label Vertragsbedingungen will blinkx seine patentierte Videosuchtechnologie auf Kundenseite einsetzen und betreiben, um neues Einkommen durch Werbung einzubringen. blinkx Red Label zu implementieren soll unkompliziert und kostenfrei sein und Zugang zum größten und vielfältigsten Verzeichnis von Videos im Internet, ebenso wie zu blinkx' branchenführender Suchtechnologie ermöglichen.
... mehr
Nuance präsentiert SmartListener
16.07.2008, VOICE Community
Die neue SmartListener Software-Technologie von Nuance eröffnet Unternehmen die Möglichkeit, ihre Spracherkennung deutlich zu verbessern und mehr Lösungen in ihren Call Centern zu automatisieren. Gezielt sollen durch die neue Technologie sowohl die Applikationsautomatisierung als auch das Anrufererlebnis verbessert werden, indem weniger Transfers zu Agenten stattfinden, automatisierte Anrufe schneller abgewickelt werden, weniger Anrufer vor Abwicklung aussteigen und die Quote der zufrieden gestellten Anrufer deutlich erhöht wird. Dazu richtet sich die neue Technologie u.a. an den Hauptgrund für Fehler und Mängel in der Spracherkennung: Out-of-Grammar Eingaben.
... mehr
W3C: Authoring Applications für multimodale Architekturen
16.07.2008, VOICE Community
Die Multimodal Interaction Working Group des W3C hat eine Group Note zum Authoring multimodaler Architekturen veröffentlicht. Das Dokument bietet eine explizite Beschreibung multimodaler Systeme, die auf der multimodalen Architektur des W3C aufsetzen. Zudem enthält sie das Beispiel einer multimodalen Applikation, die die W3C-Auszeichnungssprachen SCXML, CCXML, VoiceXML 2.1 und HTML nutzt. Weitere behandelte Themen sind die Start-up-Phase, wie sich Komponenten gegenseitig finden und der Nachrichtentransport. Ziel des Dokumentes ist es, das Authoring multimodaler Web-Applikationen zu vereinfachen.
... mehr
Voice Analytics und Audio Mining
16.07.2008, Speech Technology Magazine
Vor nicht allzu langer Zeit gehörte das Analysieren und Filtern sprachbasierter Informationen noch in den Bereich der Handarbeit. Doch seitdem die Informationsmengen steigen und selbst Sicherheitsdienste wie CIA, Department of Homeland Security, FBI, National Security Agency, State Department, Defense Department und zahllose andere Agenturen sich mit dem automatisierten Erfassen und Auswerten solcher Daten beschäftigen, rücken Lösungen aus den Bereichen Voice Analytics und Audio Mining in den Fokus des allseitigen Interesses. Und Technologien, die sich im Staatsdienst bewähren, sind auch für private Unternehmen nicht uninteressant. Besonders Callcenter und Unternehmen, die einen hohen und engen Kundenkontakt bewältigen müssen, sehen vielfältige Einsatzmöglichkeiten.
... mehr
Ectaco stellt mehrsprachigen Kommunikator vor
16.07.2008, TMCnet
Ectaco hat eine Deluxe-Edition seines „iTRAVL NTL-9C” vorgestellt, einem mehrsprachigen, sprechenden Zweiwege-Kommunikator, der nebenbei auch Sprachkurs und elektronisches Wörterbuch ist. Das System kann Eingaben erkennen und in bis zu 30 Sprachen übersetzen, unabhängig davon ob diese eingesprochen, eingetippt oder gescannt werden. Dazu befindet sich ein optischer Scanner am Gerät, über den Nutzer einen beliebigen geschriebenen Text zur Übersetzung erfassen können. Anschließend gibt das System die korrekte Aussprache mit Hinweisen zu einzelnen Worten und Sätzen aus. Die derzeit unterstützten Sprachen beinhalten Deutsch, Englisch, Französisch, Italienisch, Polnisch, Portugiesisch, Russisch, Spanisch und Chinesisch, die dank Lernprogrammen auch die Sprachfähigkeit des Nutzers ausbauen helfen. Zudem soll der Kommunikator beim Auffinden von Sehenswürdigkeiten und Unternehmen auf Reisen helfen.
... mehr
Hilfe für Menschen mit Handicap: Internationales Forscherteam entwickelt lernfähigen Roboter an der FH FFM
16.07.2008, Informationsdienst der Wissenschaft
Ein internationales Forscherteam mit Studierenden der Fachhochschule Frankfurt am Main - University of Applied Sciences (FH FFM) und deren Partnerhochschulen hat einen lernfähigen Roboter entwickelt. Er ist autonom, intelligent und kann sehen, hören sowie greifen. Die vom Team entwickelte Technologie soll alten und behinderten Menschen im Alltag assistieren. Der Roboter kann einfache Objekte, die er mittels einer Kamera sieht, unterscheiden. Auf ein Sprachkommando bewegt er sich zu ihnen hin. Solch ein Roboter könnte also in der Praxis einen behinderten Menschen "hören" und ihm den gewünschten Gegenstand mit dem Greifarm bringen, heißt es seitens der FH FFM. Gegenwärtig wird diese Technologie auf humanoide Roboter übertragen.
... mehr
Hör zu, Computer
09.07.2008, Süddeutsche.de
Ist es bald soweit, dass Menschen wie in Stanley Kubricks Science-Fiction-Klassiker "2001 - Odyssee im Weltraum" mit ihrem Computer einfach reden können, worüber sie wollen - und das sogar im schnoddrigen Plauderton? "Nein", sagt Ernst Günter Schukat-Talamazzini. Der Informatiker forschte schon in den 1990er Jahren über Spracherkennung. Er war damals eher erstaunt, dass Computer es überhaupt schafften, aus dem Zahlenwust, die ein Rechner aus Schallwellen destilliert, tatsächlich Wörter herauszulesen. Die Rechner werden mit einem ungeordneten Strom an akustischen Signalen konfrontiert, den sie erst einmal in einzelne Wörter zerhacken müssen, und das auch noch unter widrigen Umständen. Doch Spracherkennung ist in den vergangenen Jahren deshalb immer besser geworden, weil die Computer leistungsfähiger wurden. Je schneller sie werden, um so besser können sie auch mit schlechteren Signalen umgehen. Daher soll Spracherkennungstechnik hauptsächlich "durch die Hintertür" in den Alltag kommen, beispielsweise in Autoradios oder Navigationssystemen, die man über Sprachbefehle steuern kann.
... mehr
Deutsche Sprachbausteine kostenlos für Asterisk 1.4 und 1.6
09.07.2008, VOICE Community
Die AMOOMA GmbH bietet deutsche Sprachbausteine (Voiceprompts) für Asterisk 1.4 und 1.6 kostenlos zum Download an. Hintergrund: Standardmäßig wird Asterisk nur mit englischen, spanischen und französischen Sprachprompts ausgeliefert. Wer deutsche Prompts benötigt, konnte diese bis Anfang 2006 nur beim Asterisk-Projekt der Stadt Pforzheim herunterladen. Die Anzahl der Sprachbausteine ist dort allerdings begrenzt und auf die Asterisk Version 1.2 beschränkt. Ab Juli 2008 bietet Amooma nun neue, deutsche Sprachbausteine für Asterisk 1.4 und 1.6 in einer Beta-Version an. Wer eigene Sprachprompts benötigt, kann diese mit der unternehmenseigenen Text-to-Speech Engine selbst und online generieren.
... mehr
Der Frustableiter Sprachapplikation
09.07.2008, Handelsblatt.com
Sprachcomputer am Telefon sorgen für Ärger. Das soll jetzt besser werden. Wenn Richard Huber Science-Fiction-Filme sieht, wird er frustriert. Er hat die oberschlauen Bordcomputer auf dem Kieker - weil die alles verstehen, auf alles eine Antwort wissen, ja, sogar Witze erzählen. Filme wie 'Raumschiff Enterprise' oder '2001' haben die Erwartungen an künstliche Intelligenz extrem hochgeschraubt. Auch deshalb verlieren viele Anrufer in den Fängen minderbemittelter Sprachverarbeitungs-Software die Geduld und werden hitzig. Damit die Dialogfähigkeit von Computern zumindest einen kleinen Schritt näher an die der Filmkollegen heranrückt, dafür sorgt eine Software, die Ärger in der Stimme erkennen kann. „SymEmotion“ erkennt die Veränderungen im Laufe des Gesprächs, so die veränderte Grundfrequenz, Sprechgeschwindigkeit, Energie und damit die Lautstärke. Unter anderem wegen dieser Applikation hat T-Systems bei den VOICE Days 2007 den Innovationspreis gewonnen.
... mehr
Google Maps für Handys bekommt Spracherkennung
09.07.2008, WinFuture
Der Suchmaschinenbetreiber Google stattet seinen Stadtplandienst Google Maps mit einer Spracherkennung aus. Das soll die Nutzung des Angebotes mit Smartphones erleichtern. Nach Ansage einer Adresse erhält man den Weg unterwegs angezeigt. Der Service arbeitet bisher nur mit dem Blackberry Pearl von Research in Motion zusammen. Mit der Unterstützung weiterer Geräte kann aber in Kürze gerechnet werden. Aktuell sei man noch in der Testphase, weswegen auch Fehler bei der Spracherkennung auftreten können, so Google. Nach Angaben des Unternehmens soll die Nutzung von Google Maps zum Auffinden von Restaurants oder Unternehmen so auch möglich sein, wenn man die korrekte Schreibweise nicht kennt oder sich nicht die Zeit zum Eintippen langer Adressen nehmen möchte.
... mehr
Loquendo und H-Care bieten sprechende Avatare
09.07.2008, Speech Technology Magazine
Die Einzelhandelskette TIM Brazil und die italienische Gewinnspiel-Website Lottomatica nutzen bereits die sprechenden Human Digital Assitants von H-Care. Ziel sei es, den Service am Kunden und die Seitennavigation für Kunden zu verbessern. Die Human Digital Assitants sind virtuelle Avatare, die dank der Text-to-Speech-Technologie von Loquendo sprechen können. Lottomaticas Online-Assistent etwa hilft Besuchern, sich auf der Seite zu orientieren und gewünschte Optionen zu finden. Auf der Website www.tim.com.br können Besucher mit dem Virtual Guide die eigenen Kontostände überprüfen oder Rechnungen begleichen. In den Kiosken des Unternehmens sind zudem spezielle Applikationen mit Sensoren und Kameras ausgestattet, die neue Kunden in der unmittelbaren Nähe des Kioks erkennen. Diese werden proaktiv angesprochen und eingeladen, näher zu treten.
... mehr
Die To-Do-Liste gehorcht aufs Wort
03.07.2008, VOICE Community
Das Problem mit Aufgabenlisten und Terminkalendern war schon immer, dass man sie auch konsequent führen muss. Eine neue Generation kostenloser Online-Planungshilfen soll diese Quälerei nun vereinfachen. Die Web 2.0-Anwendungen lassen sich mit natürlicher Sprache bedienen ­ sie interpretieren das vom Nutzer getippte (oder gar gesprochene) Wort, um die persönlichen Organisationshilfen mit korrekten Daten zu füllen. Die vielleicht einfachste Lösung unter den neuartigen Internet-Organizern ist Presdo, das seit Ende April verfügbar ist und Nutzern helfen will, geschäftliche Meetings und andere Treffen zu planen. Durch die Nutzung natürlicher Sprache müsse der Nutzer sich nicht mehr an strikte Zeitangaben und Daten halten, meint Presdo-Gründer Eric Ly. Wenig präzise Angaben wie "nächsten Monat", die sich in einem normalen Kalender nicht nutzen lassen, ohne ein bestimmtes Datum einzustellen, werden von den neuen Organisationshilfen akzeptiert. So kann der Nutzer flexibel bleiben, so lange er möchte.
... mehr
Unstrukturierte Daten sind ein ungehobener Schatz
02.07.2008, Computerwoche
Analysen der Kundenzufriedenheit oder -bindung gehören im CRM an sich längst zum Standardrepertoire - aber mit einer entscheidenden Einschränkung. Sie basieren in der Regel ausschließlich auf strukturierten Daten. Diese beschreiben vorab definierte Fakten und bilden die klassische relationale Datenbank. Demgegenüber stehen die unstrukturierten Daten. Sie machen etwa 85 Prozent des in den Unternehmen gespeicherten Volumens aus. Dazu zählen Texte wie E-Mails, Faxe oder Gesprächsprotokolle, Blog- und Foreneinträge, aber auch Ton- und Bildaufzeichnungen. Bevor solche Daten automatisiert ausgewertet werden können, müssen sie speziell aufbereitet werden. Hierfür wurden unterschiedliche Verfahren entwickelt, die in einigen Organisationen auch bereits im Einsatz sind. Das beste Beispiel für deren Funktionsweise bietet die Textanalyse.
... mehr
‘Which computer scientists are creationists?’ - Semantische Suchmaschinen: Ein Test
02.07.2008, Telepolis
"Semantische" oder "natürlich-sprachliche" Suchen sollen über zusammenhängende Sätze auf bequeme Weise zu genaueren Suchergebnissen führen als Schlagwörter. Immerhin drei der neuartigen Suchmaschinen stellten sich in der letzten Zeit dem öffentlichen Beta-Test. Lohnt sich die Benutzung? Mit knapp 16,6 Milliarden Dollar Umsatz und 4,2 Milliarden Dollar Gewinn in 2007 ist Google mit weitem Abstand Marktführer bei der Internet-Suche. Einige der Anwärter, wie Semantra, Inquiria und RealDialog, spezialisieren sich auf firmeninterne Anwendungen für Kundenservice und Wissensmanagement und bleiben lieber abseits der allgemeinen Aufmerksamkeit. Die mutigsten und ehrgeizigsten hingegen stellen sich dem öffentlichen Vergleich durch den gemeinen Netz-Nutzer: Powerset, Hakia und Cluuz.
... mehr
Die Evolution von IVRs
02.07.2008, Speech Technology Magazine
Das Speech Technology Magazine bietet in dieser Woche einen Überblick über die Entwicklung der IVR-Technologie (Interactive Voice Response). Demnach hat die Technologie sich in vier Phasen entwickelt. Die erste Generation war geprägt von Touchtone-Input und Voice-Putput: Systeme gaben vorher aufgenommene Voice Prompts aus, worauf die Anrufer mit Drücken bestimmter Tasten reagierten. Die zweite Generation zeichnete sprachbasierter In- und Output aus: Der sprachbasierte Input der Anrufer wird automatisch erkannt und es werden entweder vorher aufgenommene Prompts oder synthetisch erzeugte Antworten wieder ausgegeben. In der dritten Generation tritt die Möglichkeit einer visuellen Ausgabe hinzu; der aktuelle Stand der Technik. In der vierten Generation sollen schließlich multimodale Eingabe und multimediale Ausgabemöglichkeiten Realität werden.
... mehr
serVonic IXI-Call CTI Version 3.0
02.07.2008, VOICE Community
Ab sofort steht die neue IXI-Call Version 3.0 von serVonic zur Verfügung. Die 3rd Party CTI-Lösung IXI-Call 3.0 wartet mit „Active Contacts“ Technologie, Microsoft Outlook Kalenderanbindung und flexiblem Präsenz-Management auf. Unter völlig neu gestalteter Oberfläche präsentiert IXI-Call dem Benutzer eine verbesserte Kontakt-, Journal- und Aufgabenverwaltung und Gruppen-Teamfunktionen. Die neue IXI-Call Version ist eine auf Kommunikation fokussierte Realtime Collaboration Anwendung mit 3rd Party CTI Integration für Unternehmen, die ihre Geschäftsprozesse in kommunikationsintensiven Bereichen verbessern möchten. Die modular aufgebaute Client-Server-Lösung für das Microsoft Windows und Office Umfeld verfügt über leistungsfähige Bausteine, die auf mehreren Ebenen eine tiefe Integration in die existierende IT-Infrastruktur ermöglichen und darüber hinaus zu wichtigen Zukunftstechnologien kompatibel sind.
... mehr
Outbound-Dialing für KMUs
02.07.2008, Speech Technology Magazine
CTL hat ein neues Outbound-Dialing-System vorgestellt, das Kunden an Termine erinnert oder sie sich bestätigen lässt. Das System nutzt Sprachtechnologie von LumenVox und kann automatisch Anrufe zu Kunden aufbauen, wahlweise zu ihrem Büro- Festnetz- oder Mobilanschluss. Die Angerufenen können danach den Termin bestätigen oder mithilfe von Touchtone bzw. Spracheingaben einen neuen Termin vereinbaren. Confirm-IT kann zudem Nachrichten auf Anrufbeantwortern hinterlassen und Textnachrichten per SMS oder Email versenden. Routinen und Regeln, wie oft und wann das System die Datenbestände durcharbeitet bzw. Anrufe initiiert, können die anwendenden Unternehmen selbst festlegen, ebenso auch die verwendeten Prompts.
... mehr
Neuerscheinung: Usability of Speech Dialog Systems
26.06.2008, VOICE Community
Kürzlich im Springer Verlag erschienen ist eine neue Fachpublikation zur Gestaltung von Sprachanwendungen. Autor Dr. Thomas Hempel von Siemens Audiologische Technik richtet sich mit seinem neuen Werk an Projektmanager, Designer und Praktiker, die sich mit Sprachprojekten, Voice User Interface Gestaltung und Fragen zur Mensch-Maschine-Interaktion beschäftigen. In dem Werk präsentieren Branchenexperten und Wissenschaftler Strategien wie auch Methoden für die Zukunft nutzerfreundlicher Sprachdialogsysteme. Thematisiert werden u.a. automatische Nutzerklassifikation, sprachbasierte Interaktionen als Teil multimodaler Nutzerschnittstellen und die Rolle von Sprache und Stil für eine markenspezifische akustische Erfahrung.
... mehr
W3C: Neuer Working Draft der Speech Synthesis Markup Language (SSML)
26.06.2008, VOICE Community
Die Speech Synthesis Markup Language wurde entwickelt, um mit einer umfassenden, XML-basierten Auszeichnungssprache die Generierung synthetischer Sprache im Web und anderen Anwendungen zu unterstützen. Ihre wesentliche Aufgabe ist es, Autoren synthetisierbarer Inhalte einen Standard zu geben, mit dem sie synthetische Sprache hinsichtlich Betonung, Aussprache, Lautstärke, Stimmung, etc. über verschiedene Synthese fähige Plattformen steuern können. Der aktuelle Working Draft zielt vor allem auf die Internationalisierung der SSML ab und berücksichtigt Spezifika von Sprachen aus Osteuropa, dem Mittleren Osten und Asien.
... mehr
Jenseits von Falscherkennung und Sprachfehlern
26.06.2008, Speech Technology Magazine
Auf der letztjährigen SpeechTEK West in San Francisco nahm eine Gruppe von Voice User Interface Designern an einem Workshop teil, den James Larson von Larson Technical Services und Lizanne Kaiser von Genesys leiteten. Die Teilnehmer entwickelten damals Empfehlungen für den Umgang mit Fehlermeldungen in Sprachapplikationen aus vier Perspektiven. Das Speech Technology Magazine präsentiert den letzten von vier Artikeln, die die Ergebnisse dieser Empfehlungen zusammengefasst haben. Zu dem Artikel beigetragen haben Rebecca Nowlin Green, Nuance, Lizanne Kaiser, Genesys, Eduardo Olvera, Nuance und Greg Simsar, Syntellect.
... mehr
Dial2Do unterstützt Jajah
18.06.2008, Speech Technology Magazine
Dial2Do, eine auf Hands-free-Technologien spezialisierte Firma aus Irland, hat kürzlich ein Abkommen mit Jahja bekannt gegeben, in dessen Rahmen mobile Endgeräte mit einer Sprachaktivierung für die Kommunikationsdienste des Unternehmens ausgestattet werden sollen. Mit Dial2Do können Anwender eine lokale Telefonnummer anwählen und das Wort „Jajah“ nennen. Anschließend kann einer von drei Jajah-Diensten gewählt werden: Anruf, Textnachricht oder Konferenz. Für Anrufe und Konferenzen initiiert Jajah zudem die Verbindungen zu einer beliebigen Person aus einem Dial2Do-Adressbuch. Durch einen anschließenden Rückruf wird dann die Verbindung hergestellt. Auf den Dienst kann über jedes verfügbare Telefon zugegriffen werden und benötigt keine Installation neuer Soft- oder Hardware.
... mehr
Austria Presse Agentur greift zu automatischer Spracherkennung
18.06.2008, Bizeps Info online
BIZEPS-INFO führte mit Dipl. Ing. Manfred Mitterholzer, dem Leiter der APA-IT-Innovation, ein schriftliches Interview in dem er das Produkt "APA-IT-Spracherkennung" ausführlich erklärte. Als Nachrichtenagentur hat die Austria Presse Agentur (APA) mit Texten aller Art zu tun - nicht zuletzt, mit gesprochenen Texten in Radio- und Fernsehbeiträgen. Die Transkription dieser Beiträge soll nun durch eine eigens entwickelte VCSR (Large Vocabulary Continuous Speech Recognition) deutlich vereinfacht werden. Das System bietet vier zentrale Funktionen: Die automatische Trennung zwischen gesprochenen und nicht gesprochenen Elementen: der Audio Stream wird in Sprache, Musik und Stille unterteilt. Die automatische Unterteilung eines Audio Streams in verschiedene Sprecher. Eine Multiformat-Transskription: Der transkribierte Text kann in Echtzeit in verschiedenen Formaten dargestellt werden, unter anderem auch in XML, wobei jedes Wort mit einem Zeitstempel versehen wird. Und eine automatische Sprecheridentifikation.
... mehr
Dialogic erweitert IP-Media Server-Lösung für Carrier
18.06.2008, VOICE Community
Dialogic hat den Dialogic IP Media Server mit neuen Produktmerkmalen ausgestattet. Dieses auf Software basierende Carrier-Produkt nutzt offene Technologiestandards und stellt damit eine kosteneffektive und skalierbare IP-Media-Server-Lösung dar. Bei den neuen Produkteigenschaften handelt es sich unter anderem um die Unterstützung für integriertes T.38 Fax over IP (FoIP). Dies ermöglicht Service Providern und Anbietern von Messaging-Plattformen die Umsetzung von umfangreichen Messaging-Diensten auch in hybriden Umgebungen. Darüber hinaus wurde in den Bereichen Sprachkonferenzen und Sprachnachrichten die Leistungsfähigkeit des IP Media Servers erweitert, so dass die Rentabilität bei weiterführenden Diensten erhöht wird. Durch den Einsatz von weniger Servern bei gleicher Anzahl an Abonnenten lassen sich somit Kosten und Komplexität des Netzwerk- und Systemmanagements reduzieren.
... mehr
1.000-Dollar-Navi: Garmin Nüvi 880 mit umfassender Sprachsteuerung
18.06.2008, netzwelt
Das 1.000-Dollar-Navi von Garmin startet in Amerika in den Vorverkauf: Das Garmin Nüvi 880 ist das erste mobile Navigationssystem mit umfassender Spracherkennung. In Deutschland kommt das Gerät mit Europa-Kartenmaterial unter der Bezeichnung Nüvi 860 auf den Markt. Anders als Konkurrenz-Produkte lässt sich das Nüvi 860 fast vollständig per Stimmeingabe steuern und nicht nur eingeschränkt. Zur Aktivierung der Sprachsteuerung dient eine kleine Fernbedienung, die sich beispielsweise am Lenkrad befestigen lässt. Nahezu alle Funktionen kann der Benutzer durch eine Spracheingabe anwählen. Der 4,3-Zoll-Touchscreen dient zusätzlich zur Eingabe. Das Navi unterstützt Bluetooth und kann als Freisprecheinrichtung für Handys genutzt werden.
... mehr
Acapela bringt Dolphin Easy Reader das Sprechen bei
18.06.2008, Speech Technology Magazine
Vor kaum einem Monat gab Microsoft den Start seines kostenlosen Plug-ins „Save as DAISY XML“ für Word bekannt, schon hat Dolphin Computer Access die erste Version seines DAISY Player nachgereicht. Für die synthetische Sprachausgabe zeichnet Acapela verantwortlich, die damit einen Beitrag zum Erfolg des Plug-ins leisten wollen. Der DAISY Player (EasyReader Version 3) unterstützt nicht nur die Ausgabe von Texten im Digital Talking Book Format, sondern kann sie auch vertonen und laut vorlesen. Der Reader ist bereits in 15 Sprachen erhältlich und ermöglicht seinen Nutzern dank der Acapela Technologie, dass sie ihre eigenen Texte umgehend anhören können.
... mehr
Vier Mal 'HiPath Ready' für CreaLog Sprachportal
18.06.2008, VOICE Community
Über eine ganze Serie erfolgreicher Zertifizierungen berichtet der Voice Portal-Spezialist Crealog: Siemens hat gleich vier Mal die Sprachdialogsysteme des Münchner Partners erneut als 'HiPath Ready' zertifiziert. Das internationale Siemens-Prüflabor in Brüssel bestätigt damit das reibungslose Zusammenspiel der CreaVoice-Lösungen mit den aktuellsten Versionen der HiPath-Kommunikationssysteme. Die Zertifizierung umfasst HiPath 8000, das hochskalierbare Echtzeit IP-System von Siemens, dazu die Systeme HiPath 4000 und HiPath 3000 für mittelständische Unternehmen sowie die Contact Center Lösungen HiPath ProCenter. Mehrere Tage lang testete das Siemens HiPath Ready Lab in Brüssel das Zusammenspiel mit den CreaLog Sprachdialogsystemen "auf Herz und Nieren", wobei die Anschaltszenarien den Anforderungen der Praxis entsprachen.
... mehr
Nuance stellt Prototypen für Voice Search auf dem iPhone vor
11.06.2008, VOICE Community
Nuance hat einen Prototypen für Voice Search Funktionalitäten auf dem Apple iPhone vorgestellt. Mithilfe der Spracherkennungsserver von Nuance können mobile Anwender ohne Training ihre Anfragen natürlichsprachig in ihr Telefon sprechen und auch von unterwegs das Internet nach passenden Einträgen durchsuchen. In der Zukunft soll zudem die Möglichkeit ergänzt werden, Instant Messaging, SMS und Email-Nachrichten sprachaktiviert zu erstellen und zu versenden. Mithilfe der Technologie des neuen Prototypen namens OVS, für Open Voice Serach, sollen Mobilfunkanbieter ihren Kunden „Say Anything“ Funktionalitäten Suchmaschinen unabhängig anbieten können. Eine Video-Demonstration gibt es unter www.nuance.com/mobilesuite.
... mehr
VoiceIdent–Demonstrator online
11.06.2008, VOICE Community
Die Telekom hat eine Demonstrations-Site für ihr Produkt eingerichtet. Mit VoiceIdent erkennen Systeme jeden Kunden ganz allein durch seine persönliche Stimme. Damit ergeben sich weitreichende Möglichkeiten, Online-Banking oder andere Mehrwertdienste wesentlich schneller zu nutzen – ohne komplizierte Passwörter. Im Online-Democenter der Telekom kann der innovative Service ab sofort live getestet werden: Einfach registrieren, Stimmprofil anlegen und testen. Dazu ist der Demonstrator mit der Applikation "Password Reset" unterstützt. Bei weiteren Fragen zu VoiceIdent stehen Kundenberater zur Verfügung – entweder unter der Nummer 0251 900-2909 oder per E-Mail unter voiceident@telekom.de.
... mehr
Kostenloser Webcast: Gartner und T-Mobile über Telefon Self Service Strategien
11.06.2008, VOICE Community
Mobilfunkanbieter und andere an Endkunden orientierte Unternehmen stehen heute enormen Herausforderungen gegenüber: ein harter Wettbewerb, Preisdruck und Kundenschwund. Bietet hier bezahlbarer, personalisierter Kundendienst eine Lösung? Branchenexperten von Gartner, T-Mobile und VoiceObjects erläutern in diesem Webcast, warum telefonbasierter Self Service über verschiedene Kanäle das Schlüsselelement ist, um Kunden zurück zu gewinnen, die Kundenbindung zu festigen und Kosten zu begrenzen. Innerhalb der 30-Minütigen Präsentation wird Gartner zudem die wesentlichen Service- und Technologie-Trends sowie Best Practices untersuchen, die Umsatz steigernde Berührungspunkte auf jeder Stufe des Kundendienstprozesses erzeugen.
... mehr
YouMail bietet Visual Voicemail kostenlos für Smartphones
11.06.2008, Speech Technology Magazine
Eine neue Mobile-Plattform erlaubt es registrierten Nutzern, auf YouMail auch von unterwegs zuzugreifen. Über den Smartphone-Screen können diese Voicemails abhören, weiterleiten oder sogar per SMS darauf antworten, ohne sich einmal in ihren Voicemail-Service einwählen zu müssen. Der Vorteil der Lösung liege in der visuellen Verarbeitung der Sprachnachrichten. Nutzer, die jeden Tag viele Sprachnachrichten erhalten, können so leichter den Überblick wahren, Prioritäten schnell erkennen und ihre Sprachmitteilungen strukturiert und sicher verwalten. Dies beweise einen enormen Vorteil in der Usability, da das abhören jeder einzelnen Nachricht und vergessene Inhalte der Vergangenheit angehören, so Alex Quilici, CEO bei YouMail.
... mehr
Neue Version der Nuance Mobile Speech Platform
04.06.2008, VOICE Community
Die aktuelle Version der Nuance Mobile Speech Platform (NMSP) kommt mit Verbesserungen der Leistungsfähigkeit sowie neuen Implementierungs-Tools, die den Entwicklern von BREW-Applikationen mobile Funktionalitäten einfacher und effektiver umzusetzen. Neben den gewohnten Funktionalitäten wie Spracherkennung, Open Ended Dictation und Natural Text-to-Speech bietet die Nuance Mobile Speech Platform vorinstallierte Komponenten für weitere Nuance Applikationen, wie Nuance Local Search, Nuance Mobile Navigation, Nuance Content Search, and Nuance Mobile Web Search.
... mehr
Innovationsfeld Küche: Der erste sprachgesteuerte Ofen
04.06.2008, Speech Technology Magazine
Auf der kürzlich stattgefundenen Ausstellung Eurocucina in Italien stellte Indesit, Europas zweitgrößter Hersteller von Haushaltsgeräten, Sophius vor: einen sprachgesteuerten Ofen, der Sprachtechnologie von Loquendo und Amuser einsetzt. Damit ist Sophius das erste vollständig sprachgesteuerte Haushaltsgerät der Welt. Durch den Einsatz von Sprachtechnologie können Anwender die Garzeit und –dauer oder voreingestellte Garprogramme wählen und starten. Die Sprachkommandos können dabei sowohl in Form geführter TTS-Prompts von Loquendo oder als freie, natürlichsprachige Äußerungen gegeben werden. Sophius versteht so z.B. auch: „Back die Pizza bei 180 Grad.“
... mehr
Intervoice stellt Voice Portal 5 vor
04.06.2008, openPR
Intervoice hat die Verfügbarkeit seines Intervoice Voice Portal 5 (IVP 5 bekannt gegeben. Eine der neuen Funktionen ist die Multi-Channel Outbound-Benachrichtigung, die per SMS, e-Mail und Anrufen in Echtzeit über zeitkritische Kunden-Vorgänge, unvorhergesehene Ereignisse und Transaktionen informiert. IVP 5 begegnet nicht nur den Bedürfnissen großer Unternehmen nach hoch skalierbaren Lösungen, sondern ist auch als all-in-one Konfiguration für kleine und mittlere Unternehmen verfügbar. IVP basiert auf der Open Standards Software Plattform von Intervoice und ermöglicht die Einrichtung von unterschiedlichen multimodalen Self-Serivce-Anwendungen.
... mehr
‚Pick-n-Go’: Voice verdoppelt Produktivität
11.06.2008, Logistik-Inside
Danaher Motion hat auf der CeMAT das „Pick-n-Go“-Konzept vorgeführt. Die Automatisierungslösung für die Warenkommissionierung kombiniert den Einsatz von fahrerlosen Transportfahrzeugen und Sprachtechnologie. Während des Kommissionierens begleitet den Mitarbeiter bei jedem Schritt ein fahrerloses Transportfahrzeug. Der Kommissioniermitarbeiter wird so von allen Aufgaben entlastet, die nicht unmittelbar mit dem Zusammenstellen der Waren zu tun haben. Dabei muss man für Pick-n-Go keine neuen Fahrzeuge anschaffen, sondern es können bereits im Einsatz befindliche Standard-Kommissioniergeräte umgerüstet und automatisiert werden.
... mehr
Entwickelt Nuance eine Sync-Konkurrenz?
28.05.2008, Speech Technology Magazine
Das Speech Technology Magazine berichtet von einer Partnerschaft zwischen Nuance, Intel und Wind Systems, einem Entwickler von Device Software Optimization Lösungen, in deren Rahmen eine Linux-basierte Infotainment-Plattform für Autos entwickelt werden solle, was die Wichtigkeit von Sprachtechnologie im Telematik-Bereich untermauere. Die Linuxplattform von Wind River soll demnach ab Mitte bis Ende 2ß009 erhältlich sein und die Text-to-Speech-Technologie beinhalten, die auch schon in dem Sync-System zur Anwendung kam, das Microsoft für Ford entwickelt hat. Im Gegensatz dazu setze das aktuelle System jedoch auf die Offenheit von Linuxsystemen, worduch das hinzufügen von weiteren Komponenten deutlich erleichtert werden solle.
... mehr
Einsatzszenarien für CCXML (Call Control XML)
28.05.2008, VOICE Community
Andrew Fuller, CTO von Voxpilot, bietet in diesem Whitepaper eine Einführung in CCXML. Bei CCXML handelt es sich um einen offenen Standard, der die Bandbreite verfügbarer Telefoniefunktionen für Entwickler von Sprachapplikationen deutlich erweitert. CCXML kann Anrufe dynamisch verbinden, an neue VoiceXML-Dialoge weiterleiten, Medien trennen und Konferenzen erzeugen. In diesem Whitepaper wird gezeigt, wie Call Center und Conferencing Applikationen mit CCXML auf der Voxpilot Open Media Platform entwickelt werden. Zudem werden mehrere Einsatzfälle von Audio/Video-Diensten und IMS-Anwendungen präsentiert.
... mehr
State Chart extensible Markup Language (SCXML)
28.05.2008, VOICE Community
Die W3C Voice Browser Working Group hat einen weiteren neuen Arbeitsbericht für State Chart XML (SCXML) herausgegeben: „State Machine Notation for Control Abstraction“. SCXML ist eine flexible Sprache für Zustandsautomaten, die die Konzepte von CCXML mit den State Tables von Harel kombiniert. Die wesentlichen Unterschiede zur Vorgängerversion sind 1. die Modularisierung der Sprache, 2. die Einführung von Profilen und 3. eine Revision des Algorithmus zur Dokumenteninterpretation.
... mehr
Sprachtechnologie für die Prozessindustrie
28.05.2008, VOICE Community
Als Teil des vierjährigen EU-Projekts SAFIR (Speech Automatic Friendly Interface Research), das unlängst erfolgreich beendet wurde, hat die BASF IT Services eine neue Anwendung entwickelt, mit der in der Prozessindustrie eingesetzte IT-Systeme sprachaktiviert werden können. Ziel des Projekts SAFIR (Speech Automatic Friendly Interface Research) war es, Technologien zu entwickeln, mit denen Unternehmen, Behörden und Organisationen in Europa einfach und sicher sprachaktiviert auf Daten zugreifen können. Die Basis der ersten Testversion bildete die Sprachtechnologie-Lösung Voice Query Language (VQL), die vom Initiator des Projekts, der belgischen Firma Voice-Insight, speziell für den Einsatz in industriellen Anwendungen entwickelt wurde. Der zukünftige Einsatz von SAPHER beschränkt sich nicht nur auf den Bereich Environment, Health and Safety (EHS). Die Technologie wurde vielmehr so entwickelt, dass sie ohne großen Aufwand auch IT-Prozesse anderer industrieller Abläufe sprachaktivieren kann.
... mehr
RightNow Technologies führt Version May ‘08 ein
28.05.2008, Verivox
RightNow führt eine neue Version seiner On-Demand-CRM-Lösung der Enterprise-Klasse ein. Mit RightNow May ’08 bietet das Unternehmen neue Online-Chat-Funktionen an. Damit ist RightNow der erste Anbieter einer On-Demand-CRM-Lösung, die über vollständige Möglichkeiten zur unternehmensweiten Erfassung von Feedback-Informationen im Service, Marketing und Vertrieb verfügt. Sämtliche Kommunikationswege - d.h. Telefon, E-Mail und Web – werden dabei bedient. Mit den kommunikationskanalübergreifenden Möglichkeiten von RightNow May ‘08 sind Unternehmen in der Lage, die Stimme des Kunden zu erfassen und sofort zu reagieren, um auf diese Weise ein besseres Kundenerlebnis zu schaffen.
... mehr
Sprechende Lego-Roboter im IdeenPark
16.05.2008, Universität des Saarlandes
Die Roboter von Lego Mindstorms können sich nicht nur bewegen und über verschiedene Sensoren ihre Umgebung wahrnehmen. Wissenschaftler der Universität des Saarlandes haben ihnen auch das Sprechen beigebracht und dafür ein einfach zu bedienendes Sprachdialogsystem entwickelt, das sich besonders für den Schulunterricht eignet. In Workshops der Saarbrücker Computerlinguisten können Schüler und Lehrer die sprechenden Roboter im IdeenPark in Stuttgart kennen lernen. Der IdeenPark ist eine große Technik-Erlebniswelt, die sich vor allem an Jugendliche, Familien und Schüler wendet und in diesem Jahr vom 17. bis 25. Mai 2008 in der Messe Stuttgart stattfindet.
... mehr
Voxpilot Open Media Platform unterstützt Dialogic Media Gateway
03.05.08, Voxpilot
Voxpilot und Dialogic haben eine gemeinsme VoiceXML-IVR-Lösung für Carrier, Unternehmen und Serviceprovider geschaffen. Dabei verwandelt das Dialogic Media Gateway eingehende Anrufe aus ISDN in SIP. Die Voxpilot Open Media Platform beantwortet den SIP Call und führt die in VoiceXML und CCXML geschriebene Sprachanwendung aus. Das Gleiche ginge auch in umgekehrter Richtung, so die Anbieter. Nutzer von Dialogic Gateways können die Voxpilot Open Media Platform hier testen: http://downloads.voxpilot.com/.
... mehr
Java Speech API 2 bald fertig?
13.05.2008, IT-Republik.de
1998 gab es mit dem Java Speech API die ersten Bestrebungen, Sprachtechnologien mit Java zu verwenden. Leider war dieser erste Entwurf nicht wirklich vollkommen. Nun ist die Version 2 auf dem Weg und verspricht, dass alles besser wird. Die Spezifikation des JSAPI 2 wurde als JSR 113 im Jahr 2001 unter Federführung der US-amerikanischen Firma Conversay entwickelt, um einige Schwachstellen wie das mangelhafte Konzept des AudioManagers zu verbessern. Nun hat Conversay eine Vorabversion veröffentlicht, die eine Brücke zwischen Java und bestehenden Sprachservern auf MRCP-Basis, aber auch anderen Spracherkennern und Sprachsynthesizern schließt, um Sprachanwendungen auf mobilen Geräten verfügbar zu machen. Nachdem Android in der neueren Version Sprachtechnologien auf mobilen Geräten nicht mehr unterstützt, ist dies ein weiterer Grund dafür, sich des Themas anzunehmen.
... mehr
Proaktives Business Management für verbesserten Customer Service
13.05.2008, VOICE Community
Genesys hat eine Vision vorgestellt, wie Unternehmen eine ganzheitliche Sichtweite erreichen, um Kundendienstleistungen in Echtzeit zu steuern. Herausforderungen für die meisten Unternehmen bestünden darin, proaktive Ansprache bei ungeplanten Ereignissen zu bieten, die Auswirkung auf Operationen im Kundendienst zu verstehen und allen Bereichen ihres Unternehmens Echtzeitinformationen zur Verfügung zu stellen, damit diese sich an ändernde Geschäftsbedingungen anpassen können. Deshalb bietet Genesys Proactive Business Management Einsicht in alle erfolgskritischen Systeme und Prozesse, die den Kundendienst beeinflussen – und nicht nur in die, die sich im Call Center befinden. Zudem solle die Zeit für Entscheidungsfindungsprozesse verkürzt werden, indem zusätzlich kontextuelle Informationen mitgeliefert werden, die Ereignisse unternehmensweit und in Echtzeit berücksichtigen.
... mehr
Nuance veröffentlicht RadCube Business Intelligence
13.05.2008, VOICE Community
Nuance gab den Verkaufsstart von RadCube bekannt, einem Web-basierten Business Intelligence Tool der Dictaphone Healthcare Division. RadCube ist eine Kernkomponente des Dictaphone Radiology Management Portfolios und soll die Arbeitspraxis von Radiologen vereinfachen. RadCube ist eine automatisierte Lösung, die nahtlos in Arbeitsumgebungen integriert wird. Ziel ist die Erfassung und Strukturierung von Daten, die aus anderen Anwendungen integriert werden, wie z.B. für Computerized Physician Order Entry (CPOE), Radiology Decision Support (RadPort), Speech Reporting (PowerScribe und RadWhere) und Critical Test Result Management (Veriphy).
... mehr
Kostenloses Whitepaper: 10 Tipps für den Einstieg in Voice Analytics
13.05.2008, VOICE Community
Werden Voice Analytics in bestehende Recording und Quality Monitoring Plattformen integriert, können sie erfasste Interaktionen auswerten und umfassenden Einblick in die Wahrnehmung von Anrufern und das Verhalten der Agenten geben. Voice Analytics bieten dadurch eine Lösung, genau die Maßnahmen zu finden, die die Kundendienstleistungen optimieren. Sie bieten eine Möglichkeit, Interaktionsaufzeichnungen in großer Menge zu analysieren und die Qualität des Kundendienstes auf eine neue Stufe zu heben. Dieses kostenlose Whitepaper gewährt zehn Tipps für den problemlosen Einstieg in das Thema und die Technologie.
... mehr
Voice Automation auf dem Vormarsch
13.05.2008, Speech Technology Magazine
Ribbit für Salesforce, offiziell am 6. Mai gestartet, ist ein Software-as-a-Service-Modell, das Voice mit dem bekannten Salesforce.com Customer Relationship Management System verbindet. Und obwohl sich der Dienst an Sprachkommunikation im Allgemeinen richtet, liegt der Fokus auf mobilen Anwendungen. Eine online-basierte Mobilerweiterung vereint das Telefon mit den verwendeten Anwendungen, so dass Nutzer von jeder Salesforce.com Website aus Telefonate annehmen und aufsetzen können. Der Dienst vereinfacht zudem den Zugriff auf Mitteilungen von Handys. Mobile Anrufe, Sprachnachrichten und transkribierte Texte (möglich dank Partner Simulscribe) fließen automatisch in die Kundenstatistiken auf Salesforce.com ein. Nutzer können somit Informationen aus Sprachkommunikationen archivieren, durchsuchen und darauf reagieren wie in einem normalen Workflow-Prozess.
... mehr
Steigert die Content Correlation Engine von blinkx den Umsatz von Content-Anbietern?
13.05.2008, VOICE Community
Die schnelle Verbreitung von Breitband hat einen starken und wachsenden Markt für Content-Anbieter geschaffen, die Videoinhalte besitzen und produzieren. Die durchschnittlichen Tausend-Kontakt-Preise für Online-Video-Anzeigen liegen oft eine ganze Stufe über den entsprechenden Textbanner-Anzeigen. Daher erzeugen viele Content-Provider mit starken Marken im Bereich Offline- und Online-Texte zunehmend Online-Video-Inhalte, um neue und schneller wachsende Anzeigenumsätze zu generieren. Eine Erweiterung der Advanced Media Platform von blinkx - die Content Correlation Engine - ist seit Kurzem verfügbar und helfe Unternehmen, auf jeder einzelnen Seite ihrer Websites automatisch Text- und Videoinhalte abzustimmen.
... mehr
Neuer Genesys Webcast: Support Customer Calls with Innovated Interactive Voice
07.05.2008, VOICE Community
Aktuelle Interactive Voice Response (IVR) Plattformen sind noch immer begrenzt, wenn es um Kundeninteraktionen, Voice Analytics und Verknüpfungen mit anderen Medien geht. Die Kombination aus Self Service und Assisted Service kann hier Abhilfe schaffen und gerade mobilen Anrufern einen personalisierten Service bieten, der auf ihre Bedürfnisse zugeschnitten ist. In diesem Webcast erläutern Experten von Genesys, Analytics L.L.C. und Ticketmaster, wie multimodale Interaktionsangebote, z.B. die Kombination von Sprache und Tastatureingabe, ein besseres Kundenerlebnis vermitteln kann. Außerdem werden Analysetechniken in Echtzeit, Automatisierung, medienübergreifende Integration und die dadurch möglichen Ertragssteigerungen thematisiert.
... mehr
Nuance gibt Avaya Unified Communications eine Stimme
07.05.2008, VOICE Community
Nuance gab bekannt, dass die firmeneigenen Spracherkennungstechnologien von Avaya für deren Unified Communications Suite ausgewählt wurden. Als Teil der getroffenen Vereinbarung werden Nuance-Technologien nun als Standardkomponente von Avaya Modular Messaging 4.0 inklusive Avaya one-X Speech vertrieben. Avaya one-X Speech ist ein „hands-free“ User Interface, das Anwendern den Zugriff auf und die Verwaltung von E- und Voice-Mail, Kalender- und Aufgabeneinträgen sowie Anruf- und Konferenzfunktionen ermöglicht. In der neuen Version ist dies alles nun auch sprachaktiviert und von jedem beliebigen Telefon aus möglich.
... mehr
Startschuss für den 8. eGovernment-Wettbewerb
07.05.2008, VOICE Community
Letzte Woche fiel der Startschuss für die achte Runde eines der wichtigsten Wettbewerbe für innovative IT-Projekte in der Verwaltung, die die Interaktion zwischen Bürgern, Unternehmen und Behörden verbessern: Das Management- und Technologieberatungsunternehmen BearingPoint und der Technologieanbieter Cisco rufen ab sofort zur Teilnahme am 8. eGovernment-Wettbewerb auf. Bundes-, Landes- und Kommunalverwaltungen können sich mit ihren E-Government-Projekten bis zum 13. Juni 2008 bewerben. Der Wettbewerb steht unter der Schirmherrschaft des Bundesinnenministers Dr. Wolfgang Schäuble. Die Teilnehmerunterlagen stehen unter www.egovernment-wettbewerb.de zum Download bereit.
... mehr
Envox veröffentlicht ‘Envox CT ADE 10’
07.05.2008, VOICE Community
Envox hat mit „Envox CT ADE 10“ ein zentrales Upgrade zu dem weit verbreiteten Entwicklungswerkzeug für Interactive Voice Response (IVR) Anwendungen. Die Neuerungen umfassen Funktionen zur Erstellung von IP-basierten Kommunikationslösungen inklusive Video Messaging, SMS und Konferenzfunktion. Unterstützt werden dabei Standards wie VoiceXML, MRCP und SIP sowie serviceorientierte Architekturen. Außerdem sind bereits die neuesten Versionen der Automated Speech Recognition (ASR) und Text-to-Speech (TTS) Engines von Nuance integriert.
... mehr
IVONA unterstützt MRCP Protokoll
07.05.2008, VOICE Community
IVO Software hat eine neue Version von IVONA Telecom TTS veröffentlicht, die das internationale MRCP Protokoll unterstützt. Dieses erlaubt Sprachdienste in Client/Server-Architekturen und ermöglicht dadurch die einfache Implementierung der Software in große Call Center- und Unternehmenslösungen. Die Software erlaube Unternehmen, ihren Kunden wichtige Informationen automatisiert zugänglich zu machen. Das System erzeuge natürlich klingende Sprachausgaben, die auch hunderte und tausende Anrufer gleichzeitig abwickeln könne. Dadurch sparten Unternehmen Zeit und Kosten in erheblichem Umfang, so Lukasz Osowski, Geschäftsführer von Ivo Software

... mehr
MacSpeech Dictate 1.0.1 erhältlich
07.05.2008, MacWorld.co.uk
MacSpeech hat das erste Update zu MacSpeech Dictate veröffentlicht, der Spracherkennungslösung für den Mac. Das Update verbessere die Dokumentation, vereinfachere den Umgang mit Linzenz-Schlüsseln und biete eine robustere Unterstützung von AppleScript, wodurch die Erstellung von Kommandos deutlich vereinfacht sein soll. Der Patch ist für registrierte Anwender über das „Check for Updates“ verfügbar. MacSpeech Dictate ist das aktuellste Spracherkennungsprodukt für Mac-Computer und nutzt die Diktationssoftware von Nuance, die bereits erfolgreich in Dragon NaturallySpeaking zum Einsatz kommt.
... mehr
Nürnberger VoiceCom solutions GmbH präsentiert sprachgesteuertes Telefonvermittlungssystem Voice Director als handlichen 19 Zoll Einschub
30.04.2008, VOICE Community
Als Erweiterung der TK-Anlage übernimmt das Komplettsystem die Funktion einer vollautomatischen, sprachgesteuerten Anrufentgegennahme und -vermittlung und bietet so Abhilfe in Spitzenzeiten sowie außerhalb der Geschäftszeiten. Mit der neuen Version 4.0 wurde die Präzision in der Spracherkennung und -wiedergabe noch einmal spürbar ausgebaut.
... mehr
Nie mehr verlaufen mit sprachgesteuerten Navigationsgeräten für Fußgänger
29.04.2008, Deutschlandradio
Wer zu Fuß in einer fremden Stadt unterwegs ist, kann sich einen Stadtplan besorgen, Passanten nach dem Weg fragen - oder ein Fußgängernavigationssystem benutzen. Die kleinen elektronischen Wegweiser kommen in diesem Jahr auch mit Karten auf den Markt, die speziell auf die Bedürfnisse von Fußgängern abgestimmt sind. "Wir haben im letzten Jahr ein Navigationssystem für Blinde gelauncht, das mit entsprechender Sprachtechnologie unterstützt wird: Hier ist wesentlich mehr Voice Guidance, also Sprachausgabe, gefordert, als es eben in einem Auto-Navigationssystem für Sehende der Fall ist."
... mehr
Digitale Spracherkennung kann die Produktivität erhöhen
23.04.2008, HealthTechWire
Diktat. Transkription. Kontrolle. Freigabe. Das klassische Arztbrief-Management in Kliniken ist umständlich und zeitraubend. Mit Hilfe von Spracherkennung und digitalem Diktat kann ein Klinikum seine Produktivität steigern, sodass am Ende mehr Zeit für die Patienten bleibt und die Qualität der Dokumentation verbessert wird. Der konsequente Einsatz von Spracherkennung wirke sich nicht nur auf die Produktivität im Dokumentationsprozess aus, sondern werde für das gesamte Haus ökonomisch „fühlbar“, so Holger Ladewig von dem zu Philips gehörenden Unternehmen Kuhlmann-Informations-Systeme. Das digitale Diktat spare umständliche Transkriptionsschritte und führe zu einer Beschleunigung der Prozesse, weil die relevanten Dokumente rascher und in höherer Qualität vorliegen. Hospitäler könnten so mehrere 100.000 Euro pro Jahr sparen.
... mehr
Audiopoint verbindet Internet und Telefonie durch Sprache
23.04.2008, Speech Technology Magazine
Earthlink hat seine Zusammenarbeit mit Audiopoint ausgeweitet und bietet seinen Nutzern neben dem populären „Email by Phone“-Dienst nun auch die Möglichkeit, die gleiche Text-to-Speech-Funktion für internetbasierte Nachrichten- und Informationsdienste zu nutzen. Registrierten Nutzern steht somit der sprachaktivierte Zugriff auf Sportnachrichten, Wettervorhersagen oder Echtzeit-Börsenkursen über das Telefon offen. Der Zugriff erfolgt dabei über dieselbe Telefonnummer, die auch für den Email-Dienst verwendet wird (1-800-READ-MAIL), die angebotenen Meldungen orientieren sich an einem „Vorliebenordner“, der jeder Nutzer individuell personalisieren kann. Die verwendete Spracherkennung von Nuance ersetzt dabei alle visuellen Interfaces aus dem Internet.
... mehr
"Virtueller Rettungsarzt" kann Leben retten
23.04.2008, Pressetext
In Kooperation mit dem Bundesministerium für Bildung und Forschung, dem Deutschen Roten Kreuz KV Esslingen und der Hochschule für Technik Esslingen entwickelte Christian Häfner aus Bietigheim-Bissingen in den vergangenen Jahren einen "virtuellen Rettungsarzt", den Aid-Angel. Der Aid-Angel ist ein autonomes Gerät, ähnlich einem Headset, das in einer Notfallsituation dem Ersthelfer zunächst die Nervosität nimmt und ihm dann eindeutige und verständliche Anleitungen zu den richtigen Erste-Hilfe-Maßnahmen gibt. Der "virtuelle Rettungsarzt" stellt dazu einfache Ja-Nein-Fragen und reagiert auf definierte Schlüsselworte. Die Bedienung erfolgt intuitiv über Spracherkennung.
... mehr
Loquendo TTS in Geosat 6 von AvMap
23.04.2008, VOICE Community
AvMap hat sich für Loquendo Embedded TTS entschieden, um sein Geosat 6 GPS-Handheld um Text-to-Speech-Funktionen zu erweitern. Die Technologie von Loquendo soll genutzt werden, um Namen von Straßen und Orten vorzulesen, damit Fahrer ihren Blick und damit ihre Aufmerksamkeit auf der Straße lassen können. Der Bildschirm des Geosat 6 stellt parallel zur Ansage die Informationen auch visuell dar und kann dank einer Magnetbefestigung sowohl horizontal als auch vertikal angebracht und betrachtet werden. Für den Autobauer Peugeot wurde sogar eine Integration in den DIN-Sockel umgesetzt, so dass Fahrer des Peugeot 207 die Ansagen des Geosat 6 über die integrierten Autolautsprecher hören können.
... mehr
Was Sie schon immer über Voice Biometrie wissen wollten: FAQ zu Voice Verifier von Nuance
23.04.2008, VOICE Community
Sprachauthentifizierung verheißt eine Welt ohne PINs bei zugleich größerer Sicherheit: Der Zugriff auf Gehaltsabrechnungen, Konten bei Versicherungen, Banken und vielem mehr könnten dadurch erleichtert, aktuelle Sicherheitsstandards eingehalten werden. Gleiches gilt für sensible Daten im Bereich von Computeranwendungen oder Zutrittsberechtigungen im Gebäudemanagement. Gleichzeitig kann sprachbasierte Authentifizierung neue Wege der Personalisierung von Diensten erschließen und neue Umsätze durch 1-to-1-Marketing erzielen. Lesen Sie deshalb im aktuellen Whitepaper aus dem Hause Nuance, welche Fragen von Kunden und Partnern häufig gestellt werden, wenn es um das Thema Sprachauthentifizierung, die zugrunde liegende Technologie und darauf basierende Anwendungen geht. Für einen einfachen Überblick sind die Fragen bereits nach Themen strukturiert.
... mehr
Den Teufel aus dem Detail treiben
16.04.2008, Speech Technology Magazine
Tuning - das u.a. die laufende Kontrolle geführter Gespräche umfasst – ist zu einem entscheidenden Schritt in der Entwicklung einer Sprachanwendung geworden. Zum Tuning zählt das Aktualisieren von Grammatikbestandteilen, das Hinzufügen von Aussprachevarianten zum verwendeten Lexikon und das Abändern von Prompts an Stellen, wo bei Anrufern Verwirrung entsteht (+ mehr zum Thema erläutert Nuance in der aktuellen VOICE Community-Serie „Die wichtigsten Schritte eines Voice Projekts“). Doch zumeist wird unter Tuning kaum mehr verstanden als die Art und Weise, wie die technische Seite der Spracherkennung optimiert wird. Solch ein reduzierender Blick vernachlässigt aber die tatsächliche Bedeutung des Prozesses: Wenn Usability Tests das Yin sind, ist Tuning das Yan – das eine geht nicht ohne das andere und jedes gewährt je spezifische Daten anhand derer die Effizienz einer Sprachanwendung optimal definiert werden kann.
... mehr
W3C: Neuer Arbeitsbericht zu ‘Multimodal Architecture and Interfaces’
16.04.2008, W3C
Die Multimodal Interaction Working Group hat einen aktualisierten Arbeitsbericht der “Multimodal Architecture and Interfaces” (MMI Architecture), veröffentlicht, der eine lose gekoppelte Architektur multimodaler Benutzerschnittstellen beschreibt. Die wesentliche Änderung des aktualisierten Working Draft betrifft die Spezifizierung von Ereignissen, die zwischen dem Runtime Framework und den Modalitätskomponenten übermittelt werden. Die von der Arbeitsgruppe entworfene Architektur wird einen grundlegenden und flexiblen Rahmen für die Interoperabilität modalitätsspezifischer Komponenten verschiedener Hersteller zur Verfügung stellen – z.B. Spracherkennung von einem Hersteller und Handschriftenerkennung von einem anderen.
... mehr
TTS haucht Geschichten und Drehbüchern Leben ein
16.04.2008, Speech Technology Magazine
Screaming Bee hat ScriptVOX Studio veröffentlicht, eine Text-to-Speech (TTS) Softwareanwendung, mit deren Hilfe Autoren Prototypen ihrer Geschichten oder Multimediapräsentationen erstellen können, indem den Charakteren Stimmen und den Texten Grafiken zugewiesen werden. Scripte, Erzählungen, Drehbücher und Kurzgeschichten können so angehört und ihre Wirkung beurteilt werden. ScriptVOX Studio verwendet die SAPI 5.0 Technologie von Microsoft, um die TTS-Stimmen zu erzeugen. Eine zusätzliche Modulierungsfunktion erlaubt es, eine einzige vorhandene Stimme beliebig zu verändern und jeden beliebigen Charakter zu besetzen. Weitere digitale Algorithmen ermöglichen die Erzeugung von Umgebungsgeräuschen, wie Telefon, Auto und Echo, sowie das „Morphing“ der Stimme, die z.B. wie ein Roboter klingen kann.
... mehr
EveryZing legt nach
16.04.2008, Speech Technology Magazine
Die Videosuchmaschine EveryZing gab unlängst die Veröffentlichung von RAMP bekannt, einer Managementkonsole für die gehosteten Lösungen ezSEARCH und ezSEO, die bereits im Februar an den Start gingen und u.a. Dow Jones, Reuters und Boston.com zu ihren Kunden zählen. ezSEARCH erleichtert die Suche nach Multimediainhalten, indem das Konzept gängiger Textsuchmaschinen in Form einer einfachen Eingabebox übernommen wurde. Und ezSEO optimiert Multimediasuchmaschinen durch die optimierte Platzierung von Inhalten in herkömmlichen Suchmaschinen. RAMP, das für „Reach, Access, Monetization, and Protection“ steht, setzt diese Strategie fort und verbessert durch die Einführung eines einfachen Point-and-Click-Interface die Kontrollmöglichkeiten, wie die Inhalte von Unternehmen auf den Seiten ihrer Kunden erscheinen.
... mehr
Linguatec präsentiert Voice Reader Studio
16.04.2008, TeachersNews
Linguatec stellt ein neuartiges Vorleseprogramm vor. Mit dem Voice Reader lassen sich Textdokumente mit einem Klick in MP3-Dateien verwandeln, die dann auf jeden MP3-Player übertragen werden können. iPod-Besitzer haben es noch bequemer: Wer will, kann z.B. alle neuen E-Mails direkt beim Empfangen von Outlook automatisch auf seinen iPod überspielen lassen. Oder die letzten E-Mails im Auto anhören oder sich beim Joggen interessante Artikel vorlesen lassen, die man aus dem Internet herunter geladen hat. Auch für den e-Learning Bereich ist Voice Reader Studio bei der Vertonung von Schulungsunterlagen, Computer Based Trainings (CBT) oder für Hörbeispiele im Fremdsprachenunterricht einsetzbar. So hat z.B. auch Brockhaus multimedial in der 2008er Version alle 260.000 Lexikonartikel damit vertont.
... mehr
Genesys präsentiert iCFD
09.04.2008, VOICE Community
Genesys hat eine neue Suite von Lösungen für eine intelligente Kombination aus Self Service und Live Service vorgestellt. Die neue „intelligent Customer Front Door”, oder auch iCFD, bringt Komponenten des Genesys Dynamic Contact Center mit fortschrittlichen Self Service Applikationen zusammen, die in nur wenigen Schritten die Identität und das Anliegen eines Anrufers erkennen und sie um relevante Daten aus Backend-Systemen oder dem laufenden Workflow ergänzen. So können sie den Kontext des Anrufes bestimmen und die angemessene Behandlung unter Berücksichtigung festgelegter Geschäftsregeln beurteilen. Daraufhin treffen sie eine Auswahl aus verfügbaren Ressourcen wie Self Service, proaktive Notifikation, automatisches Callback oder Live Service, um eine möglichst gute Kundenerfahrung sicher zu stellen.
... mehr
VoiceObjects ergänzt Desktop for Eclipse um VoiceObjects Developer Edition
09.04.2008, VOICE Community
VoiceObjects gab kürzlich die Verfügbarkeit von VoiceObjects Developer Edition zu VoiceObjects Desktop for Eclipse bekannt. Durch den Einsatz dieser neuen Lösungen können Entwickler telefonbasierte Anwendungen für verschiedene Telefonkanäle erstellen, die durch integrierte Funktionalitäten zur Personalisierung individuelle Anruferlebnisse für jeden Kunden schaffen. Die VoiceObjects Developer Edition ist eine per Download kostenlos verfügbare Umgebung für die Entwicklung von telefonbasierten Sprach-, Video-, Text- oder Web- Anwendungen. Diese neue Lösung beinhaltet eine Laufzeitversion von VoiceObjects Server, die die gesamte Bibliothek der über 100 Mediaplattformtreiber beinhaltet, um damit eine Vielzahl von IVRs und USSD-Plattformen zu unterstützen.
... mehr
Online-Kontoeröffnung mit Sprachunterstützung
09.04.2008, VOICE Community
Comdirect macht es Interessenten seines Tagesgeldkontos besonders einfach, einen Vertrag online abzuschließen. Die Online-Maske für einen Antrag bietet seit kurzem eine Sprachunterstützung, die den gesamten Antragsprozess begleitet. Nach einer kurzen Vorstellung gibt die Sprachunterstützung zu Beginn jedes neuen Abschnittes eine Orientierungshilfe, gefolgt von situationsbezogenen Informationen zu den derzeit abgefragten Daten. Die grafischen und textuellen Informationen der Online-Maske werden so um eine weitere Dimension bereichert und bieten multimodale Hilfestellung.
... mehr
Apple erhält Patente für Text-to-Speech und mehr
09.04.2008, MacNN
Am ersten April wurden Apple von der US-Patentrechtsbehörde die Rechte an insgesamt acht Patenten zugesprochen. Die relevantesten unter diesen beinhalten Text-to-Speech-Technologie Patente, mehrere Docking Stations von Apple sowie Apples Magsafe Adaptertechnologie. Der Titel des Text-to-Speech-Patents lautet „Representation of Orthography in a Continuous Vector Space” und bezieht sich auf die Analyse menschlicher Sprache bzw. im Genaueren auf die Orthographie von Worten, die in Bezug zu den sie bildenden Phonemen gesetzt und abgeglichen wird.
... mehr
Die Top 5, wie Kunden mit IVRs vergrault werden
09.04.2008, Angel.com
Der IVR Blog (Interactive Voice Response) von Angel.com präsentiert in dieser Woche eine Gastautorin: Heather Johnson ist freischaffende Autorin zu Business-Themen, Bootstrapping und Customer Service. Im IVR-Blog widmet sie sich dem Thema IVR: Zwar setzen Unternehmen vermehrt auf die Technologie, doch leider allzu oft nur der Einsparung von Kosten und Zeit wegen. Die Bedürfnisse der Kunden bleiben außen vor und das System ist zum Scheitern verurteilt. Heather Johnson fasst in ihrem Beitrag die fünf gröbsten Fehler zusammen, die ein IVR-System zum Schrecken jedes Kunden machen: 1. kein Ausweg, 2. zu viele Menüoptionen, 3. ungenaue Spracherkennung, 4. keine Shortcuts und 5. langatmige Scripts.
... mehr
Aperto move und Inforadio vom RBB starten Telefonportal
02.04.2008, VOICE Community
Inforadio vom RBB bietet Nachrichten, Wettervorhersagen und aktuelle Verkehrsmeldungen jetzt auch am Telefon an. Ob vom heimischen Festnetzanschluss oder dem Mobiltelefon aus, über das Inforadio-Serviceportal können registrierte Hörer ab sofort die Inforadio-Inhalte auch telefonisch abrufen. Der User steuert die Anwendung per Spracheingabe. Für Situationen mit lauten Umgebungsgeräuschen ist auch die Steuerung über die Tastatur (DTMF-Fallback) vorgesehen. Eine vertraute Inforadio-Stimme „führt“ den Hörer durch das Menü. Das Dialogsystem liefert aktuelle Informationen, gibt Möglichkeiten der Interaktion und bietet exklusive Audios aus dem Inforadio-Programm. Darüber hinaus bietet das von der Berliner aperto move umgesetzte Sprachportal zahlreiche Interaktionsmöglichkeiten zwischen Hörer und Programm.
... mehr
VOICE Community Mitglied sucht Rat: Probleme mit FRR und FAR
02.04.2008, VOICE Community
Im Forum der VOICE Community wartet eine neue Diskussion auf Teilnehmer: Es geht um die Qualität von sprachbiometrischen Standardlösungen, hier: ein automatisches Passwort Reset System am User Help Desk. Dieses (relativ neue) sprachbiometrische Passwort Reset System weist eine False Rejection Rate (also Abweisung eines Berechtigten: FRR) in der Größenordnung 15-18% auf, produziert gleichzeitig aber auch eine False Acceptance Rate (Zulassung Nichtberechtigter: FAR) von 2%. Welche Stellschrauben stehen denn unserem Community Mitglied zur Verfügung, um FRR und FAR zu verbessern? Und wie schätzen Sie generell die Auswirkung auf die Nutzer-Akzeptanz bzgl. einer schlechten FRR oder eher einer schlechten FAR? Können Sie eine Ferndiagnose möglicher Fehlerquellen erstellen? Diskutieren Sie mit!
... mehr
Nuance Mobile bietet Voicemail-to-Text
02.04.2008, VOICE Community
Nuance hat „Nuance Voicemail-to-Text” angekündigt, einen Transkriptionsdienst für Voicemails, der hinterlassene Sprachnachrichten mittels Nuance Spracherkennung in geschriebenen Text umwandelt. Die so umgewandelten Nachrichten werden per SMS oder Email an die Nutzer des Dienstes versendet. Dadurch brauchen Anwender nicht mehr fürchten, Informationen zu verlieren, weil sie die Sprachnachrichten unterwegs abhören und nichts notieren können. Die Textnachrichten können gespeichert, editiert, weitergeleitet, in einem Archiv indexiert und zu jedem Zeitpunkt wieder aufgerufen werden.
... mehr
Natural Language Processing
02.04.2008, Speech Technology Magazine
Die meisten Voice User Interfaces (VUIs) nötigen einen Anrufer dazu, durch bis zu 20 Fragen zu navigieren, bis sein Anliegen erledigt ist. Wird nur eine der Fragen falsch beantwortet, kann es sein, dass der gesamte Prozess abbricht und das Anliegen unerledigt bleibt. Das ist auch die Hauptursache, warum viele Menschen von Sprachdialogsystemen frustriert sind. Schon seit geraumer Zeit wird versucht, durch das Zulassen natürlich sprachlicher Äußerungen in Verbindung mit offenen Fragstellungen („Was ist Ihr Anliegen?“) einen wesentlichen Teil dieser Fehlerquellen auszuschließen. Grundlegend dafür ist ein gut funktionierendes Natural Language Processing (NLP) – doch damit ist es noch lange nicht getan.
... mehr
Ersetzt sprachaktivierter Roboter Fernbedienungen?
02.04.2008, PCWelt.de
Während einige Hersteller mittels Universalfernbedienungen den Anwendern das Leben mit einer Vielzahl an elektronischen Geräten vereinfachen wollen, hat Toshiba einen noch einfacheren Plan: ein kleiner, lernfähiger Roboter soll künftig die Fernbedienungen auf dem Wohnzimmertisch obsolet machen. Toshiba hat in Japan den Prototypen von "ApriPoco" vorgestellt. Der kleine Roboter erkennt selbstständig, ob in einem Raum Infrarotsignale von einer Fernbedienung ausgesendet werden. In einem solchen Fall fragt die Maschine den Anwender: "Was machst Du gerade?". Die Antwort könnte dann beispielsweise lauten "Den Fernseher einschalten". Auf diese Weise lernt ApriPoco, welches Signal welche Auswirkung hat und kann diese entsprechend imitieren. Will der Anwender also künftig sein TV einschalten, genügt es, ApriPoco den Befehl "Schalte den Fernseher ein" zu geben.
... mehr
Microsoft kann sich Spracherkennung auf iPhone vorstellen
26.03.2008, Fortune
Wie Macnews.de berichtete, hat Tom Gibbson, Vice President Specialized Devices and Applications Group bei Micosoft, in einem Interview erklärt, dass es für sie sehr wichtig wäre zu verstehen, was man auf das iPhone bringe. Die Frage wäre, welche Funktionalität Mac-Office-Anwender auf dem iPhone benötigten. Mike McCue, der in Microsofts Abteilung der kürzlich übernommenen TellMe-Spracherkennungs-Software beschäftigt ist, wird dagegen noch konkreter: "Wenn es mit dem iPhone-SDK möglich ist, dann werden wir so schnell wie möglich eine Version von TellMe auf das iPhone bringen."
... mehr
Die Präsentation von Sprachapplikationen: ein Hochseilakt?
26.03.2008, VUI Blog
Wer jemals eine neue sprachaktivierte Interactive Voice Response-Applikation (IVR) präsentiert hat, wird sich sehr wahrscheinlich an den damit verbundenen Stress erinnern. Obwohl der beste Sonntagsanzug angelegt ist, eine aufwendige PowerPoint-Präsentation erstellt wurde, für den potenziellen Kunden eine Liste mit namhaften Kunden und Referenzen bereit liegt und die Sensibilität für spezifische Probleme dieses Kunden unter Beweis gestellt wurden, beginnt mit der Live-Demo der Applikation ein Drahtseilakt. Ein simples: „Es tut mir Leid, aber ich kann sie nicht verstehen“, genügt und der ganze gute Eindruck fällt in sich zusammen wie ein Kartenhaus – zumindest mag es sich für den Betroffenen in diesem Moment so anfühlen. Deshalb geben Dr. Ahmed Bouzid und Dr. Weiye Ma in ihrem VUI Post blog eine Liste mit Tipps, wie eine solche Situation vermieden oder zumindest abgemildert werden kann.
... mehr
W3C: Update der Speech Synthesis Markup Language (SSML) v1.1 veröffentlicht
26.03.2008, VOICE Community
Die Voice Browser Working Group des World Wide Web Consortiums hat eine aktualisierte Fassung der Speech Synthesis Markup Languange Version 1.1 veröffentlicht. Die SSML wurde entwickelt, um mit einer umfassenden, XML-basierten Auszeichnungssprache die Generierung synthetischer Sprache im Web und anderen Anwendungen zu unterstützen. Die aktuelle Version zielt vor allem auf die Internationalisierung der SSML ab, damit auch Sprachen wie Chinesisch, Japanisch und Indisch Berücksichtigung finden.
... mehr
Mit Sprache ins Social Network
26.03.2008, Speech Technology Magazine
Utterz, Anbieter eines Dienstes, der Nutzern die Verbindung zu Social Websites via Handy ermöglicht, gab kürzlich neue Verbindungsmöglichkeiten zu YouTube, LiveSpaces, Drupal, Yahoo!Groups und Twixter bekannt. Diese sollen zusätzlich zu den vorhandenen Verbindungen zu WordPress, Blogger, TypePad, Twitter, Tumblr, Flickr, LiveJournal und Facebook möglich sein. Nutzer des Dienstes können Sprachnachrichten, Videos, Bilder oder Text direkt an die entsprechende Social Site übermitteln. Auch ist es möglich, eine Sprachnachricht aufzusprechen, die dann als Text in den eigenen Blog hochgeladenen wird. Aus allen Interaktionen innerhalb von zehn Minuten kann der Dienst zudem einen zusammenhängenden Eintrag erzeugen.
... mehr
Telephonetics VIP startet spezielle Voice Self Service-Lösungen für lokale Verwaltungen
26.03.2008, PR-USA
Telephonetics VIP hat eine Palette sprachbasierter Lösungen speziell für den öffentlichen Sektor entwickelt. Mithilfe der Dienste können Bürger auf Informationen zugreifen, Feedback zu vorhandenen Diensten hinterlassen und Zahlungen vornehmen. Um die vorhandenen Dienstleistungen im öffentlichen Sektor auszuweiten und zu verbessern, ermöglichen die Lösungen außerdem 24 Stunden am Tag Erreichbarkeit, erledigen Anfragen stets höflich und stellen Agenten frei, um komplexe Anliegen zu bearbeiten.
... mehr
Wearable Computing dirigiert Feuerwehrleute und leitet Blinde
19.03.2008, Computerzeitung
Die Feuerwehrleute der Zukunft haben Sensoren in den Stiefeln und Mikrodisplays im Schutzhelm, auf denen Navigationshilfen erscheinen. Die Technik Lifenet für dieses Szenario, das in Frankreich angetestet worden ist, stammt aus dem EU-Projekt Wear-IT-at-Work. Koordiniert wird das Wearable-Computing-Projekt von der Uni Bremen aus. Lifenet ist einer der Ansätze, Computersysteme in oder an der Kleidung zu integrieren oder an ihr zu befestigen: Das Gesamtprojekt hat 42 Partner und ein Volumen von 23,7 Millionen Euro plus weiterer 14,6 Millionen weiterer externer Mittel. Seine drei Säulen sind der Support von Navigation und Lokalisierung, kontextsensitive Dienste sowie ein erweitertes Kommunikationsmodell. Bei letzterem geht es um die kontinuierliche Verbindung zwischen dem einzelnen Feuerwehrmann und damit einer ständigen Datenanbindung.
... mehr
Averbis Sprachtechnologie macht medizinischen Fachjargon für Laien verständlich
19.03.2008, VOICE Community
Die Financial Times Deutschland hat beim diesjährigen Wettbewerb "Ideenpark Gesundheitswirtschaft" in Berlin die Suchsoftware "Averbis Search Platform" ausgezeichnet. Prämiert wurde ein innovatives Suchverfahren, mit dem das Auffinden medizinischer Informationen vereinfacht und Fachsprache durch allgemeinverständliche Worte ergänzt wird. Die Sprachtechnologie basiert auf morpho-semantischer Indexierung (MSI), einem Verfahren, das medizinische Texte analysiert, relevante Textpassagen herausfiltert und sie mit Wörtern gleicher Bedeutung vernetzt.
... mehr
Avaya bringt Unified Communications-Lösungen ab 15 Cent je Nutzer und Tag auf den Markt
19.03.2008, Public Technology
Avaya, weltweit führender Anbieter von Anwendungen, Systemen und Dienstleistungen im Bereich Business Communications, stellt sechs neue Unified Communications-Lösungen vor, die auf den Einsatz in Unternehmen unterschiedlicher Größen zugeschnitten sind. Damit können diese schnell und ohne großen Verwaltungsaufwand Filialen, Heimarbeiter und mobile Mitarbeiter in die Kommunikationsinfrastruktur integrieren und so ihre Kundenansprache verbessern. Mit einem Einstiegspreis ab 15 Cent pro Anwender und Tag gehören die Lösungen zu den derzeit günstigsten im Markt. So erzielen Unternehmen mit geringem finanziellem Aufwand eine hohe Wertschöpfung.
... mehr
Das Ende der IVR-Menüs?
19.03.2008, Speech Technology Magazine
Fonolo, ein Unternehmen aus Toronto, gab unlängst das Ende seiner Beta-Tests eines neuen Dienstes bekannt, der den telefonischen Kontakt zu Großunternehmen schneller und weniger frustrierend machen soll. Der „Deep Dialing“ genannte Dienst legt sich automatisch über das Interactive Voice Response (IVR) System eines Unternehmens, erzeugt ein virtuelles Transkript des IVR-Skriptes, das auf dem Display des Anrufers dargestellt wird. Nutzer des Dienstes beginnen auf der Internetseite von Fonolo nach dem gewünschten Unternehmen zu suchen und wählen am Bildschirm eines Computers oder ihres Handys einen beliebigen Kontaktpunkt aus. Fonolo ruft sodann das Unternehmen an, navigiert das IVR und stellt, sobald der gewünschte Kontaktpunkt erreicht ist, eine Verbindung zum Nutzer her.
... mehr
Geheim(e)-Agenten
12.03.2008, Speech Technology Magazine
Das aus Seattle stammende Unternehmen Spoken Communications hat einen Versuch unternommen, sich eine Nische im hart umkämpften Contact Center Markt zu sichern. Ein agentenunterstütztes Interactive Voice Response (IVR) System verspreche laut Unternehmensangaben eine Fallabschlussrate von 70% und eine um das Vierfache gesteigerte Agentenproduktivität. Möglich werde das, indem Agenten gleichzeitig in mehreren eingehenden Anrufen mithören, was die Anrufer als Grund ihrer Anfrage nennen, und sie an die Erfolg versprechendste Abteilung weiterverbinden. Doch Kritiker sehen in der Verbindung aus Automatisierung und Agenteneinsatz nur eine Behelfslösung, die die tatsächlichen Probleme von IVR-Systemen ignoriere.
... mehr
Automatisiertes Outbound Dialling
12.03.2008, Call Centre Clinic
Gerade einmal 25% der Arbeitszeit von Outbound-Agenten entfallen tatsächlich auf die Gesprächszeit mit Kunden. Den Rest verbringen sie mit dem Wählen von Telefonnummern, dem Hören von Frei- oder Besetztzeichen und automatischen Anrufbeantwortern, sagt Dawn Wood, Business Unit Executive bei ATIO. Automatisiertes Outbound Dialling eigne sich besonders für große Anrufvolumina und erhöhe die Effektivität und Produktivität der Agenten erheblich. Laut einer Studie von Gartner führe der Einsatz sogar dazu, dass sich die reine Gesprächszeit auf bis zu 70% der Arbeits erhöhe.
... mehr
Loquendo TTS in Saltillo ChatPC-4
12.03.2008, Speech Technology Magazine
Saltillo, Anbieter von Kommunikationsgeräten für Gehörgeschädigte, setzt auf Loquendo Embedded TTS in seiner neuen ChatPC-4 Produktlinie. ChatPC-4 richtet sich an Menschen, die ihre natürliche Stimme nicht nutzen können und unterstützt sie mit synthetischer Stimmerzeugung. Es beinhaltet PalmChat, ein wortbasiertes Vokabular mit dessen Hilfe Wörter und Phrasen durch Knopfdruck generiert werden können. ChatPC wurde erstmals 2000 vorgestellt und basiert auf einem Pocket PC, wodurch Anwender auch Pocket PC-Anwendungen wie Pocket Word und Pocket Excel nutzen können.
... mehr
Roboter richtig erziehen
12.03.2008, media.NRW
Beim Lernen spielt der aktive Einfluss der Umwelt eine zentrale Bedeutung - und das nicht nur beim Menschen. Im Rahmen des Europäischen Forschungsprojekts "ITALK" werden Forscher aus Bielefeld jetzt bei der "Erziehung" von Robotern mit einer Million Euro unterstützt. ITALK steht für "Integration and Transfer of Action and Language Knowledge" und hat eine Laufzeit von vier Jahren. Von den insgesamt sechs Millionen Euro für das Projekt geht mehr als eine Million nach Bielefeld. ITALK hat das Ziel, "künstliche physikalische Agenten", also Roboter, zu entwickeln, die komplexes kognitives und sprachliches Verhalten in sozialer Interaktion mit Menschen lernen. Hier wird an das natürliche Verhalten von Erwachsenen ihren Kindern gegenüber angeknüpft.
... mehr
Fenestrae zertifiziert die Dialogic Media Gateway Serie
12.03.2008, VOICE Community
Dialogic gab die Zertifizierung der Dialogic Media Gateways durch Fenestrae, einen führenden Softwareanbieter und Microsoft Goldpartner, bekannt. Die Auszeichnung gilt für die Produkte Fenestrae Communication Server und Fenestrae Faxination Server. Nach erfolgreichem Abschluss der Testreihe hat Fenestrae soeben die Kompatibilität der Dialogic 3000 und 4000 Media Gateways (DMG3000, DMG4000) zu seinen Produkten bestätigt. Beide Unternehmen haben ihre Produkte in enger Abstimmung mit der Unified Communications-Plattform von Microsoft entwickelt.
... mehr
Nuance auf der CeBIT: breite Poduktpalette zum Suchen und Finden
05.03.2008, VOICE Community
Nuance präsentiert auf der diesjährigen CeBIT gleich mehrere Produktneuheiten: Das in den NAVIGON 8110 integrierte "Voice Recognition Pro" ist die erste Implementierung von Nuance VoCon 3200 mit "Single Confirmation Address Entry", einer neuen Funktion, mit der Anwender die vollständige Zieladresse - Ort, Straße und Hausnummer - mit einem einzigen Sprachbefehl eingeben können. Die neue mobile Suchlösung T9 Nav ermöglicht dem Anwender, mit nur wenigen Tastenbefehlen schnellen Zugang zu allen Funktionen, Anwendungen und Inhalten seines mobilen Endgerätes zu erhalten. Und mit der Natural Language Speech Suite präsentiert Nuance ein neues Softwarepaket für die Automobil-Branche: Die integrierte, gebrauchsfertige Sprachanwendung beschleunigt mit innovativen Funktionen die Markteinführung von neuen Produkten und senkt die Entwicklungskosten für OEM-Kunden.
... mehr
Alcatel-Lucent auf der CeBIT: Lösungen für konvergente Netze und geänderte Anforderungen
05.03.2008, VOICE Community
Unter dem Motto "Transforming Communications" stellt Alcatel-Lucent auf der CeBIT 2008 Lösungen für die Umgestaltung von Netzen, Diensten und Unternehmensprozessen vor. Gleich mehrere Trends machen einen Umbau der Netze notwendig: Informationstechnologie und Telekommunikation wachsen genauso zusammen wie Festnetz und Mobilfunk oder Endgeräte wie Fernseher und Handy. Der Siegeszug des IP-Protokolls in den Telekommunikationsnetzen bietet für Netzbetreiber die große Chance, verschiedene Dienste kostengünstig auf einer gemeinsam genutzten Technikplattform zu integrieren. Der Anwender wiederum kann immer häufiger mobile und interaktive Dienste nutzen, z.B. Weblogs und Wikis. Alcatel-Lucent stellt in Halle 12, Stand B 30 aus.
... mehr
Start der 22 868 n-tv videonews kompakt
05.03.2008, VOICE Community
Der Nachrichtensender n-tv und aperto move bieten zum Start der CeBIT einen neuen Mobilfunkservice an: Ab sofort kann man sich die aktuellen n-tv-Kompakt-Sendungen aus den Bereichen Nachrichten, Wirtschaft und Wetter per Videoanruf jederzeit auf das Handy holen. Und so funktioniert’s: Um die „n-tv Videonews kompakt“ zu erhalten, genügt ein Videoanruf an die 22 868 – vom Handy aus, ohne Vorwahl über alle deutschen Mobilfunknetze. Die Übertragung der Videos erfolgt per UMTS. Auf nicht videotelefonie-fähigen Endgeräten können die Meldungen alternativ mittels normalem Sprachanruf der 22 868 als Audioservice abgerufen werden. Die Installation einer zusätzlichen Software ist dazu in beiden Fällen nicht nötig.
... mehr
Fragen Sie doch VoiceBot!
05.03.2008, VOICE Community
Mit VoiceBot stellt der Münchner Voice Portal-Spezialist CreaLog jetzt erstmals eine Lösung vor, die zur Realisierung natürlichsprachlicher Informations-, FAQ- und Chat-Systeme am Telefon dient. Die speziell für VoiceBot realisierte neue Sprachdialog-Logik macht es möglich, auch frei und unscharf formulierte Fragen des Anrufers am Telefon zu analysieren und sofort die passende Antwort zu geben. Beim automatischen Helpdesk des Netzproviders z.B. erkennt VoiceBot die wichtigen Schlüsselwörter, analysiert so das Problem des Handy-Nutzers und nennt ihm gleich hilfreiche Tipps zur MMS-Benutzung o.ä.
... mehr
Intelligentes Wissensmanagement durch semantische Technologien
05.03.2008, VOICE Community
Ein effizientes Wissensmanagement wird für die Wettbewerbsfähigkeit von Unternehmen zunehmend wichtiger. Wachsende Bedeutung gewinnen dürften dabei so genannte semantische Technologien. Sie ermöglichen, Wissen automatisch zu interpretieren sowie daraus neues Wissen abzuleiten. So gehen Methoden und Verfahren weit über die herkömmliche Speicherung und Verwaltung von Daten hinaus. Und nicht die Daten alleine stehen im Vordergrund, sondern ihre Bedeutung und ihr Zusammenhang. Versteckte Zusammenhänge zum Beispiel werden durch Schlussfolgerungen automatisch erschlossen und übersichtlich visualisiert.
... mehr
Eine Stimme für die Stimmlosen
05.03.2008, Speech Technology Magazine
Ambient hat sein neues Produkt Audeo erstmals öffentlich präsentiert, das stimmlose Kommunikation via Telefon oder Face-to-Face ermöglichen soll. Audeo richtet sich an Menschen, die ihr Sprachvermögen z.B. durch eine Krankheit oder Verletzung verloren haben. Ein Sensor, den der Benutzer wie ein Collier am Hals trägt, erkennt die neurologischen Impulse, die das Gehirn an die Stimmbäder sendet. Diese werden zu digitalen Informationen transformiert und können dann als synthetische Sprache ausgegeben werden. Während der Präsentation führte Ambient CEO und Mitbegründer Michael Callahan eine stimmlose Konversation mit Mike Hames, Senior Vice President für Applikationsspezifische Produkte bei Texas Instruments.
... mehr
Neuer Datamonitor/Genesys/Nuance Webcast: Putting “Care” Back Into Customer Care
25.02.2008, VOICE Community
In diesem on-Deman Webcast erläutern die Top-Analysten von Datamonitor und gleich zwei Hochkaräter der Sprachtechnologiebranche, wie personalisierter, sprachaktivierter Customer Self Service dazu beiträgt, die Kundenzufriedenheit zu steigern, Kosten zu reduzieren und Contact Center zu optimieren. Die Unternehmenslösungen von Genesys und Nuance unterstützen Contact Center, Kundenanfragen schnell, unkompliziert und kostengünstig zu beantworten. Interessenten können sich den Webcast nach einer einmaligen Registrierung beliebig oft ansehen und erhalten als Bonus noch die im Webcast verwendeten Präsentationen der Unternehmen.
... mehr
Automatic Password Reset von Nuance stärkt Mitarbeiter und entlastet IT-Abteilungen
25.02.2008, VOICE Community
Nuance hat sein Automatic Password Reset Modul vorgestellt, das einfache Anfragen an IT-Helpdesks automatisieren und dadurch die Produktivität der Mitarbeiter erhöhen soll. Das Ändern von Passwörtern ist mittlerweile die häufigste Kontaktursache in Unternehmens-Helpdesks und kostet diese laut einer Gartner-Analyse durchschnittlich $10 - $20 pro Anruf. Mithilfe des neuen Moduls von Nuance können Mitarbeiter Password Resets und Änderungen für jedes Gerät und jede Anwendung mit Netzwerkanbindung über das Telefonsystem des Unternehmens vornehmen – nur mit ihrer Stimme. Das neue Modul nutzt Stimmbiometrie, um die Anrufer sicher zu identifizieren, und erlaubt die vollständige Passwortverwaltung am Telefon.
... mehr
CeBIT 2008: Sprechende Lego-Roboter für Schulen
25.02.2008, Informationsdienst der Wissenschaft
Die Roboter von Lego Mindstorms können sich nicht nur bewegen und über verschiedenen Sensoren ihre Umgebung wahrnehmen. Wissenschaftler der Universität des Saarlandes haben ihnen auch das Sprechen beigebracht und dafür ein einfach zu bedienendes Sprachdialogsystem entwickelt, das sich besonders für den Schulunterricht eignet. Am Stand der Universität des Saarlandes (Halle 9, Stand B 35) zeigen die Saarbrücker Computerlinguisten, wie man mit Hilfe der sprechenden Roboter auf spielerische Weise moderne Sprachtechnologie vermitteln kann. Die Schüler erfahren dabei, dass man mit Computern nicht nur über Tastendruck, sondern ganz natürlich über Sprache kommunizieren kann. Die bei den Lego-Robotern eingesetzte Sprachsteuerungssoftware "Dialog OS" stammt von der CLT Sprachtechnologie GmbH, einem Spin-off-Unternehmen der Universität des Saarlandes.
... mehr
Intelligente Benutzerschnittstellen - Sprechen Sie mit Ihrem iPod
25.02.2008, Informationsdienst der Wissenschaft
Der Forschungsbereich "Intelligente Benutzerschnittstellen" präsentiert auf der CeBIT 2008 ein neuartiges Interaktionssystem, das die gleichzeitige Verarbeitung von gesprochenener Sprache und Zeigegesten verarbeitet. Dieses multimodale Interaktionssystem, auf das sowohl die Anwendung "BabbleTunes" als auch die Bedienschnittstelle "i2home" aufsetzt, basiert auf dem sogenannten ODP-Framework (Ontology-based Dialogue Platform). "BabbleTunes" ist eine multimodale Anwendung, mit dem eine intuitive, sprachzentrierte Bedienung des Apple iPods realisiert wird. Es ermöglicht die Bedienung mittels natürlich-sprachlichen Äußerungen und über Touchscreen oder Tasten. Ziel des Projekts "i2home" ist es, eine offene, standard-basierte Plattform zu realisieren, die es ermöglicht, mit beliebigen Geräten und Diensten im häuslichen Umfeld (DVD-Player, Fernseher, Klimaanlage etc.) über eine zentrale Bedienschnittstelle zu interagieren.
... mehr
Ist Shoot & Translate von Linguatec die Revolution der Übersetzungsdienste?
25.02.2008, Inar.de
Eine Weltneuheit will der Sprachtechnologie-Experte Linguatec auf der CeBIT 2008 in Hannover präsentieren: Shoot & Translate, eine Übersetzungssoftware für Handys und Smartphones, die sich die eingebaute Kamera und den Internetzugang moderner Mobiltelefone zunutze macht. Das Prinzip ist einfach: Foto vom Text schießen, versenden und übersetzen lassen. Das Handy als unverzichtbares Gerät wird so zu einem Dolmetscher, der immer dabei ist. Shoot & Translate liest auf Knopfdruck mittels optischer Spracherkennung (OCR) Texte auf dem Foto und sendet sie anschließend zur Übersetzung an Linguatec. Die Übersetzungstechnologie Personal Translator der Münchener Firma soll umgehend Ergebnisse liefern, die man sich sogar vorlesen lassen kann.
... mehr
Lügendetektoren erkennen Sozialbetrüger
25.02.2008, Silicon
Das Harrow Council in London hat nach eigenen Angaben durch ein ‘Voice Risk Analysis (VRA)’ genanntes System über £300.000 eingespart und 43 unzulässige Zahlungen stoppen können. Das System wird derzeit von zwölf englischen Gemeinderäten eingesetzt und analysiert den Stressfaktor von Anrufer, die u.a. Informationen zu Transferleistungen geben oder Anträge stellen. Mögliche Faktoren sind dabei minimale Sprechverzögerungen und Unterschiede in den gegebenen Antworten. Seit der Einführung des Systems im letzten Mai sollen mehr als ein Viertel aller Leistungsbezieher keinen Neuantrag gestellt haben – mehr als doppelt so viele wie normal.
... mehr
Zugang zu Contact Center-Daten: jederzeit, an jedem Ort
25.02.2008, Speech Technology Magazine
Der Bedarf nach unmittelbarem Zugriff auf Unternehmensdaten macht auch vor Contact Centern nicht halt. Eine Lösung bietet jetzt etalk mit Qfiniti Web Access. Das Thin-Client User Interface erlaubt den Remote-Zugriff auf die Intelligent Contact Center Suite von etalk und unterstützt Such- und Playback-Funktionen von Sprach- und Screen-Aufnahmen. Auch Leistungsbewertungen von Agenten werden unterstützt Root-Cause Analysen. Notwendig ist lediglich ein Standard-Webbrowser und ein Internetanschluss.
... mehr
Neues Genesys Whitepaper in der VOICE Community: The Customer Front Door – Thought Leadership Paper
20.02.2008, VOICE Community
Was genau ist die “Customer Front Door” und warum ist sie so wichtig? Die meisten Kunden erhalten ihren ganz persönlichen „Ersten Eindruck“ von einer Firma, wenn Sie diese „Front Door“ betreten - in den meisten Fällen eine Website, eine eMail, eine Textnachricht (SMS); oder eben ein Telefonanruf im Contact Center. Doch die Wichtigkeit des ersten Eindrucks bleibt. Genesys erläutert in diesem Whitepaper den aktuellen Stand im Customer Service, wie Sprachtechnologien sich auf Kundenbeziehungen auswirken und wie einige Unternehmen bereits erfolgreich kombinierte Lösungen aus Automatisierung und Agentenunterstützung umgesetzt haben. Lesen Sie mehr im vollständigen Whitepaper in der Bibliothek der VOICE Community!
... mehr
Neues Enterprise Express Speech System von Nuance überzeugt Anwender
18.02.2008, VOICE Community
Das neue Dictaphone Healthcare Solutions Enterprise Express Speech System konnte in den letzen drei bis sechs Monaten erfolgreich bei mehreren Kunden implementiert werden, so Nuance. Das Feedback der ersten Kunden der sprachunterstützten Transkriptionslösung zeige, dass Diktationsvolumina um bis zu 90% gestiegen seien (im Vergleich zu traditionellen Diktations-/Transkriptionslösungen) und gleichermaßen die Usability und Erstellungsgeschwindigkeit von medizinischen Berichten gestiegen seien, während die Fehlerquote sich reduzierte.
... mehr
SNT Multiconnect bietet Rufnummernübermittlung für Outbound-Kampagnen
18.02.2008, VOICE Community
SNT Multiconnect bietet ab sofort die technische Plattform zur Rufnummernübermittlung bei Outbound-Kampagnen. Aktuell diskutieren Verbraucherschützer, Politiker und Call Center Verbände eine Gesetzesvorlage, die unter anderem ein Verbot der Rufnummernunterdrückung bei Outbound Calls beinhaltet. Mit der Lösung von SNT Multiconnect können Unternehmen die Forderungen von Politik und Verbrauchern nach einer transparenteren Gestaltung von Werbeanrufen bereits heute erfüllen. Über die angezeigte Rückrufnummer kann Kontakt mit dem für die Outbound-Kampagne verantwortlichen Unternehmen oder Diensteanbieter aufgenommen werden. Unternehmen, die transparent ihre Rufnummer übermitteln, profitieren von einem höheren Vertrauen der Verbraucher und erzielen höhere Erfolgsquoten.
... mehr
Der Voice Reader Web vertont Webseiten
18.02.2008, Inar.de
Linguatec präsentiert mit Voice Reader Web einen neuen Internetdienst für das dynamische Vertonen von Webseiten. Über einen einfachen Link können Besucher von Webseiten sich deren Inhalte "on demand" anhören und sie sogar als MP3 downloaden. Die Audio-Dateien müssen dazu nicht auf dem Server abgespeichert werden und erfordern keinerlei administrative Pflege. Der Aufwand zur Integration der Vorlesefunktion auf den Seiten ist minimal: Über ein Webformular kann der Webmaster selbst die gewünschten Einstellungen vornehmen, es muss keinerlei Software auf dem Server installiert werden. Sowohl die manuelle Erstellung der MP3-Dateien als auch die Notwendigkeit ihrer Verlinkung entfallen. Dem Besucher der Seite präsentiert sich Voice Reader Web als ein dezenter Vorlese-Link, der bei Bedarf angeklickt wird und dann augenblicklich die dynamisch erzeugte Audio-Datei im Browser abspielt.
... mehr
See'N'Search von Samsung vereint TV und Internetanschluss
18.02.2008, Satundkabel.de
Der südkoreanische Hersteller Samsung will dem Internet im Wohnzimmer mit einer innovativen digitalen Settop-Box fürs Fernsehen auf die Sprünge helfen. Der Anbieter stellte am Mittwochabend (Ortszeit) in New York ein Gerät vor, das mit einer "See'N'Search" getauften Technologie ausgestattet ist: Diese analysiert neben Programminformationen auch Untertitel sowie den Videotext und arbeitet mit einer rudimentären Spracherkennung, um relevante Stichwörter einer laufenden Sendung herauszufiltern. Im Hintergrund sammelt die Box dann weiterführende Informationen über entsprechende Internet-Links und stellt diese auf Knopfdruck ("More Info") auf dem Bildschirm dar.
... mehr
QSC AG stellt VirtuOS ACD vor
20.02.2008, Portel.de
QSC stellt mit VirtuOS ACD eine professionelle netzbasierte Call-Management-Lösung vor. VirtuOS ACS erlaubt über das Next Generation Network der QSC sowohl die nahtlose Einbindung klassischer Festnetztelefonie als auch kostengünstiger Voice over IP-Telefonie sowie die Integration von Mobilfunkanschlüssen. Die Software-Lösung verfügt über Schnittstellen zu führenden CRM-Systemen inklusive automatisierter Datenbankabfragen zur Identifizierung und Klassifizierung von Anrufen, bietet natürliche Spracherkennung (Automated Speach Recognition), Wartezeitansage und einen integrierten Interactive Voice Responder (IVR), mit dem Anrufer über ein Sprachmenü Aufträge erteilen oder Informationen abfragen können.
... mehr
Falk integriert Nuance-Sprachtechnologie
11.02.2008, VOICE Community
Falk hat sein neues Navigationsgerät Falk N240L Europe mit Nuance-Sprachtechnologie ausgestattet. Dieses neue Modell setzt mit der Sprachtechnologie von Nuance darauf, Fahrzeugführern eine neue Dimension der sicheren und bequemen Navigation zu erschließen. Die Version Falk N240L Europe ist bereits europaweit im Fachhandel erhältlich. Der Nutzer kann einfach per Sprache ein Ziel eingeben oder Steuerbefehle über das Menü tätigen. Menüfunktionen wie Zieleingabe, letzte Ziele, Favoriten und Umkreissuche nach Sonderzielen können bequem per Stimme aufgerufen werden. Die Funktion der gesprochenen Zieleingabe ist in deutsch, englisch, französisch, italienisch, spanisch und niederländisch möglich.
... mehr
CreaLog entwickelt Preis-Check per Telefon für 'billiger.de'
11.02.2008, VOICE Community
Erfahrene Online-Shopper nutzen immer häufiger den Service von Internet-Portalen, um sich im World Wide Web über die Preise unterschiedlichster Anbieter zu informieren. Das Karlsruher Portal ‚billiger.de’, einer der größten deutschen Anbieter, hat dieses Prinzip nun auf eine automatisierte telefonische Auskunft übertragen. Sein neuer Service „Preis-Genie“ kann mit jedem Telefon bzw. Handy genutzt werden. Basis des Dienstes ist eine moderne Voice Portal-Technologie, die den Anrufer durch den Telefon-Dialog führt. Das System verfügt über ‚natürlichsprachliche’ Spracherkennung, die eine große Anzahl von Wörtern und ganzen Sätzen erkennen und intelligent verarbeiten kann. Es weiß zum Beispiel genau, dass Plasmafernseher und Plasma TV identisch sind und zur Kategorie ‚Fernseher’ gehören.
... mehr
Microsoft ergänzt Videoangebot um Kontexterkennung
11.02.2008, Speech Technology Magazine
Auf seinem vierten jährlichen DemoFest stellten die Microsoft adCenter Labs eine neuartige Targeted Advertising-Option für Online-Multimediaangebote vor, die Werbeeinblendungen nach Auswertung einer Kontextanalyse von Videoinhalten platziert. Diese Kontexterkennung nutzt Spracherkennung, um die gesprochenen Inhalte von Videos zu analysieren und passend zu behandelten Themen Werbebanner o.ä. einzublenden. Arun Surendran, Senior Applied Researcher in den adCenter Labs erläuterte die Funktion der Technologie anhand eines Videos auf YouTube. Mithilfe einer zusätzlichen „lexikalischen Analyse“, die die Pausen in den Gesprächen erkennt, verstehe die Technologie sogar, wenn das Thema oder ein Sprecher wechsle.
... mehr
Dialogic erweitert Multimediaplattform um neue Videofunktionalitäten
11.02.2008, VOICE Community
Dialogic hat die erweiterte Version der Dialogic Multimedia Plattform (MMP) 2.0 for AdvancedTCA (ATCA) mit zusätzlichen Funktionalitäten für die Videoverarbeitung bekannt gegeben. MMP for ATCA unterstützt Dialogic Kunden beim Einsatz von Videodiensten der ‚nächsten Generation‘. Hierbei kann es sich um Advanced IVVR-Lösungen (Interactive Voice Video Response), videobasierte Lösungen für Callcenter/Conferencing/Chat für 3G-Wireless- sowie Breitband-IP-Netzwerke handeln. MMP Software 2.0 ist eine skalierbare und kosteneffiziente Multimedia verarbeitende Plattform zur Entwicklung und Umsetzung von Applikationen, videofähigen Lösungen sowie Video-Gateways für drahtlose und fixe Netzwerke. Das Produkt wurde entsprechend den Anforderungen von Telekommunikationsausrüstern (Telecom Equipment Manufacturers, TEMs) im Carrier-Umfeld konzipiert und wird für die Realisierung von Lösungen der nächsten Generation im IP Multimedia Subsystem (IMS) eingesetzt.
... mehr
Effizientes Coaching mit automatisierter Gesprächsanalyse
12.02.2008, VOICE Community
Almato stellt auf der Call Center World 2008 seine neueste Lösung almato wordSPOT vor. Hierbei handelt es sich um ein integriertes Spracherkennungstool, das die Inhalte von Gesprächen auf Basis intelligenter Spracherkennungstechnologie von Com Vision analysiert. Die Erkennungs-Software AudioClipping von Com Vision ist spezialisiert auf Aussagen so genannter „nicht-kooperativer“ Sprecher, d. h. individuelle Begriffe werden unabhängig vom Sprecher erkannt. Für den Coach ist auf Knopfdruck sichtbar, welche Gespräche wichtige Vorgaben erfüllen oder kritische Themen beinhalten. Die gemeinsame Lösung unterstützt die Teamleiter der Contact Center beim Monitoring und der Sicherung der Kommunikationsqualität. Durch zeitnahes und individuelles Feedback erhöht sich der direkte Lernerfolg der Kundenberater.
... mehr
SpinVox bietet UC-Dienst
13.02.2008, Speech Technology Magazine
Obwohl sich das Unternehmen bisher stärker auf Speech-to-Text-Dienste (STT) konzentriert hatte, gab SonVox nun mit der Veröffentlichung von „CallMail“ für Call Center und „Enterprise Voicemail“ für KMUs seinen Einstieg in den Unified Communications (UC) Bereich bekannt. Beide Dienste setzen auf das Voice Message Conversion System (VMCS) von SpinVox, das Sprachnachrichten in Text umwandelt und diese via eMail an PCs und PDAs oder via SMS auf Handys versendet. Voicemail konsolidiert zusätzliche alle eingehenden Sprachnachrichten unabhängig davon, auf welchem Wege sie eintreffen: über Festnetz, Mobilnetze oder Softphones.
... mehr
Deutsche Telekom bietet Kundenidentifikation durch Stimmerkennung
06.02.2008, VOICE Community
Mit VoiceIdent gehören Passwörter und PIN-Nummern ab sofort der Vergangenheit an. Das innovative Produkt der Deutschen Telekom ermöglicht den Zugang zu Diensten und Leistungen über die Authentifizierung mit der persönlichen Stimme. Alles, was der Kunde dafür tun muss, ist, einen einmaligen Registrieranruf zu tätigen, mit dem seine Stimme als biometrische Größe analysiert und ein so genannter kodierter Stimmabdruck erstellt wird. Einmal als Datensatz erfasst, wird seine Stimme dann zum Schlüssel für Online-Banking, Teleshopping-Services oder Mehrwertdienste. Die Zuverlässigkeit von VoiceIdent hat das Bundesamt für Sicherheit in der Informationstechnik (BSI) bestätigt und für den neuen Dienst der Deutschen Telekom ein Sicherheitszertifikat ausgestellt.
... mehr
D+S auf Condors Schwingen
06.02.2008, VOICE Community
D+S solutions hat im Auftrag der Fluggesellschaft Condor ein Sprachportal für die automatisierte Flugrückbestätigung entwickelt. Hintergrund ist, dass in einigen Urlaubsdestinationen individuell reisende Gäste im Gegensatz zu Pauschalreisegästen eine Bestätigung ihrer Flugdaten vor dem Rückflug einholen müssen. Die Telefonate erfolgen aus verschiedenen Zeitzonen und rund um die Uhr. Für die Umsetzung einer Service-Center Lösung entschied man sich für D+S solutions, da die Firma mit ihren bestehenden Travel-Portal-Suite-Standardmodulen eine maximale Kundenakzeptanz nachweisen konnte. Darüber hinaus konnte D+S solutions als Komplettanbieter sowohl die notwendige Anpassung an die Condor-IT-Systeme als auch den externen Betrieb des Sprachportals anbieten.
... mehr
Prosodie und Voice.Trust stellen Sprachauthentifizierung vor
06.02.2008, VOICE Community
Prosodie hat seine neue Sprachauthentifizierungslösung vorgestellt. Die auf der Voice.Trust-Technologie basierende Lösung erfüllt die Anforderungen der Unternehmen in dreifacher Hinsicht: Schutz der Informationen, Reduktion der operativen Kosten und automatische Verfügbarkeit von neuen Mehrwertservices. Die in Prosodies VXML-Plattform integrierte Stimmprofil-Technologie verwendet die Voice.Trust Server 5.0 Suite. Deren sichere Sprecherauthentifizierung ebnet den Weg für automatisierte Self-Service-Anwendungen, die benutzerfreundlich sind und Sicherheit sowie Kosteneffizienz bieten. Der Voice.Trust Server fungiert dabei als zentrales Authentifizierungs-Gateway für alle sicherheitsrelevanten Prozesse.
... mehr
Loquendo ASR 7.5 auf dem Markt
06.02.2008, VOICE Community
Loquendo hat kürzlich die neueste Version seiner Spracherkenner-Engine Loquendo ASR 7.5 für den Markt freigegeben. Zu den Neuerungen gehören erweiterte Leistungsfähigkeit im Umgang mit komplexen Grammatiken und großen Vokabularien, Unterstützung für Akustikmodelle mit 16 kHz, mehrsprachige Grammatiken, Timeouts für Äußerungen mit vorgegebener Größe und Länge (z.B. bei Kreditkartennummern) und verbesserte Erkennung in geräuschvollen Umgebungen. Die Summe dieser Neuerungen resultiere laut Loquendo in einer schnelleren, robusteren und effizienteren Spracherkennung.
... mehr
Voice für den ‘Super Tuesday’
06.02.2008, Speech Technology Magazine
Am “Super Tuesday”, dem 5. Februar, stellte die New Yorker Radiostation WNYC ihren Hörern einen besonderen Service zur Verfügung. Um die Aktivität seiner Hörerschaft zu heben, konnten Anrufer eine spezielle Nummer kontaktieren und Kommentare zur Vorentscheidung der US-Präsidentschaftskandidatur abgeben. Eine Speech-to-Text-Software von SpinVox sorgte dann dafür, dass die gesprochenen Kommentare in Text umgewandelt wurden, auf den die beiden Moderatoren John Hockenberry und Adaora Udoji zugreifen konnten.
... mehr
Vorsprung durch Technik
06.02.2008, bildungsklick.de
Digital publishing und ein Expertenteam des Lehrstuhls für Mustererkennung von der Friedrich-Alexander-Universität Erlangen-Nürnberg arbeiten von nun an gemeinsam an einem Forschungsprojekt, das die Verbesserung von technologiegestützten Aussprache- und Dialogtrainings zum Ziel hat. Das Projekt C-AuDiT, das Teil der HighTech-Innovationsoffensive des Bundesministeriums für Bildung und Forschung ist, startete zum 1. Januar diesen Jahres und verfolgt das ehrgeizige Ziel, bereits binnen zwei Jahren den Prototyp einer völlig neuartigen Spracherkennungstechnologie vorzustellen: Erstmals wird dann eine Sprachlernsoftware in der Lage sein, Einzelwörter hinsichtlich des Wortakzents, ganze Sätze bezüglich der Satzmelodie sowie die Aussprache auf Lautebene unter Verwendung des jeweiligen Kontextes verlässlich zu bewerten.
... mehr
Nuance veröffentlicht die Employee Productivity Suite
30.01.2008, VOICE Community
Nuance gab kürzlich die Veröffentlichung seiner sprachaktivierten Employee Productivity Suite (EPS) bekannt, einer Serie von Applikationen, die Auto-Attendant- und Verziechnisdienste-Funktionen mit Lösungen zusammenbringt, die die Unternehmenskommunikation, Geschäftsprozesse und Angestelltenproduktivität verbessern soll. EPS basiert auf dem Nuance SpeechAttendant und beinhaltet vier Kernmodule: Internal Dialer, Automated Password Reset, Emergency Notification und SpeechAttendant. EPS unterstützt die analoge, digitale und SIP-basierte Telefonie-Integration in eine Vielzahl führender PBX-Anlagen u.a. von Avaya, Cisco, Nortel etc. Ebenfalls kann die Lösung für den Anschluss via VoiceXML konfiguriert werden, um sie mit IVR-Plattformen führender Anbieter wie Genesys, Envox und Aspect zu verbinden.
... mehr
Envox 7.1 erhältlich
30.01.2008, VOICE Community
Envox 7.1, die nächste Generation der auf offenen Standards basierenden Entwicklungsplattfomr von Envox ist nach Unternehmensangaben ab sofort erhältlich. Die aktuelle Version unterstützt gleichsam herkömmliche wie auch IP-basierte Kommunikationsdienste, damit Unternehmen ihre Systeme auf einer einzigen Plattform kosteneffektiv standardisieren können. Mithilfe von Envox 7.1 können IVR-, IVVR-, Outbound Dialing-, multimodale Contact Center-, Video Customer Service- und Unified Communications-Lösungen entwickelt werden, die neben Sprachefunktionen auch Video Messaging, Streaming Video, Email, Fax und SMS enthalten.
... mehr
IVR- und VUI-Design Teil III: Seien Sie konsistent
30.01.2008, Angel.com
Im dritten Teil seines Weblogs empfiehlt Dr. Ahmed Bouzid, Leiter des Partnerships and Strategic Alliances Program bei Angel.com, Konsistenz im Umgang mit den Kunden. Nichts sei entnervender als eine irrationale Maschine. Jeder Moment einer Inkosistenz der Maschine wird den Nutzer verleiten zu fragen: „Warum verhält sich die Maschine so? Habe ich etwas falsch gemacht oder ist das System nur schlecht entwickelt?“ Dem Vertrauen des Anwenders, dass das System verlässlich ist und ihm helfen kann, kann eine solche Situation nur schaden.
... mehr
Avaya zertifiziert Gateway-Produkte von Dialogic
30.01.2008, VOICE Community
Dialogic bestätigt die Zertifizierung der Media Gateways – Dialogic 2000 Serie und Dialogic IMG 1010 – für die SIP-basierten (Session Initiation Protocol) IP-Telefonielösungen von Avaya. Unternehmen profitieren davon, da bestehende Netze mit der neuen Technologie erweitert werden können, ohne die existierende Infrastruktur austauschen zu müssen. Das Dialogic IMG 1010 ermöglicht die Anbindung einer Vielzahl von Telefonanlagen und Netzen an vorhandene Infrastrukturen. Das VoIP-Gateway bietet darüber hinaus die Unterstützung von Audiokonferenz-Anwendungen.
... mehr
Whitepaper von ‚Die Lautmaler’: Schnell und sicher ans Ziel – Der Weg zum effizienten Dialog
30.01.2008, VOICE Community
Die meisten Sprachdialogsysteme haben einen klaren Sinn und Zweck: Sie sollen dem Nutzer ermöglichen, Informationen abzurufen und Aufgaben zu erledigen und das so komfortabel wie möglich – also schnell und fehlerfrei. Doch Sicherheit und Schnelligkeit scheinen sich in der Praxis häufig auszuschließen. Auf der einen Seite steht der freie Dialog, der als besonders schnell und zielführend gilt, aber gewisse Risiken beinhaltet. Auf der anderen Seite steht der geführte Dialog, der sicher funktioniert, dafür aber starr und langwierig erscheint. Das vorliegende Paper analysiert die Stärken und Schwächen beider Ansätze und zeigt alternative Wege zu einer Dialogführung, die sowohl komfortabel als auch von Erfolg gekrönt ist.
... mehr
Betrieb und Design von IVRs
22.01.2008, Angel.com
Im IVR-Blog von Angel.com kommentiert David Tolliver einen Vorschlag aus dem Marketing Productivity Blog, die Best Practices aus 15 Jahren Web Usability Studien auch für telefonbasierte Applikationen anzuwenden. Tatsache ist, dass das Telefon nahezu vergessen worden ist, nachdem Webanwendungen sich bei den Anwendern durchgesetzt hatten. Bis heute sind jedoch viele Unternehmen zu der Einsicht gelangt, dass das Telefon auch weiterhin einen zentralen Kontaktpunkt zum Kunden darstellt, und versuchen den Stand der Web Usability Studien aufzuholen – doch das soll noch einige Zeit dauern.
... mehr
Fluencys Virtual Speech Agent erhält 'Avaya Compliant' Bewertung
22.01.2008, Call Centre Clinic
Fluency hat mitgeteilt, dass sein Schlüsselprodukt Fluency VSA den Kompatibilitätsnachweis für Avayas Voice Portal 4.0 erhalten hat. Die VSA Suite bietet eine Reihe von Pauschallösungen sowie maßgeschneiderten Sprachapplikationen, die von Call Centern weltweit eingesetzt werden und helfen, Kosten zu senken und die Effizienz im Tagesgeschäft zu steigern. Die Lösungen zeichnen sich durch die Einhaltung von Branchenstandards und die Kompatibilität mit zahlreichen bekannten auf Voice XML basierenden IVR-Plattformen.
... mehr
Avaya stellt Communication Manager 5.0 vor
22.01.2008, VOICE Community
Avaya stellt die neueste Version ihres IP-Kommunikations-Flagschiffs „Avaya Communication Manager“ vor. Die neue Version 5.0 bietet eine tiefere Integration des Session Initiation Protocol (SIP), um zum Beispiel die IP-Telefonie über SIP-Anbieter, Konferenzen sowie die Nutzung von Sprach-, Daten- und Video-Diensten besser zu nutzen. Mit der aktuellen Version führt Avaya erstmals ein Software-Maintenance-Modell ein. Damit erwerben Unternehmen das Anrecht, alle wichtigen Upgrades und Service-Packs über einen Zeitraum von drei Jahren automatisch zu erhalten und alle relevanten Innovationen innerhalb des Vertragszeitraumes jederzeit nutzen zu können.
... mehr
Doch Sprachfunktionen auf dem iPhone?
22.01.2008, Speech Technology Magazine
Wegen der fehlenden Sprachfunktionalitäten war das iPhone zumindest in der Sprachtechnologiebranche eher eine Enttäuschung. Doch was Apple nicht schaffte, bieten nun unabhängige Anbieter. Einer von ihnen ist Quicktate.com, ein webbasierter Service, der Speech-to-Text-Technologie nutzt, um Sprachnachrichten auf PDAs und Smartphones zu transkribieren. Auf der kürzlich stattgefundenen Macworld in San Francisco stellte das Unternehmen nun das Beta Release eines Dienstes speziell für das iPhone vor, mit dem Nutzer sich Sprachmeldungen als Text anzeigen lassen können. Der Dienst ist seit der Consumer Electronics Show in Las Vegas verfügbar und erste Reaktionen seien laut Firmenangaben „enorm“.
... mehr
IVR- und VUI-Design Teil II: Seien Sie clever!
16.01.2008, Angel.com
Im zweiten Teil seines Weblogs über IVR- und VUI-Design empfiehlt Dr. Ahmed Bouzid, Leiter des Partnerships and Strategic Alliances Program bei Angel.com, im Umgang mit dem Kunden „clever“ zu sein. Das sei der sicherste Weg, dem Kunden Respekt zu zollen und seinen Willen zur Mitarbeit zu gewinnen. Als Beispiele nennt Dr. Bouzid: Lernen Sie die Vorlieben und Vorkenntnisse Ihrer Nutzer kennen, berücksichtigen Sie die Anfragen Ihrer Nutzer und machen Sie Anfragespitzen ausfindig, um auf sie zu reagieren.
... mehr
Im Gesundheitswesen muss TTS nicht immer die erste Wahl sein
16.01.2008, Speech technology Magazine
Ungeachtet der wichtiger werdenden Rolle von Sprachtechnologie im Gesundheitssektor, gibt es weiterhin Anwendungsbereiche, in denen die menschliche Stimme probat wenn nicht sogar besser eingesetzt werden kann. Diesem Umstand widmet sich iReminder mit einer neuen Option seines Produktes „Compliance für Life“, einem elektronischen Erinnerungssystem, das es seinen Nutzern ermöglicht, Erinnerungsmeldungen z.B. für Medikamentierungen zu versenden. Die neue Option erlaubt das Versenden aufgenommener Sprachaufnahmen, damit Patienten durch die bekannte Stimme eines Angehörigen oder Freundes mehr Vertrauen schöpfen. Dieser Dienst war bisher ausschließlich in Form einer Text-to-Speech-Ausgabe (TTS) via Webinterface möglich.
... mehr
Dank neuer Voice Separation-Technologie von STEP Labs bald Spracherkennung in beliebigen Elektroprodukten?
16.01.2008, Marketwire
STEP Labs Inc. Bietet seit Kurzem eine patentierte Voice Separation-Technologie und einen professionellen Akustikdesign-Service zur Integration in kabellose Telekommunikationsprodukte sowie in Elektronikprodukte für den Endkundenmarkt an. STEP Lab hat dazu eine Technologie namens StepWare entwickelt, die die Qualität von Sprachsignalen verbessert, indem Störgeräusche wie Hintergrundstimmen und –geräusche, Maschinen- und Motorenlärm oder auch Windgeräusche isoliert werden. Nach ersten Implementierungen in Bluetooth-Headsets kann die neue Technologie in beliebige Elektronikprodukte integriert werden, auch in Mobilgeräte, Autos, Computer und Fernbedienungen.
... mehr
Sprachsteuerung für mobile Unternehmenskommunikation
16.01.2008, LANline
Mit dem Voicedirector Personal in der neuen Generation 4.0 führt Voicecom ihre Sprachsteuerungslösung fort. Das Komplettsystem wird laut Hersteller zum umfassenden Dienstleister für mobile Mitarbeiter. Der Kontaktaufbau zum System soll von jedem Telefon durch einen einfachen Tastendruck möglich sein. Unabhängig vom Übertragungsverfahren (GSM, UMTS, DECT, ISDN oder VoIP), Betriebssystem und der ITK-Hardware kann der Nutzer nach Angaben des Herstellers per Handy oder Festnetztelefon in wenigen Augenblicken auf seine Daten zugreifen. Durch bloße Nennung des Namens könne er sich vermitteln lassen, E-Mails verschicken oder Nachrichten abrufen. Die Präzision in der Spracherkennung- und -wiedergabe soll dabei Missverständnisse auf ein Minimum reduzieren.
... mehr
Video IVR – neue Tür zum Contact Center?
16.01.2008, Call Centre Clinic
Für viele Kunden stellen IVRs den meist gehassten Teil eines Contact Centers dar: Sie müssen sich durch Unmengen von Menüs kämpfen, die langsam und Punkt für Punkt angesagt werden müssen, um schließlich im Contact Center anzukommen, wo das jeweilige Anliegen bearbeitet wird. Ein IVVR (Interactive Video and Voice Response) verspricht hier Abhilfe. Die Kombination einer Spracherkennung zur Eingabe mit einer visuellen Anzeige der möglichen Optionen, z.B. auf dem Display eines Mobilgerätes, könnte den Prozess der Vorqualifizierung deutlich beschleunigen.
... mehr
Dialogic erhält Auszeichnung als Produkt des Jahres von US-Magazin INTERNET TELEPHONY
09.01.2008, VOICE Community
Dialogic gab bekannt, dass das Unternehmen mit seiner Dialogic 4000 Media Gateway-Produktreihe (DMG4000) vom US-Magazin INTERNET TELEPHONY zum Preisträger des „2007 Product of the Year Award“ ernannt wurde. INTERNET TELEPHONY der Technology Marketing Corporation – TMC hat sich seit 1998 zum anerkannten Forum im Bereich VoIP etabliert. Bei den Dialogic Media Gateways handelt es sich um integrierte Lösungen, die speziell für die schnelle und zuverlässige Anbindung von Microsoft Unified Communications Server 2007 an bestehende TK-Infrastrukturen (TDM/IP) entwickelt wurden. Die Architektur der DMG4000-Gateways basiert auf einem Standard Rack Mount Server mit dem Betriebssystem Windows Server. Als „Hybridgateways“ übernehmen die Produkte auch die Funktion des Mediation Servers für den Office Communications Server 2007. Die vorinstallierte Microsoft-Software gewährleistet die PSTN- und PBX-Interoperabilität und damit VoIP mit höchster Sprachqualität und Sicherheit.
... mehr
IVR- und VUI-Design: Respekt für den Kunden
09.01.2008, Angel.com
In diesem Weblog erläutert Dr. Ahmed Bouzid, Leiter des “Partnerships and Strategic Alliances Program” von Angel.com, warum IVR-Telefoniesysteme (Interactive Voice Response) sich zu einem Aushängeschild für Frustration und Verärgerung bei den Kunden entwickelt haben. Schlechtes Design und unzureichende Implementierung von Voice User Interfaces (VUI) treiben seiner Meinung nach einen Keil zwischen die Ziele, die Unternehmen mit IVR-Systemen verfolgen (Verbesserung des Kundendienstes), und jene, die tatsächlich damit erreicht werden (Frustration der Kunden). Seine These: Systeme, die dem Anrufer Respekt entgegenbringen, würden mit seinem Willen zur Kooperation belohnt. Deshalb präsentiert Dr. Ahmed Bouzid mehrere Instanzen, in denen ein System sich respektvoll gegenüber dem Anwender verhalten sollte.
... mehr
Apple erhält Sprachsynthese-Patent
09.01.2008, Speech Technology Magazine
Am 25. Dezember hat Apple ein Patent erhalten, das die Natürlichkeit der unternehmenseigenen Sprachsynthese weiter verbessern soll. Das Patent, das ursprünglich 2003 eingereicht wurde, erläutert eine Methode, die bestimmten Worten innerhalb eines Satzes erhöhte Aufmerksamkeit zuweist und sowohl Kontext als auch Wortstellung berücksichtigt, um eine natürlichere Betonung und Hervorhebung von Satzteilen zu bestimmen. Laut den in der Einreichung genannten Entwicklern würden Texte als Ganzes betrachtet und der gesamte Datensatz eines Dokumentes für die Erzeugung der Aussprache berücksichtigt.
... mehr
Kostenloses Analyst Paper: Sprachapplikationen updaten wie Webseiten
09.01.2008, Speech Technology Magazine
In diesem Paper diskutiert Marktanalystin Nancy Jamison einen neuen Trend sprachbasierter Self Service-Systeme: Aktuelle Optionen, um Sprachapplikationen so dynamisch wie Webseiten zu modifizieren. Sie zeigt, was Hersteller und Anbieter zur Verfügung stellen, um z.B. jahreszeitliche oder Notfallmeldungen einzurichten, existierende Aufnahmen zu modifizieren, Ankündigungen in Menüs aufzunehmen, die Erkennungsleistung zu optimieren und Call Flows zu ändern und so Änderungen im Geschäftsablauf abzubilden. Lernen, welche Fragen zu stellen sind, damit das Contact Center-Personal Änderungen umsetzen kann und neue Geschäftsziele sicher erreicht werden können.
... mehr
Hertz Autovermietung setzt auf automatisierte Telefonzentrale von Clarity
09.01.2008, VOICE Community
Die Telefonzentrale ist oft der Flaschenhals im Dialog mit den Kunden. Bei hohen Anrufervolumen sind diese schnell ausgelastet, mit der Folge von lästigen Warteschleifen. Eine Situation, mit der sich auch die Hertz Autovermietung GmbH konfrontiert sah: Die Telefonzentrale der deutschen Hauptverwaltung in Eschborn stieß in Stoßzeiten schnell an ihre Kapazitätsgrenzen. Die implementierte Sprachdialogsoftware von Clarity kann nun gleichzeitig acht Anrufe entgegennehmen. Anrufer nennen einfach den gewünschten Ansprechpartner oder eine Fachabteilung und der Spracherkenner sorgt für die automatische telefonische Vermittlung. „Nur in den allerseltensten Fällen müssen unsere Mitarbeiter die Gespräche noch manuell vermitteln“, erklärt Ullrich Krautstrunk, Director IT & Operations Support bei Hertz.
... mehr
Midomi.com jetzt auch auf deutsch
09.01.2008, Sys-con Media
Melodis Corp., ein Marktführer im Bereich der Such- und Klangerkennungstechnologien, gab bekannt, dass Midomi.com jetzt auch auf Deutsch, Koreanisch, Polnisch und Portugiesisch verfügbar ist. Dank dieser neuesten Entwicklung können Besucher der Website Musikversionen auch in diesen Sprachen suchen, aufnehmen und an Freunde senden. Die zukunftsweisende Klangerkennungstechnologie ermöglicht den Benutzern, durch Singen oder Summen einiger Takte einen Titel zu finden oder auch ihre eigene Version davon aufzunehmen, um sie anderen zu Gehör zu bringen.
... mehr
Die Vorteile sprachbasierter IVR-Systeme richtig nutzen
09.01.2008, TMCnet
IVR-Systeme (Interactive Voice Response) können weitreichendere Vorteile für das Kundenerlebnis und die operationalen Kosten zeitigen als viele andere kundenorientierte Technologien. Sie machen da weiter, wo DTMF- und Touch Tone-Systeme enden. Doch das macht sie nicht zu einem Allheilmittel. Besonders beim Einsatz von Sprachtechnologie spielt das Design des Systems eine entscheidende Rolle und ein schlechtes Voice User Interface (VUI) stellt die größte Gefahr für die Akzeptanz des Systems bei den Kunden dar.
... mehr
Designer 8 von Voxeo erhältlich
09.01.2008, Call Centre Clinic
Voxeo hat die generelle Verfügbarkeit des Voxeo Designer 8 bekannt gegeben, dem internetbasierten Entwicklungs-Tool für Sprachapplikationen. Voxeo Designer 8 beinhaltet ein Web 2.0-Interface, das AJAX für eine signifikante Verbesserung des User Interfaces gegenüber den Vorgängerversionen unterstützt. Der Designer vereinfacht die Entwicklung von Sprachapplikationen durch vorgefertigte Entwicklungsschritte, die den Nutzer durch den gesamten Entwicklungsprozess führen. Dadurch ist jeder Anwender in der Lage, VoIP oder IVR-Applikationen zu entwickeln und sowohl sprachbasierte als auch Touch Tone-Applikationen einfügen.
... mehr
Gehostete IVR: Ein Blick auf die Prompts
09.01.2008, TMCnet
Ein erfolgsentscheidendes Element gehosteter IVR-Applikationen (Interactive Voice Response) sind Prompts, die Anrufer die Interaktion mittels verschiedener Kommandos ermöglichen. Sie erleichtern die Navigation innerhalb eines Systems und erlauben die Erledigung vollständiger Aufgaben, wie z.B. die Disposition von Terminen durch Sprache. Diese Prompts konsistent zu halten, verbessert maßgeblich die Qualität des Kundenerlebnisses – vorausgesetzt man weiß wie. Deshalb erläutert Moshe Yudkowsky, Ifbyphone, in seinem Blog-Post “How To Make Prompts Consistent”, welche Schritte er beim Entwickeln einer Anwendung vollzieht und stellt dabei die Wichtigkeit konsistenter Prompts heraus, was auch die exakt gleiche Wortwahl in jedem Prompt und die Kontrolle jeder einzelnen Aussage innerhalb der Applikation verlangt.
... mehr
W3C veröffentlicht ‘Candidate Recommendation’ der Pronunciation Lexicon Specification (PLS) Version 1.0
19.12.2007, VOICE Community
Die Voice Browser Working Group die Pronunciation Lexicon Specification (PLS) Version 1.0 als ‘Candidate Recommendation’ veröffentlicht. Feedback kann bis zum 11. April eingesandt werden. Die meisten Engines mit Automatic Speech Recognition (ASR) and Text-To-Speech (TTS) haben umfassende Lexika implementiert, die Ausspracheinformationen über die verwendete Worte und Phrasen enthalten. Die PLS stellt eine Basis für die Beschreibung solcher Ausspracheinformationen in der Spracherkennung und Sprachsynthese sowie beim Tuning von Sprachapplikationen dar, wie z.B. für Eigennamen mit unregelmäßiger Aussprache.
... mehr
SSML 1.1 als W3C ‘Working Draft’ veröffentlicht
19.12.2007, Loquendo Newsletter
Die Voice Browser Working Group hat eine neue Version der Speech Synthesis Markup Language Version 1.1 (SSML 1.1) veröffentlicht, die vor allem auf die Internationalisierung der SSML abzielt und auch Ländern wie China, Japan und Indien berücksichtigt. An der Entwicklung von SSML 1.1 sind Unternehmen und Organisationen aus Europa, Nordamerika, China und Japan beteiligt, um dieser Zielsetzung zu entsprechen.

... mehr
‘Cool URIs’ für das semantische Web
19.12.2007, VOICE Community
Die “Semantic Web Education and Outreach Interest Group” des W3C hat einen ersten öffentlichen Arbeitsbericht veröffentlicht, der den effektiven Einsatz von URIs (Uniform Resource Identifiers) zum Aufbau eines semantischen Webs zu erläutern. URIs – einfacher auch als Webadressen bekannt – stellen das Herz einer semantischen Webinfrastruktur dar. Das Dokument diskutiert zwei Strategien für die sinnvolle Wahl von URIs und erläutert ihre Vorteile gegenüber alternativen Strategien. Kommentare zu diesem Bericht sind bis zu 21. Januar erbeten.
... mehr
Whitepaper zur Automatisierung komplexer Anrufe
19.12.2007, Speech Technology Magazine
Was ist ein komplexer Anruf und warum sollte man ihn automatisieren wollen? Diese und weitere Fragen beantwortet dieses Whitepaper. Weiterhin erläutert es die Entwicklung der Spracherkennungstechnologie sowie neuartige Prozesse, die es heute ermöglichen, komplexe Anrufe zu automatisieren, die bislang als nicht automatisierbar galten.
... mehr
Text-to-Speech personalisiert zu Weihnachten
19.12.2007, Speech Technology Magazine
Online-Grußkarten erfreuen sich stetig wachsender Beliebtheit. Nur die Möglichkeiten ihrer Personalisierbarkeit waren bislang beschränkt. Das Start-up-Unternehmen MakeBeliever.com har sich nun daran gemacht, dies zu ändern. Durch eine Kombination von proprietärer Text-to-Speech-Technologie mit Acapelas Sprachsynthese in ihren V-Greetings warten diese mit der Darstellung menschlicher Personen auf, die die Adressaten scheinbar direkt ansprechen. Pünktlich zur Weihnachtssaison ist deshalb die erste verfügbare Person Santa Claus höchstpersönlich. Ein Teil des Dialoges ist im Voraus festgelegt, den Rest kann der Nutzer aus vorgegebenen Dialogen mittels Drop-down-Menü selbst definieren.
... mehr
Voice ‘pimpt’ News
19.12.2007, Speech Technology Magazine
PimpMyNews.com ist online. Die weltweit erste sprechende “Social News Site”, ermöglicht die Umwandlung von News-Feeds und Blog-Einträgen in gesprochene Sprache. Nach einer kurzen Registrierung können Nutzer zunächst ihre Favoriten aus mehr als 57 Kategorien, wie Entertainment, Politik und Wirtschaft, festlegen und sich die Neuigkeiten dann sogar auf ihren iPod oder MP3-Player schicken lassen. PimpMyNews-Mitbegründer John Atkinson sieht in der Audioform den größten Vorteil, da Nutzer ihre Nachrichten jederzeit und an jedem Ort erhalten können.
... mehr
W3C Multimodal Interaction (MMI) Working Group veröffentlicht ‘Candidate Recommendation’ von EMMA
12.12.2007, VOICE Community
Die MMI Working Group hat kürzlich die “Candidate Recommendation” der Extensible MultiModal Annotation (EMMA) Auszeichnungssprache veröffentlicht. Feedback kann bis zum 14. April eingereicht werden. EMMA ist ein Datentransferformat für das Interface zwischen Eingabeprozessoren und Interaction Management-Systemen innerhalb von multimodalen Architekturen und Interfaces. EMMA definiert außerdem Mittel zur Annotation applikationsspezifischer Informationen, wie z.B. Confidence Scores, Time Stamps, Eingabeart, alternative Erkennungshypothesen und partielle Erkennungsresultate.
... mehr
Voice Broadcast statt eMail
12.12.2007, TMCnet
Mit dem steigenden Wettbewerbsdruck und dem Zwang zur Kostenreduktion setzen Unternehmen zunehmend auf kosteneffiziente Kommunikationslöungen. Aus diesem Grund gewinnen auch gehostete Interactive Voice Response-Lösungen (IVR) gegenüber ihren proprietären Brüdern zunehmend an Popularität. Um den maximalen Nutzen aus interaktiven Sprachnachrichten zu ziehen, finden häufig Click-to-Call-Technologien und Voice Broadcasts (Sprachnachrichten in gesprochener Form) Anwendung in Unternehmen. Voice Broadcasts stellen dabei eine Alternative zu eMails dar, allerdings mit einer deutlich höheren Response-Rate – und mit einer gänzlich neuen Form, Kunden anzusprechen.
... mehr
VoiceObjects 7.2 in neuer Version
12.12.2007, VOICE Community
VoiceObjects meldet die Verfügbarkeit von VoiceObjects 7.2, der neuesten Version der Phone Application Server Software Suite des Unternehmens. VoiceObjects 7.2 umfasst eine Reihe neuer Funktionalitäten und Features, wie beispielsweise VoiceObjects Media Mixer, ein Werkzeug zur dynamischen Generierung von Videos. VoiceObjects Server und VoiceObjects Analyzer, zwei Hauptkomponenten von VoiceObjects 7.2, ermöglichen es jetzt, Informationen darüber, ob Geschäftsvorgänge von Anrufern eines Telefon-Self-Services abgeschlossen wurden, zu speichern und auszuwerten. Darüber hinaus unterstützt die neueste Produktversion nun auch die Business Intelligence-Plattform Cognos 8.
... mehr
Bluetooth mit Voice-Funktionalität
12.12.2007, VOICE Community
Sensory, Hersteller von Embedded-Sprachtechnologie in Konsumgütern, und Foxlink Group, Entwickler und Hersteller von Konsumgütern, haben den Abschluss einer strategischen Partnerschaft bekannt gegeben. Im Zuge der Kooperation sollen Bluetooth-Produkte mit einem integrierten Voice User Interface (VUI) produziert werden. Der erste Fokus soll auf dem Markt für Handsets und Cockpit-Lösungen im Automotive-Bereich liegen. Der Partnerschaft voraus ging bereits vor einem Monat eine weitere Kooperation mit CSR, um sprachaktivierte Bluetooth-Chips zu entwickeln.
... mehr
‘Jennifer’ die beste TTS-Stimme aller Zeiten?
12.12.2007, VOICE Community
Freitag stellte IVO Software Jennifer vor, die neue englischsprachige TTS-Stimme in der IVONA TTS Produktlinie. Jennifer wird auch für Expressivo 1.3 verfügbar sein, einer TTS-Applikation (Text-to-Speech), die in iPods integriert werden kann, um eMails, RSS-Feeds und Webseiten vorzulesen. Firmenchef Lukasz Osowski bezeichnete Jennifer als Meilenstein der TTS-Technologie, da es bei ihr „nahezu unmöglich sei, zwischen einer synthetischen und einer natürlichen Stimme zu unterscheiden.“ Osowski bezieht sich damit auf die Ergebnisse, die die TTS-Technologie seines Unternehmens bei den internationalen Blizzard Challenges 2006 und 2007 erzielte, einem Wettbewerb der die natürlichste TTS-Stimme kürt.
... mehr
Einführender Leitfaden: Spracherkennungslösungen
12.12.2007, VOICE Community
Heute sind die Vorteile von Sprachlösungen in Bezug auf Kosteneffizienz und Wertsteigerung im Kundenservice unumstritten. Dieses Whitepaper bietet einen einführenden Überblick über Spracherkennungslösungen und erläutert die Technologie, ihre Geschichte und die Anwendung im heutigen Geschäftsumfeld. Das Whitepaper erläutert die Vorteile, identifiziert die einzelnen Komponenten von Sprachlösungen und differenziert die zahlreichen Produkte, Händler und Angebote.
... mehr
Ford erhöht Sicherheit und Komfort durch Nuance Sprachtechnologie
04.12.2007, VOICE Community
Nuance und die Ford Motor Company sorgen für mehr Verkehrssicherheit. Ford gestaltet die Bedienung der in ihren Fahrzeugen installierten Funktionen, wie Telefon, Navigationssystem oder Audioanlage viel komfortabler, da die Sprachtechnologien von Nuance benutzt werden. Die Spracherkennungstechnologie VoCon sowie die Text-to-Speech (TTS)-Lösung von Nuance werden ab Dezember europaweit in die Modelle Ford C-MAX und Ford Focus und später auch in den Ford Galaxy, den Ford Mondeo und den Ford S-MAX integriert.
... mehr
Diesen Artikel hat ein Computer geschrieben
05.12.2007, Welt.de
In Windows Vista ist eine Spracherkennung eingebaut: Man kann erstmals seinem Computer diktieren – und die Worte erscheinen wie von Geisterhand im Textprogramm. Leider oft die falschen. Und ein ganz simples, das zu den zehn häufigsten der deutschen Sprache zählt, will er partout nicht verstehen. Lesen Sie auf Welt.de die Erfahrungen eines Redakteurs mit den Tücken der Spracherkennung in Windows Vista Ultimate. Ein Beispiel der schlechten Sorte. So lautet auch das Fazit des Autors am Ende: „Ganz nebenbei wird jeder, der eins zu benutzen versucht, auch sofort einsehen können warum die Kontakte des Menschen mit dem verstehenden Computer in der Filmgeschichte so oft tödlich ausgegangen sind.“
... mehr
W3C startet 'Emotion Markup Language Incubator Group'
05.12.2007, VOICE Community
Das World Wide Web Consortium (W3C) hat die Wiedereröffnung der „Emotion Markup Language Incubator Group“ bekannt gegeben. Generell besteht die Aufgabe der Inkubatorgruppen in der Entwicklung von aufkommenden Web-bezogenen Technologien, die den gegenwärtigen Recommendation Track des W3C ergänzt. W3C-Mitglieder und eingeladene Experten können in einer Inkubatorgruppe ("XG" genannt) rasch neue Arbeiten beginnen und in einem schlanken Prozess interessante und möglicherweise kontroverse Ideen entwickeln, die (noch) keine klaren Kandidaten für die Standardisierung sind. Der Fokus der Emotion Markup Language XG liegt auf der Dokumentierung von Möglichkeiten, den emotionalen Zustand von Nutzern oder User Interfaces darzustellen. Sponsoren der XG sind die W3C-Mitglieder DFKI, Deutsche Telekom, „Image, Video and Multimedia Systems Lab“, Loquendo, die Chinese Academy of Sciences und SRI International.
... mehr
W3C: Zusammenfassung des Workshops über ‘Advanced Requirements for the Multimodal Framework’ verfügbar
05.12.2007, VOICE Community
Das W3C World Wide Web Consortium (W3C) hat eine Zusammenfassung des W3C-Workshops über multimodale Architekturen und Interfaces veröffentlicht, der von der von der Multimodal Interaction (MMI) Working Group vom 16. bis 17. November in Fujisawa, Japan abgehalten wurde. Teilnehmer aus 17 Unternehmen stellten eine Liste von Anforderungen aktueller MMI Architekturen zusammen. Diese Liste soll als Basis weiterer Erweiterungen des Multimodal Frameworks betrachtet werden. Hauptanliegen der MMI Arbeitsgruppe ist die Erweiterung des Internets, damit Nutzer stets die für sie angemessene Interaktionsform wählen können – sei es Text, Grafik oder Sprache.
... mehr
Voice Biometrics - ein Vergleich
05.12.2007, Speech Technology Magazine
Identitätsdiebstähle nehmen zu, nicht zuletzt aufgrund der fortschreitenden technologischen Entwicklung und immer neuer Angriffsformen. PINs (Personal Identification Number) und Passwörter scheinen längst nicht mehr ausreichend, um die Privatsphäre von Unternehmen und ihren Kunden zu schützen. Neue Maßnahmen sind überfällig. Voice Biometrics-Lösungen authentifizieren einen Sprecher durch seine Stimme und bieten zusätzliche Gegenmaßnahmen, um Identitätsdiebstählen zu begegnen. Außerdem sparen sie Call Centern Zeit bei der Abwicklung von Identifizierungsprozessen und erhöhen so deren Effektivität. Lesen Sie in diesem Artikel des Speech Technology Magazines einen Vergleich von drei bekannten Voice Biometrics-Lösungen von PerSay, Diaphonics und RSA.
... mehr
Neues High Speed Intrusion Prevention System von Cisco
05.12.2007, VOICE Community
Cisco bringt ein neues Intrusion Prevention System (IPS) auf den Markt: Die Appliance Cisco IPS 4270 adressiert die wachsenden Sicherheitsanforderungen innovativer Collaboration-Anwendungen wie Voice-, Video- und Social-Networking-Tools. Mit Cisco IPS 4270 werden Unternehmen insbesondere der zunehmenden Diversifizierung ihres Netzwerkverkehrs besser als bisher gerecht. Sie können hochkomplexe Datenströme punktgenau überwachen und garantieren dennoch eine zuverlässige Performance – auch für Rich Media Applikationen. Im Umfeld multimedialer Web- und Video-Anwendungen liefert Cisco IPS 4270 einen Durchsatz von 4 Gigabit pro Sekunde (Gbps). Bei vorwiegend transaktionsorientiertem Datenverkehr wie E-Commerce, Instant Messaging oder Voice-over-IP liegt dieser Wert bei 2 Gbps. Die neue High-Speed-Appliance unterstützt in diesem Fall bis zu 20.000 Transaktionen pro Sekunde.
... mehr
AssistMed erweitert seine Medical Services um Stimmbiometrie
05.12.2007, Speech Technology Magazine
AssistMed, Anbieter von IT-Lösungen für das Gesundheitswesen in Los Angeles, hat die Anruferauthentifizierung von VoiceVault in sein Produkt „DictAide“ integriert. Nutzer des Transkriptionsprogramms müssen nun erst eine Stimmsignatur einsprechen, bevor sie Zugriff auf die dahinter liegenden Daten erhalten. Damit solle nach Unternehmensangaben der stärker werdenden Forderung aus US-Regierungskreisen entsprochen werden, Gesundheitsdaten bis 2014 in elektronische Form zu überführen und dennoch den Schutz der Privatsphäre von Patienten zu gewährleisten.
... mehr
Speech Analytics: Neun Best Practices
05.12.2007, CIO today
Kundenservice ist zu einem der entscheidenden Differenzierungsmerkmale im heutigen Markt geworden. Da die Schnittstelle der Kunden zum Unternehmen immer häufiger das Contact Center ist, zeitigt hier der Einsatz von Speech Analytics konkrete Vorteile. Durch die Erfassung nicht nur der Contact Center Effektivität sondern auch der Back-Office-Prozesse und weiterer Kundenkontaktpunkte, die die Kundenerfahrung prägen, können Speech Analytics zur Optimierung des gesamten, unternehmensweiten Kundenprozesses beitragen. Das Endresultat kann einen entscheidenden Einfluss haben, wie die hier vorgestellten neun Best Practices zeigen.
... mehr
TUB: Plauderstunde - von Auto zu Auto
28.11.2007, Informationsdienst der Wissenschaft
Im neuen An-Institut der TU Berlin DCAITI (Daimler Center for Automotive Information Technology Innovations) arbeiten TU-Forscher zusammen mit Daimler-Ingenieuren seit rund einem Jahr an Szenarios für das Auto von morgen. Zukünftig werden immer "intelligentere" Autos gebraucht, die auch mit anderen Autos und mit der umgebenden Infrastruktur kommunizieren. Ein sehr aktuelles Thema in der Entwicklung sei auch die Personalisierung.", erklärt Dr. Ralf Guido Herrtwich, Leiter des neuen Instituts. "Bei immer mehr Fahrzeug- und Unterhaltungselektronik, die überwacht und bedient werden muss, steigt natürlich auch das Ablenkungspotenzial für den Fahrer. Künftige Assistenzsysteme sollen nicht nur die Bedienung zum Beispiel durch Spracherkennung und andere multimediale Funktionen erleichtern, sondern die Systeme sollen sich sogar selbstständig und individuell auf den jeweiligen Fahrer abstimmen."
... mehr
Auf die Bedeutung kommt es an
26.11.2007, SAP-Info
Semantische Technologie soll die Suche nach digitalen Inhalten erleichtern und neue Web-Dienste ermöglichen. Professor Wolfgang Wahlster vom Deutschen Forschungszentrum für Künstliche Intelligenz beschäftigt sich seit über 30 Jahren mit der Kommunikation zwischen Mensch und Maschine. Im Gespräch mit SAP INFO online beschreibt er Nutzungsmöglichkeiten für semantische Technologien und die Rolle der Anwender beim Aufbau des „Semantic Web“.
... mehr
Spezielle Anforderungen für die Spracherkennung unterwegs
26.11.2007, Xdial.de
Immer mehr mobile Geräte haben eine Spracherkennung. Was die Navigationsgeräte erst seit Kurzem können, ist bei Handys schon länger möglich: SMS und E-Mails müssen nicht mühsam auf kleinen Tasten getippt werden. Wer ein Handy mit installierter Spracherkennung besitzt, kann das Gerät zum Diktat bitten: Das Mobiltelefon sendet die Aufnahme an einen Server, der die Sprache in geschriebenen Text umwandle und zurückschickt, erklärt Arnd Weil vom Sprachsoftwarespezialisten Nuance in Aachen. Trotz dieses Umwegs spare das Diktieren dem Nutzer Zeit. Probleme bereitet aber auch noch die Spracherkennung an sich: Denn "Spracherkennung unterwegs" ist eine ganz andere Angelegenheit als Spracherkennung in einer ruhigen Umgebung wie dem eigenen Arbeitszimmer. Umgebungsgeräusche und vor allem andere Stimmen können die Erkennungsgenauigkeit unter Umständen deutlich senken.
... mehr
Software erkennt Alter des Anrufers an der Stimme
26.11.2007, innovations report
Grundlage für diese neuartige Technologie sind viele tausend Aufnahmen gesprochener Worte von Sprecherinnen und Sprechern aller Altersklassen. Aus diesen Sprachdaten lassen sich dann statistische Modelle für jede der Altersgruppen sowie für männliche und weibliche Sprecher errechnen. Basierend darauf wurden Algorithmen entwickelt, die die Stimmeigenschaften der sprechenden Personen analysieren und auswerten. Das System weiß somit bereits nach wenigen Worten, welcher Kategorie der Anrufer zuzuordnen ist, abhängig von Alter und Geschlecht. So lassen sich Sprechstil und Wortwahl im Kundendialog optimieren aber auch die konkreten Angebote an die Anruferin oder den Anrufer. Denn das System erfährt ebenso, für welche Produkte oder Dienstleistungen sich bestimmte Nutzergruppen besonders interessieren und kann so das Angebot individueller ausrichten.
... mehr
Städtische Werke AG in Kassel automatisiert Telefonzentrale mit einer Sikom-Telefonielösung
26.11.2007, TMC.net
Um die Anfragen der Kunden in die richtigen Bahnen zu leiten, entschied sich die Städtische Werke AG in Kassel für ein modernes Sprachdialogsystem. Die Anrufer werden per Spracherkennung automatisiert an den gewünschten Ansprechpartner vermittelt. Darüber hinaus kann der Kunde über eine Sprachdialogplattform seine Rechnungsdaten abrufen, den Zählerstand melden oder weitere Informationen abfragen, ohne direkt mit einem Mitarbeiter verbunden zu sein. Die ersten Erfahrungen nach rund drei Monaten Betrieb sind beeindruckend: Die Erreichbarkeit des Call Centers stieg signifikant. Die Abbruchquote, die ausdrückt, wie viele Kunden das Telefonat ohne Mitarbeiterkontakt beenden, liegt bei unter drei Prozent. Alle diese Daten lassen sich jetzt über ein Echtzeit-Reporting sammeln und auswerten.
... mehr
FC Liverpool setzt auf Spracherkennung
28.11.2007, Computing
Der Fußballclub FC Liverpool beabsichtigt, im nächsten Jahr ein Interactive Voice Response (IVR) System zu implementieren, um damit seine internen Ressourcen besser auf die Bearbeitung von Ticketverkäufen und Anfragen im Kundendienst aufteilen zu können. Laut IT-Manager Ken Webster seien die Ressourcen des clubeigenen Call Centers begrenzt und habe deshalb mit Auslastungsspitzen zu kämpfen: „Gerade bei Pokalspielen erhielten wir bis zu 80.000 Anrufe von 20.000 verschiedenen Nummern. Viele der Anrufer mussten deshalb auflegen und es noch einmal versuchen.“
... mehr
Kostenloser Beitrag auf CallCenterProfi: Attraktive Kampagnen mit Sprachdialogen
28.11.2007, VOICE Community
Marketingagenturen stehen ständig vor der Herausforderung, neue, kreative Wege zu finden, um die Aufmerksamkeit der Kunden zu gewinnen. Gewöhnliche Gewinnspiele bieten oft nicht mehr genug Anreiz, um bestehende Kunden zu binden und neue zu gewinnen. Etwas Neues und Spannendes mit echtem Mehrwert muss her, ohne Kosten und Aufwand zu sprengen. Hier helfen Sprachportale.
... mehr
Kostenloser Beitrag auf CallCenterProfi: Mehr Effizienz und Effektivität im Service
28.11.2007, VOICE Community
Qualitätssteigerung und Kostensenkung durch Automatisierung können in Einklang gebracht werden, sofern Automatisierungsprojekte einen klaren Exzellenz-Anspruch haben und die Call Center-Praxis genügend berücksichtigen. Mit der Voice Portal Suite stellt die D+S solutions eine Gruppe von branchenspezifischen Sprachportalen für den (teil-)automatisierten Kundenservice per Telefon zur Verfügung, die es Call Center-Verantwortlichen ermöglicht, Qualität und Kosten im Griff zu haben.
... mehr
Verbesserung der User Experience mit Java Speech API
21.11.2007, builderau.com
Das Java Speech API (Application Programming Interface) ermöglicht die Implementierung von Sprachtechnologie in die User Interfaces Java-basierter Applets und Anwendungen. Es spezifiziert weiterhin ein plattformübergreifendes Interface, das Command & Control Recogniser, Diktiersysteme und Sprachsynthesizer unterstützt. Lernen Sie in diesem Artikel die Besonderheiten von Java Speech APIs kennen und erfahren Sie, wie ihr Einsatz das Nutzungserlebnis verbessern kann.
... mehr
News at Seven: Personalisierte Nachrichten aus dem Netz
21.11.2007, tecCHANNEL
Forscher des Intelligent Information Laboratory der Northwestern University in Illinois haben eine Software entwickelt, die Inhalte aus dem Internet automatisch zu animierten Nachrichtenclips zusammenstellt. News at Seven, so der Name des Projekts, sammelt dabei vollkommen selbstständig relevante Informationen, wertet diese aus und verarbeitet sie zu Nachrichtenbeiträgen. Moderiert werden die so entstandenen Videoclips von virtuellen Charakteren, die über eine Sprachsoftware mit den Nachrichtentexten gefüttert werden. Ziel der Entwickler ist es, dem User zu jeder Zeit eine speziell auf seine Person zugeschnittene Nachrichtensendung zu bieten.
... mehr
Als Vorreiter bietet Sybase 365 innovative Sprachunterstützung für Mobile Messaging-Anwendungen
21.11.2007, Press1.de
Sybase 365, ein Tochterunternehmen von Sybase Inc. lanciert Answers 365. Der neuartige Service unterstützt „natürliche Spracheingaben“ und ermöglicht so die SMS-Kommunikation zwischen Nutzern und Mobilfunkbetreibern, ohne dass hierfür komplexe Keywords und verschachtelte, menügestützte Anwendungen erforderlich sind. Answers 365 macht die Nutzung mobiler Serviceangebote intuitiv und komfortabel. Answers 365 beruht auf der Sybase iAnywhere Answers Anywhere-Plattform. Zusammen mit dem Sybase 365 Operator-Grade-Netzwerk versteht das intuitive System sowohl mehrteilige Anfragen als auch Slang-Ausdrücke, Synonyme und Tippfehler.
... mehr
Automatisierte Lügendetektoren
21.11.2007, Speech Technology Magazine
Harrow Council, eine von 33 Regierungsbehörden im Großraum London, hat ein Pilotprogramm zum Einsatz von sprachbasierter Risikoanalysetechnologie (ein Lügendetektor auf Basis moderner Sprachtechnologie und Emotionserkennung) gestartet, um Betrugsversuchen bei der Wohngeldvergabe zu begegnen. Solche Betrugsversuche basieren meist auf falschen Angaben, die Antragssteller bzgl. ihres Einkommens oder fiktiver Adressen machen. Die daraus entstehenden Kosten können enorm sein. So bezog ein Paar aus Dukinfield unberechtigt insgesamt mehr als $60.000 über einen Zeitraum von zehn Jahren. Die Britische Regierung meldete, dass sich der Gesamtschaden für Betrugsfälle dieser Art auf über $1.4 Milliarden für das letzte Jahr beläuft.
... mehr
TTS macht seinen Weg?
21.11.2007, Speech Technology Magazine
Wenn es um Text-to-Speech (TTS) geht, halten sich hartnäckig Fragen und Zweifel, in welche Richtung die Technologie sich entwickeln wird. Einige Hersteller plagen sich, um die natürlichste Stimme von allen zu entwickeln, während andere die Meinung vertreten, dass Kunden sich hunderte verschiedener und doch einzigartiger Stimmen wünschen. Und trotz seiner momentanen Präsenz in bestimmten Marktbereichen wie der In-Car-Navigation vertritt ein gewisser Teil der Branche die Ansicht, dass TTS noch nicht dort angekommen ist, wo es stehen sollte.
... mehr
ASR für MP3
21.11.2007, Speech Technology Magazine
CSR, Anbieter von Wireless Technologien, hat den BlueCore Player auf den Markt gebracht, einen preiswerten MP3-Player, der Bluetooth-fähig ist und Sprachkommandos versteht. Der Player basiert auf CSRs BlueCore5-Multimedia Silicon und nutzt die Spracherkennungssoftware FluentSoft 5 von Sensory. Da Bluetooth-Geräte meist zu klein für übersichtliche Bildschirme sind und große Tasten in der Regel schwerfällig und unhandlich sind, bietet die Sprachbedienung von BlueCore einen klaren Mehrwert für seine Bedienungsfreundlichkeit.
... mehr
LiveVox stellt Voice Portal 3.0 vor
21.11.2007, Speech Technology Magazine
LiveVox hat kürzlich sein Voice Portal 3.0 vorgestellt, eine Call Center-Plattform, die Dialer-Funktionalitäten emuliert, der Anwendern die Migration auf eine VoIP-Umgebung erleichtern soll. Das LiveVox Voice Portal basiert auf offenen Standards wie VXML und SIP und stellt eine gehostete Dialing-Architektur dar, mit deren Hilfe Unternehmen vielfache Kundendialogmodelle auf einer einzigen Plattform realisieren können. LiveVox erklärt, Anwender würden von geringeren IT-Kosten, vollständiger Applikationsintegration, unbegrenzter Kapazität und niedrigeren Anforderungen an WAN-Equipment profitieren.
... mehr
Loquendo TTS 7 auf MRCP Server verfügbar
21.11.2007, TMCnet
Loquendo hat die generelle Verfügbarkeit seiner Text-to-Speech (TTS) Technologie TTS 7 auf dem ebenfalls erschienenen MRCP Server 7 bekannt gegeben. Loquendo MRCP, vormals bekannt als Loquendo Speech Suite, bietet Entwicklern nun die Möglichkeit, ihre Plattformen um sämtliche Loquendo-Technologien zu erweitern: Loquendo TTS, Loquendo ASR und Loquendo Speaker Verification. Der Loquendo MRCP Server ist eine Lösung für standortgebundene, mobile und VoIP-Telefonie und unterstützt vielseitige Funktionalitäten, wie z.B. DTMF Handling, Anrufaufzeichnungen sowie Barge-In. Außerdem unterstützt es sowohl MRCPv2 als auch MRCPv1.
... mehr
Intervoice stellt Banking Applikation mit Sprecherverifizierung vor
21.11.2007, TMCnet
Intervoice Banking 4.0 ist mit Blick auf die zunehmenden Vorschriften bzgl. der Datensicherheit bei digitalen Bankgeschäften konzipiert und bietet Finanzdienstleistern die Möglichkeit, den vermehrt auftretenden Identitätsdiebstählen entgegenzutreten. Mit der aktuellen Version der Banking-Anwendung können Finanzdienstleiter ihren Kunden sprachbasierten Self Service sowie die Unterstützung durch Touch Tone ermöglichen. Die Sicherheitsabfragen beim Kontozugang wurden verbessert, indem Kunden ihre Stimme zur Identifizierung und Verifizierung nutzen.
... mehr
Datria setzt auf VoIP-Sprachlösungen für die Lagerwirtschaft
14.11.2007, Speech Technology Magazine
Lagerwirtschaft und Logistik sind ideale Einsatzorte für Sprachlösungen. Doch Datria hat deren Einsatz mit „Voice Pick ‘n’ Pack“ nochmals optimiert. Voice Pick ‘n’ Pack ist die erste Voice Data Entry (VDE) Lösung, die netzwerkbasierte Spracherkennung in Verbindung mit günstigen VoIP-Telefonen anstelle tragbarer Computer einsetzt. Dadurch soll die Integration in bestehende Unternehmensprogramme erleichtert, die Investitionskosten gesenkt und die Vorteile von netzwerkbasierten, sprecherunabhängigen Sprachtechnologien voll ausgeschöpft werden.
... mehr
Microsoft Live Search Mobile mit Spracherkennung
14.11.2007, InsideMicrosoft
Windows Live Search hat eine neue Version der Windows Mobile Anwendung veröffentlicht und einige neue Funktionen hinzugefügt. Die Wichtigste: Spracherkennung. Wünscht der Anwender nun einen bestimmten Ort auf der Karte zu wählen, braucht er nicht mehr von Hand suchen oder browsen. Einfach eine Aktivierungstaste drücken und den gewünschten Ort nennen – schon geht´s los. Ähnlich sieht es aus bei Navigationsanfragen, den aktuellen Spielzeiten im nächsten Kino oder wenn einfach mal eine Karte der aktuellen Umgebung gebraucht wird: Die derzeitige Umgebung benennen und schon wird die entsprechende Karte angezeigt.
... mehr
Standards für den User
14.11.2007, Speech Technology Magazine
Eines der grundlegenden Prinzipien des GetHuman-Standards lautet: Entwickler von Sprachanwendungen sollen regelmäßig die Interaktion von Anwendern mit ihrem System überwachen und die daraus gewonnen Daten als Benchmark zur Verbesserung der Anwenderfreundlichkeit einsetzen. Dennoch lässt der Einsatz von unternehmensübergreifenden Benchmarks und Standards auf sich warten. Es ist zwar nicht so, dass Entwickler und Entwicklungsunternehmen nicht über Best Practices und vorgefertigte Templates verfügten. Doch verständlicherweise werden diese nicht der gesamten Branche offen gelegt.
... mehr
Loquendo TTS und ASR für die Interactive Digital Assistants von Umanify
13.11.2007, TMCnet
Umanify, ein kleines Start-Up-Unternehmen, will seinen Interactive Digital Assistants mehr Leben einhauchen. Deshalb hat man sich für die Spracherkennung und Text-to-Speech-Technologie von Loquendo entschieden, um sie auf der umanServer Enterprise 2.6 conversational agents Plattform zu betreiben. Dadurch sollen die Interactive Digital Assistants lebensechte Sprach- und Gesichtsausdrücke einsetzen können, um mit Kunden auf eine natürliche und direkte Art und Weise zu interagieren. Ziel ist es, einen 24-Stunden-Self-Service anzubieten, der sich durch ein dem Agentenkontakt ähnliches Kundenerlebnis auszeichnet.
... mehr
US-Forscher entwickeln Stimm-Maus
13.11.2007, Kurier.at
Wissenschaftler in den USA arbeiten an einer Computermaus, die exakt auf akustische Signale reagiert. Vor allem Menschen mit körperlichen Einschränkungen könnten von einem solchen Eingabegerät profitieren, erklärte Jeff Bilmes, ein Experte für Spracherkennung an der Universität des US-Staates Washington. Er leitet eine Gruppe von Forschern, die einen "Vocal Joystick", einen stimmgesteuerten Joystick entwickeln wollen. Die Forscher wiesen den verschiedenen Steuerungsrichtungen des Joysticks bestimmte Laute zu. Kombiniert steuern sie die Maus auf dem Bildschirm. Die Geschwindigkeit der Cursor-Bewegung wird über die Lautstärke geregelt. Mit dem Voicebot ist die Forschung noch einen Schritt weiter gegangen: Dadurch kann ein Roboterarm mit Hilfe der Stimme bewegt werden.
... mehr
Nuance Voice Control für Centro Smartphone von Palm erhältlich
05.11.2007, VOICE Community
Nuance hat angekündigt, dass eine 30-Tage-Testversion von Nuance Voice Control, ein sprachaktivierter Mobile Search- und Messaging-Service, auf dem aktuellen Centro Smartphone von Palm vorinstalliert sein wird - dem kleinsten und leichtesten Smartphone, das derzeit von Palm erhältlich ist. Mit Nuance Voice Control können Centro-User eMails und Textnachrichten einfach sprachaktiviert diktieren und versenden, Kalendereinträge erzeugen, Kontakte anrufen und das Internet durchsuchen.
... mehr
atms realisiert auf der Basis von D+S solutions’ Technologie automatisierte Kundenzufriedenheitsumfrage
07.11.2007, VOICE Community
Sagem Telecommunications setzt auf die sprachdialogautomatisierte Kundenzufriedenheitsmessung von atms und ihrer deutschen Schwestergesellschaft D+S solutions. Sagem Communication Austria betreibt eines der größten Call Center für technische und kaufmännische Produktberatung in Österreich - monatlich werden tausende Anrufe in acht Sprachen bearbeitet. Um die Qualität der Produkte und Dienstleistungen zu sichern, wird die Zufriedenheit der Anrufer erstmals mittels automatisierter telefonischer Direktbefragung erfasst. Gestartet wird das Projekt vorerst in Deutsch, das atms-Sprachportal kann aber jederzeit problemlos an weitere Sprachen wie Englisch, Französisch, Italienisch oder Spanisch angepasst werden.
... mehr
NICE Systems über die Fortschritte von Voice Analytics im Call Center und in Unternehmen
05.11.2007, TMCnet
Voice Analytics erfahren eine zügige Akzeptanz in der Call Center-Branche, nicht zuletzt weil Unternehmen die Vorteile entdecken, die Voice Analytics in- und außerhalb der Call Center bieten. Dank wesentlicher Fortschritte bei den Algorithmen, mittels derer Sprache interpretiert wird, und schnellerer Prozessoren können diese automatisierten Systeme Organisationen in die Lage versetzen, Informationen aus ihren Anrufen zu generieren und so Erkenntnisse über ihre Kunden und Agenten zu erhalten, die zuvor im Bereich des Unmöglichen angesiedelt waren.
... mehr
Neues Whitepaper: CAPEX und OPEX für traditionelle und Open Standards-IVR
05.11.2007, Bitpipe
In diesem Whitepaper analysiert Datamonitor die Kosten und Vorteile, die der Einsatz von Open Standards-IVR-Plattformen für Carrier bedeuten. Lernen Sie den Markt für Open Standards-IVR-Plattformen und dessen Dynamik kennen, erkennen Sie die tatsächlichen Kostenvorteile von VoiceXML-Plattformen und profitieren Sie von einer Einführung in die OpenCall Strategie von HP, die es Dienstleistern ermöglicht, ihre Kostenstruktur zu optimieren und gleichzeitig neue Dienste anbieten zu können.
... mehr
Neues Whitepaper (Genesys sponsored): Erfolg im Call Center durch Kontrolle der Agenten-Performance
31.10.2007, Bitpipe.com
In der Multichannel-Umgebung heutiger Call Center scheint sich die Bedeutung von Agenten weiter zu entfalten. Ihr Aufgabenumfang wächst und gleichzeitig ist die Call Center-Leitung wie auch das Qualitätsmanagement aufgefordert, die Leistungen der Agenten genau zu erfassen. Dieses e-Book von SearchCRM.com erläutert Best Practices in der Leistungskontrolle von Agenten. Erfahren Sie, wie innovative Call Center vom Einsatz hochwertiger Monitoring-Tools und Call Center Performance Management Software profitieren, und entdecken Sie die Vorteile von Voice Analytics.
... mehr
Neues Whitepaper von Angel.com: 5 Wege, wie Sie und Ihre Kunden von CRM-Daten profitieren
31.10.2007, VOICE Community
Dieses Whitepaper erläutert fünf verschiedene Wege, wie heutige Unternehmen die Interaktion zwischen Customer Relationship Management (CRM) und Interactive Vocie Response (IVR) Applikationen automatisieren. Ziel ist es, die Kundenloyalität und –bindung zu steigern, die Effizienz und Produktivität von Service- bzw. Sales-Funktionen zu maximieren, Ertragschancen zu verbessern und Kosten zu reduzieren.
... mehr
Sprachtechnologie in der Auto-Navigation: Luxus-Addon oder unersätzliches Must-Have?
31.10.2007, VOICE Community
Paolo Coppo, VP of Marketing & Business Development bei Loquendo, gab ein Interview und sprach über die Popularität der Loquendo Automotive Solution und Loquendos aktuellen Erfolg im Markt für Sprachtechnologie. Darin gab er eine kurze Übersicht über das Unternehmen sowie sein Technologie-Portfolio und erläuterte die Vorteile sprachaktivierter In-Car-Navigation sowie die Alleinstellungsmerkmale von Loquendos Lösung.
... mehr
Sybase lanciert mBanking 365
31.10.2007, ddp direkt
Sybase 365, ein Tochterunternehmen von Sybase und Weltmarktführer bei der globalen Verwaltung und Auslieferung von mobilem Content sowie der Bereitstellung und Abrechnung im Bereich Mobile Messaging, bringt mit Sybase mBanking 365 eine innovative Produktsuite für den Finanzsektor auf den Markt. Der neue Service ermöglicht Banken, über Handy-Alerts, Zwei-Wege-Bankdienstleistungen, Out-of-band-Authentifizierung und Marketingkampagnen in Echtzeit mit ihren Kunden zu interagieren. Als weiteren Pluspunkt unterstützt Sybase mBanking 365 mit dem Answers 365-Modul die Abwicklung interaktiver Bankdienstleistungen anhand natürlicher Spracherkennung, sodass sich der Kunde keine Kennwörter merken muss, um den gewünschten Service in Anspruch zu nehmen.
... mehr
Raus mit der Sprache! Texte selbst vertonen mit Voice Reader Studio
31.10.2007, ddp direkt
Ab sofort gibt es vom Münchner Sprachtechnologie-Spezialisten Linguatec eine professionelle Alternative zum herkömmlichen Gang ins Tonstudio. Voice Reader Studio ist eine innovative Software-Lösung für alle, die Texte schnell, kostengünstig und mit überzeugender Qualität für ihre Zielgruppe vertonen möchten. Für das Stimmmaterial des Linguatec Voice Reader wurden sehr aufwändige Tonaufnahmen mit ausgebildeten Studiosprechern gemacht. Diese Aufzeichnungen werden in phonetische Einheiten zerschnitten und vom Programm anhand der Textvorlage wieder neu zusammengesetzt. Das Synthetische bei der Sprachsynthese des Voice Reader ist daher nicht die eigentliche Stimme, sondern das intelligente Zusammenfügen dieser natürlich-sprachlichen Elemente. Komplexe linguistische Algorithmen sorgen für eine natürliche Betonung der Wörter im Satzkontext.
... mehr
Facebook integriert Speech-to-Text-Applikationen von SpinVox
31.10.2007, Speech Technology Magazine
Die Online Social Networking Community Facebook und Microsoft haben einiges gemeinsam: begründet von College-Abbrechern, gestartet mit einem minimalen Budget und Interesse an Sprachtechnologie. Während Microsoft Sprachfunktionen bereits in einigen seiner Produkte anbietet, stößt Facebook erst jetzt hinzu. Die Speech-to-Text-Applikationen von SpinVox ermöglichen den 15 Mio. Usern von Facebook sprachaktivierte Updates ihres Status, Kommentare zu verfassen und zu posten, anderen Usern Nachrichten zu senden und ihre Profil um blog-ähnliche Anmerkungen zu ergänzen.
... mehr
Canada Bell mit weltweit größtem stimmbiometrischen System
31.10.2007, Speech Technology Magazine
Bell Canada hat bereits im letzten Jahr erste Schritte unternommen, die Effizienz des Aufgabenbereichs “Customer Privacy and Security” der unternehmenseigenen Call Center in Einklang zu bringen. Nun wurde zusätzlich der „Voice Identification Service“ in Betrieb genommen, der auf der VocalPassword Technologie von PerSay und der automatischen Spracherkennung aus dem Hause Nuance basiert. Diese Implementierung bietet sprachaktivierte Sicherheitsfunktionalitäten für alle Kunden des Carrier – unabhängig davon, ob sie kabelgebundene, kabellose, Internet-, TV- oder VoIP-Dienstleistungen in Anspruch nehmen. Da alle Kunden von Bell erreicht werden, gilt sie zugleich als weltweit größte Inbetriebnahme eines stimmbiometrischen Sicherheitssystems.
... mehr
‘Nuance Care Analytics’ vorgestellt
24.10.2007, VOICE Community
Nuance hat die Einführung von Nuance Care Analytics bekannt gegeben, der branchenweit ersten umfassenden Lösung, zur Analyse und Verbesserung des Anrufererlebnisses. Im Vergleich zu ähnlichen Produkten, die lediglich Daten sammeln und zur Verfügung stellen, ermöglicht Care Analytics einen detaillierten und nachverfolgbaren Einblick, der es Unternehmen erlaubt, die Automation von Contact Center-Prozessen und die Kundenerlebnisse signifikant zu verbessern. Hierzu werden Kundenerlebnisse durchgehend verfolgt und analysiert, inklusive Self Service-Interaktionen, Call-Routing, Gesprächen mit Agenten und nachgeschalteten Interaktionen, wie z.B. Feedback-Erhebungen. Ergänzt werden diese Analysen durch Ergebnisinterpretationen und Handlungsvorschlägen.
... mehr
Telenet gibt erweiterte Funktionalität der ProLab IMS-Testlösung von Radvision bekannt
24.10.2007, Verivox
Telenet als Distributor der ProLabTM-Testlösungen von RADVISION im deutschsprachigen Raum verkündet die neue Version 5.0 für die ProLab Test Suite von Radvision. Diese kann jetzt durch die zusätzliche Unterstützung der IMS-Server-Funktionalität neben den IMS-Endpunkten für komplette Ende-zu-Ende Tests im IMS-Umfeld eingesetzt werden. Zudem ist nun eine aktive Analyse der Sprachqualität möglich, sodass neben den Störeinflüssen im Netzwerk auch die Qualität der Sprachübertragung überprüft werden kann. Die ProLabTM Test Suite ist eine Testlösung für Sprache und Video über IP-, IMS- und 3G- Netzwerke. Sie bietet automatisierte Testabläufe für die Protokolle SIP, H.323 und 3G-324M.
... mehr
Evaluierung eines stimmbiometrischen Systems
24.10.2007, VOICE Community
Unabhängig von Branche und spezifischen Geschäftzielen kann die Evaluierung eines stimmbiometrischen Systems sehr einfach sein – solange man die geeignete Methodologie anwendet. Deshalb bietet PerSay in diesem Artikel eine Übersicht von Tools, die der Leistungsanalyse dienen und die eine Evaluierung noch vor der Implementierung des Systems ermöglichen. Folgende Schritte sind dabei notwendig: Evaluation, Planung, Systeminstallation und Setup, IVR Call Flow, Kalibrierung, Anruferregistrierung, Genauigkeitstest und Analyse/Auswertung.
... mehr
Parus Interactive patentiert sprachaktiviertes ‘Remote System Management’
24.10.2007, TMCnet (letzte Woche in SC gelaufen)
Parus Interactive hat ein patent für sein „Speech-Activated Remote System Management“ erhalten. Das System erlaubt Awendern ihre fernbedienbaren Systeme im Büro, zu Hause oder an einem beliebigen anderen Ort per Sprachkommando zu steuern. Das Patent wurde Parus Interactive für 16 Methoden und Systemanforderungen zugesprochen, die sich auf die Fernbedienung von Geräten via WAN, LAN oder Internet bezogen. Das Patent umfasst weiterhin eine ununterbrochene Monitoring-Funktion der entsprechenden Systeme, die den Betrieb bzw. Nicht-Betrieb überwacht. Anwendung könnte das System z.B. bei Innen- und Außenbeleuchtung, Sicherheitsanlagen sowie Heizungs- und Klimasystemen finden.
... mehr
Nortel und Polycom bieten gemeinsam HD-Video- und Telepräsenzlösungen für Unified Communications-Umgebungen an
24.10.2007, TMCnet (letzte Woche in SC gelaufen)
Im Rahmen des World Business Forums in New York haben Nortel und Polycom ihre künftige Zusammenarbeit bei der Bereitstellung von Videokonferenz- und Telepräsenzlösungen für Unified-Communications-Umgebungen bekannt gegeben. Damit ist Echtzeitkommunikation über verschiedene Standorte und Länder hinweg möglich und Unternehmen können nicht nur ihr Wachstumspotential verbessern, sondern auch ihre Produktivität steigern, Kosten senken und gleichzeitig den CO2-Ausstoß reduzieren. Zusätzlich hat Nortel ein Demo-Netzwerk eingerichtet, das Kunden aus aller Welt die Möglichkeit bietet, einen Eindruck von den Möglichkeiten der Telepräsenzlösung zu bekommen.
... mehr
VOICE Days: Neue Generation von Call Center Software erhöht Sicherheit
17.10.2007, VOICE Community
Die börsennotierte Interactive Intelligence präsentierte auf den diesjährigen Voice Days mit CIC 3.0 eine neue Generation von Call Center Software. Nach Angaben des renommierten Analyse- und Beratungsunternehmens Yankee Group erhöht sich der Anwendernutzen des Customer Interaction Centers (CIC) für Call Center und andere Anwenderfirmen in erheblichem Maße. Dies sei vor allem auf die zahlreichen neuen Sicherheitsmerkmale und auf erweiterte Einsatzmöglichkeiten zurückzuführen. Hierzu zählen laut Hersteller die Unterstützung des SRT-Protokolls, das Nutzen von Public und Private Key-Zertifikaten sowie zusätzliche mobile Standort-unabhängige Kommunikationsfunktionen.
... mehr
Volksfürsorge Versicherungsgruppe setzt auf Stimmbiometrie im Sprachportal
16.10.2007, VOICE Community
Die Volksfürsorge Versicherungsgruppe setzt als weltweit erstes Unternehmen stimmbiometrische Verfahren in ihrem Sprachportal für Außendienstmitarbeiter ein. Die stimmbiometrische Authentifizierungslösung nutzt die Stimme quasi als „Fingerabdruck“ und schützt durch eine zertifizierte Sicherheitstechnik jetzt auch große Sprachportale vor unberechtigtem Zugriff. Seit Januar 2007 bewährt sich das System im praktischen Einsatz bei der Volksfürsorge Versicherungsgruppe. Ausgewählt und implementiert wurde die Authentifizierungslösung der VOICE.TRUST AG in Kooperation mit der D+S solutions GmbH als Entwickler und Betreiber des Portals.
... mehr
Mit Sprache bedienbarer CarPC ruft auf IFA großes Interesse hervor
16.10.2007, VOICE Community
Ein auf der Internationalen Funkausstellung Berlin (IFA) erstmals präsentierter CarPC, der durch Sprachbefehle bedient werden kann, hat in der Öffentlichkeit und beim Fachpublikum großen Anklang gefunden. Der CarPC ist ein Produkt, das aus der Zusammenarbeit der beiden Firmen Voice-Insight SA (Brüssel) und Krämer Automotive Software GmbH (Reutlingen) hervorging. Der sprachaktivierte CarPC hat Serienreife und ist über die Krämer Automotive ab sofort beziehbar. Auch unter schwierigen Umgebungsbedingungen wie massiven Hintergrundgeräuschen und gleichzeitigem Sprechen mehrerer Personen im Fahrzeug stellte er seine Praxistauglichkeit hinreichend unter Beweis. Neben der Kommunikation, wie dem Telefonieren oder Abhören und Steuern der Mailbox, lassen sich über den sprachgesteuerten CarPC Navigation, Multimedia oder Office-Anwendungen steuern. Außerdem ist die Darstellung von Fahrzeugdaten in das System integriert.
... mehr
Neuer robuster Sprachcomputer von LXE unterstützt Standardsprachanwendungen für Lageranwendungen
16.10.2007, VOICE Community
LXE, führender Hersteller robuster Funk-PCs zur Leistungsoptimierung in Supply Chain-Anwendungen, hat heute die Einführung des drahtlosen Datenerfassungscomputers HX3 für Lageranwendungen bekannt gegeben, die auf Spracherkennung zur Dateneingabe basieren. Der neue HX3 bringt LXE in Führungsposition als branchenweit ersten Anbieter einer vollständigen Palette robuster, sprachfähiger Mobilcomputer: Fahrzeugcomputer, Hand- und Freihand-Computer, Multimodal und ausschließlich sprachgesteuert. Der neue HX3 verwendet den 802.11b/g WLAN-Funkstandard für erhöhte Geschwindigkeit und Sicherheit und ist durch ein Magnesiumgehäuse geschützt. Damit ist eine lange Lebensdauer auch unter harten Bedingungen gewährleistet.
... mehr
Mit virtuellem Agenten über die Liga plaudern
16.10.2007, tecCHANNEL
Möglich macht diese natürlichsprachliche Abfrage ein Sprachdialogsystem der Firma Sympalog Voice Solutions. Für die Interaktion mit den Benutzern wird in der vorliegenden Beispieldomäne Fußball der virtuelle Fußballexperte Ligabot der Firma Charamel eingesetzt. Er beantwortet die Fragen des Besuchers mit einer künstlichen Stimme. Der virtuelle Agent untermalt die Dialogbeiträge durch passende Mimik und Gestik. Eine intelligente Kameraführung in einem 3D-Modell des Münchner Fußballstadions soll der Gesprächssituation künstliches Leben einhauchen. Diese Sprachtechnologie- und Edutainment-Innovation basiert auf Forschungsergebnissen des DFKI und des BMBF-Projekts VirtualHuman. Vorgestellt wird der Ligabot auf den VOICE Days 2007.
... mehr
Vorleseprogramme und ihre Tücken
16.10.2007, dradio.de
Zwar hat sich die Qualität der Vorleseprogramme im Internet in den vergangenen Jahren deutlich verbessert, doch so manche Software kämpft noch mit der Spracherkennung. Vor allem Fremdwörter und Abkürzungen führen nicht selten zu abstrusen Verirrungen. Dennoch ist der Trend klar: Das geschriebene Wort wird hörbar - vorgetragen nicht etwa von einem menschlichen Sprecher, sondern von einem Computerprogramm. In den meisten Fällen steckt dahinter die Software der Firma "Readspeaker". Gegründet vor sechs Jahren in Schweden, ist das Unternehmen mittlerweile international auf Expansionskurs. Doch wer interessiert sich für den automatischen Vorleser? Der Geschäftsführer der deutschen Niederlassung in München, Ulf Beyschlag, sieht ganz unterschiedliche Zielgruppen.
... mehr
TU Berlin forscht über Stimmveränderungen im Alter
16.10.2007, VOICE Community
Ein seltenes Phänomen: Am Telefon hört man eine Stimme. Sie klingt scheinbar alt. Wenn man dann dem Sprecher gegenüber steht, stellt man fest: Der Eindruck täuschte, denn der Mann ist jung. Oft kommen solche Überraschungen nicht vor, denn meist verrät die Stimme tatsächlich einiges über das Alter des Sprechers. In dem Forschungsprojekt "Junge und alte Stimmen" haben Walter Sendlmeier und seine Mitarbeiter am Institut für Sprache und Kommunikation der TU Berlin die Veränderungen von Stimme und Sprechweise als Funktion des Alters untersucht. Sie fanden heraus: In der Sprache steckt weit mehr als nur die rein linguistische Funktion. Im Alltag ist es häufig wichtiger, wie etwas gesagt wird; die Inhalte spielen eine geringere Rolle. Die Ergebnisse könnten für die automatische Spracherkennung von großer Bedeutung sein.
... mehr
Klangdesign mit Acapela Voice Factory
10.10.2007, VOICE Community
Exklusiv angefertigte synthetische Stimmen zu geringem Kostenaufwand ermöglicht die innovative Voice Factory von Acapela. Vorgestellt wird das Produkt im Rahmen der VOICE Days, Deutschlands größter Fachausstellung für Sprachlösungen. Ob für Ansagen oder auch als Kontakt- und Benutzerschnittstelle zwischen Unternehmen und Kunden, in fast allen Lebensbereichen werden synthetische Stimmen inzwischen ganz selbstverständlich eingesetzt. Um sich von Mitanbietern abzuheben, bedarf es eines firmenexklusiven Klangdesigns, welches das Unternehmen kennzeichnet und mit dem es assoziiert wird. Mit einer einzigartigen, natürlichen und sehr gut verständlichen Stimme wird das Firmenimage um eine akustische Dimension erweitert.
... mehr
Dragon NaturallySpeaking von Nuance vereinfacht die Verwaltungsabläufe im Bezirksamt Neukölln von Berlin
02.10.2007, VOICE Community
Nuance liefert seine Spracherkennungssoftware Dragon NaturallySpeaking an das Bezirksamt Neukölln von Berlin. Damit ist das Bezirksamt Neukölln bundesweit die erste Stadtbehörde, die eine Spracherkennungssoftware flächendeckend einsetzt. Zukünftig wird Dragon NaturallySpeaking die tägliche Arbeit von über 150 Mitarbeitern in allen Geschäftsbereichen des Bezirksamtes unterstützen. Zum Beispiel können die Sozialarbeiter gleich nach ihren Hausbesuchen ihre Berichte in ein mobiles Diktiergerät sprechen und im Büro angekommen, erhalten sie mit nur einem Knopfdruck ihre fertig geschriebenen Berichte auf ihrem PC. So hilft die Spracherkennungssoftware Dragon NaturallySpeaking den Mitarbeitern, alle Schreibarbeiten schnell und korrekt zu erledigen.
... mehr
Unified Self Service – ein Spagat
02.10.2007, Speech Technology Magazine
Web- und telefonbasierte Self Service Tools haben die Aufgaben von Live-Agenten erleichtert, Kundenanfragen und im Besonderen Routine-Anrufe zu bewältigen. Doch sowie diese neuen Kanäle Anrufe von den Agenten abgezogen haben, tauchte eine steigende Anzahl von Anfragen aus alternativen Kundenkontaktpunkten auf (Web, Telefon, Email, Chat, etc.). Unternehmen können sprachaktivierte Self Services daher nicht länger als „Stand-alone-Kanal“ betrachten. Sie sind Teil einer umfassenden Unified Self Service Strategie. Einer der größten Engpässe stellt hier aber noch immer die nahtlose Kundenerfahrung über alle Kanäle hinweg dar – eine grundlegende Ursache dafür sehen Experten in den verschiedenen Implementierungsstrategien.
... mehr
VoxIQ setzt auf Loquendo für dialogorientierte Spracherkennung und Text-to-Speech
02.10.2007, VOICE Community
Loquendo und VoxIQ haben ihre Technologien vereint. VoxIQ nutzt Loquendos Automated Speech Recogniser in “Loquendo VoxNauta”, um Dialoge zwischen Personen abzuhören und Unterstützung zu bieten durch automatisches Ausfüllen von Formularen oder dem Anzeigen hilfreicher Daten, die zum Dialoginhalt passen. Dazu kommt der Einsatz von Sprachsynthese, die zur dialogischen Konversation mit Anwendern genutzt wird - als „conversational self-service“.
... mehr
Endlich ein Sprachcomputer mit dem man gerne telefoniert?
02.10.2007, VOICE Community
Jetzt kommt SpeechConcept mit einem Application Server auf den Markt, der das Erstellen von Dialogen vereinfachen soll. Mit einer benutzerfreundlichen, webbasierten PC-Oberfläche gestaltet der Inhaber der Call Domain seinen Telefondialog selbst: die Begrüßung der Anrufer mit weiblicher oder männlicher Stimme, der Verlauf des Gesprächs, etwaige Weiterleitung und weitere Optionen werden individuell mittels der Dialogmodellierung festgelegt. Einfaches Icon Drag-and-Drop legt fest, wie das Telefonat geführt und beendet wird. Änderungen sind leicht möglich und erfordern keinerlei Programmierkenntnisse.
... mehr
Java Speech API für fortschrittliche Kundenerfahrungen
02.10.2007, VOICE Community
Das Java Speech API (Application Programming Interface) ermöglicht die Integration von Sprachtechnologie in User Interfaces von Programmen und Anwendungen, die auf Java basieren. Es spezifiziert außerdem ein plattformübergreifendes Interface, das Command und Control Recognizer, Diktiersysteme und Sprachsynthesizer unterstützt. Dieser Artikel geht auf die Charakteristika eines Java Speech API ein und erläutert, wie diese zur Verbesserung der Kundenerfahrung eingesetzt werden können.
... mehr
US-Einzelhandelsdienstleister steigert Leistung mit neuer Sprachlösung
02.10.2007, Logistik-Inside
Glidewell Distributing hat mit einer neuen Lösung zum sprachgestützten Kommissionieren die Quote korrekter Vorgänge von 99,03 auf 99,66 Prozent gesteigert. Parallel sank die Zahl von Nachbearbeitungen. Der US-amerikanische Dienstleister für die Nahrungsmittel- und Einzelhandelsbranche, rechnet mit Einsparungen im Bereich der Personal- und Lagerkosten in Höhe von jährlich rund 275.000 US-Dollar und einer Amortisationszeit von weniger als neun Monaten. Zudem seien Verbesserungen hinsichtlich Lieferqualität, Arbeitsgeschwindigkeit und Einarbeitungszeit erzielt worden, so der Anbieter der Lösung Vocollet. Zum Einsatz kommt das neue System „VoiceLink 3.0“.
... mehr
Coveo erhält Patent für automatisches Training von Spracherkennern
02.10.2007, Newswire.com
Coveo Solutions hat die Vergabe eines U.S. Patents bekannt gegeben, das für das Training von Sprachmodellen und dem Modifizieren von Wörterbüchern einer Spracherkennungs-Engine entwickelt wurde. Einsatz findet die neue Technologie in der Coveo Audio-Video Search (CAVS). Coveos Technologie nutzt kontextuelle Informationen, die in Verbindung mit gesuchten Audio- und Video-Files stehen, um selbstständig Wörterbücher und Sprachmodelle anzupassen. In Verbindung mit CAVS wandelt die Technologie außerdem gefundene Sprache in Text um, so dass dieser indiziert werden kann und bei neuen Anfragen präziser erfasst wird.
... mehr
Flächendeckende Qualitätssicherung in Call Centern mit „Quality Observer“
25.09.2007, VOICE Community
Nuance unterstützt Tribe Technologies bei der Entwicklung einer Software zur Qualitätssicherung von Telefongesprächen in Call Centern. Tribe Technologies entwickelt die Software Quality Observer und setzt dabei auf den neuen Spracherkenner Nuance Recogniser v9. Mit Quality Observer lassen sich gesprochene Inhalte automatisch mit definierten Vorgaben vergleichen, was eine maschinelle Bewertung des Gesprächs ermöglicht. Die erkannten Inhalte werden mit den durch einen Teamleiter oder Qualitätsverantwortlichen festgelegten Vorgaben verglichen. Der Spracherkenner erlaubt, Äußerungen zu überspringen, die für Qualitätsprüfungen nicht interessant sind. Das integrierte Bewertungssystem bietet somit eine automatische objektive und übersichtliche Analyse der Gespräche.
... mehr
Aperto move setzt auf Usability-Kriterien nach europäischem Standard
25.09.2007, VOICE Community
Aperto move hat in Zusammenarbeit mit der Telekom für das Bonusprogramm HappyDigits ein neues Sprachportal realisiert. Erstmalig wendet aperto move für ein Sprachportal Usability-Kriterien nach europäischem Standard an, die bisher nur für Websites erfolgreich eingesetzt werden konnten. Der abschließend von der aperto AG durchgeführte Usability- und Akzeptanztest im Live-Einsatz bezeugt die besonders hohe Qualität und deutlich gestiegene Akzeptanz des neuen Angebotes aus Nutzersicht. Der neue Service ermöglicht den HappyDigits-Teilnehmern den flexiblen Zugriff auf ihre persönlichen Daten per Telefon. So können die Teilnehmer beispielsweise ihre PIN oder eine Ersatzkarte direkt im Sprachportal bestellen und sind nicht mehr auf die Öffnungszeiten des Call Centers angewiesen.
... mehr
Loquendo und Genesys schließen ‚Interoperability Testing’ erfolgreich ab
26.09.2007, TMCnet
Loquendo gab den erfolgreichen Abschluss eines „Interoperability Testing“ der firmeneigenen mehrsprachigen Sprachtechnologie mit der Genesys Voice Plattform bekannt. Durch die Zusammenarbeit kann Genesys den Kunden seiner Applikationen fortschrittliche Text-to-Speech (TTS) und Automatic Speech Recognition (ASR) Funktionalitäten bieten. Die Leistungspalette von Genesys umfasst außerdem bereits Technologien wie Computer Telephony Integration (CTI) und Intelligent Routing. Die Tests beziehen sich auf die Interoperabilität des Genesys Voice Portals 7.2 MR1 mit der Loquendo Speech Suite Version 7.0.
... mehr
Software hört VoIP-Gespräche ab
25.09.2007, chip.de
Das US-amerikanische Unternehmen Puddingmedia hat eine Software entwickelt, die es Kunden ermöglichen soll, Werbung für VoIP-Nutzer zu optimieren. Wie businessweek.com berichtet, sollen beispielsweise für User, die sich über Essen unterhalten, Restaurants in der Umgebung auf dem Bildschirm eingeblendet werden. Das Programm befindet sich zurzeit noch in der Testphase; es hat Probleme mit der Spracherkennung.
... mehr
Sprecherauthentifizierung
26.09.2007, Speech Technology Magazine
Sprecherauthentifizierung (Speaker Authentication) ist eine biometrische Technologie zur Sicherstellung, dass Personen diejenigen sind, die sie vorgeben zu sein. Wie auch automatische Spracherkennung handelt es sich hierbei um die Computerisierung einer grundlegenden menschlichen Fähigkeit – die Unterscheidung zwischen Fremden und Freunden. Wegen dieser Nähe zu einer menschlichen Fähigkeit wirkt die Sprecherauthentifizierung auf Anwender nicht so fremd wie z.B. Fingerabdrucksensoren. Doch darf diese Nähe nicht darüber hinweg täuschen, dass entscheidende Fragen der Funktionalität und Ergonomie beachtet werden müssen.
... mehr
speech@microsoft startet Blog
26.09.2007, Speech Technology Magazine
Eines der meistdiskutierten Features des neuen Microsoft Betriebssystems Windows Vista stellt die eingebaute Spracherkennung dar. Dennoch bemerken viele Nutzer nicht einmal, dass diese existiert, geschweige denn dass sie von ihren Funktionalitäten profitieren könnten. Um den Informationsfluss diesbezüglich zu verbessern, haben die Entwickler der Spracherkennung einen Blog eingerichtet. speech@microsoft versucht nicht, mit einem neuen Trend-Interface zu prahlen, sondern bietet bislang noch übersichtliche Inhalte an, die sich an den Bedürfnissen von Endkunden orientieren.
... mehr
Avaya und IBM stellen Lösungen für die Finanzindustrie vor
19.09.2007, VOICE Community
Avaya kündigte die Einführung gemeinsamer branchenfokussierter Lösungen im IBM Banking Industry Solution Center (BISC) in Barcelona an. Mit den neuen Lösungen können Geschäftsszenarien der Finanzdienstleistungsbranche live nachgebildet werden. Damit baut IBM die Stärken im Banking aus und Avaya verstärkt die Kompetenz im Bereich IP-basierter intelligenter Kommunikation, um die bestmöglichen Lösungen für Kunden ermitteln zu können. Das Banking Industry Solution Center ist das dritte seiner Art, das auf der seit 2001 bestehenden globalen strategischen Allianz von Avaya mit IBM aufbaut. Die im Center gezeigten IBM-Avaya-Lösungen für das Front-Office-Banking umfassen u.a. Avaya Communications Manager, OneX Mobile Edition, Voice Portal und WebSphere Voice Server von IBM und Tandberg Video Conferencing.
... mehr
Viewdle erkennt nicht nur Gesichter
19.09.2007, New Tee Vee
Es sind 35 Jahre vergangen, seitdem der KGB Algorithmen zur Gesichtserkennung entwickelt hat. Doch mit dem Ende der Sowjetunion versiegten die Geldquellen des Projektes, bis die Ukrainische Regierung es im Jahr 2000 wiederbelebte. Im Jahr 2006 kam schließlich die Idee auf, dass die Technologie wirtschaftlich vermarktbar sei und man gründete eine Firma: Viewdle. Auf der TechCrunch40 Konferenz präsentierte man erstmals die Technologie der Öffentlichkeit und beeindruckte sogleich das anwesende Publikum. Viewdle ist in der Lage, genau die Sekunde zu ermitteln, in der das Gesicht einer bekannten Persönlichkeit in einem Video auftauchte. Doch bei dieser Demonstration ist es nicht geblieben. Kürzlich wurde eine Partnerschaft mit Reuters geschlossen, im Zuge derer Viewdle mehr als 600 Stunden Bildnachrichten indiziert hat. In Verbindung mit ihrer Gesichtserkennung bietet Viewdle auch Spracherkennung an.
... mehr
Whitepaper: Ergonomie von mobilen Endgeräten
19.09.2007, InformationWeek
Carrier bemühen sich heute um neue und innovative Sprach-/Datendienste, um ihren ARPU (Average Revenue Per User) zu steigern und die sinkenden Erträge aus reinen Sprachdiensten abzufedern. Entscheidend dafür sind aber zufriedene Kunden. Um sich am Kunden zu orientieren müssen Dienste flexibel anpassbar sein und ein herausragendes Kundenerlebnis zeitigen. Lernen Sie in diesem Whitepaper verschiedene Faktoren kennen, die ein ergonomisches User Interface rechtfertigen und die Grundlage für ein positives Kundenerlebnis darstellen.
... mehr
Virtuelle Stimme zur Miete
19.09.2007, VOICE Community
IVO Software hat sein Internetangebot Say.Expressivo.com vorgestellt. Dort können Internetnutzer die virtuellen Stimmen des Unternehmens testen. Einfach einen beliebigen Text in das entsprechende Fenster eingeben und die gewünschte Stimme auswählen. Zur Verfügung stehen vier Stimmen (eine männliche und drei weibliche), die drei Sprachen unterstützen (Englisch, Rumänisch und Polnisch). Den Link zum Vorlesen des Textes kann im Web geposted (z.B. in einem Blog), via Email bzw. Instant Messenger versendet oder als mp3-File aufgenommen werden. Unabhängig davon ist der gesamte Dienst kostenlos.
... mehr
SiSi - Software übersetzt in Gebärdensprache
19.09.2007, golem.de
Unter dem Namen "Say It Sign It", kurz SiSi, hat IBM Research eine Software vorgestellt, die gesprochene Sprache in Gebärdensprache übersetzt und durch einen Avatar darstellt. Entwickelt wurde SiSi von Studenten. Das System unterstützt die "British Sign Language" (BSL), die laut IBM von rund 55.000 Menschen genutzt wird. Entwickelt wurde das System zusammen mit der Universität East Anglia, die für die Animation der Gebärdensprache verantwortlich sind, und dem RNID (Royal National Institute for Deaf People).
... mehr
Assistentin EVA
19.09.2007, Speech Technology Magazine
Excendia, Anbieter von sprachaktivierten Unified Communications und Mobillösungen, hat ein Abkommen mit IBM unterzeichnet, um den Excendia Virtual Assistant (EVA) in den IBM WebSphere Voice Server zu integrieren. EVA bietet Angestellten, die mobil tätig sind, von jedem beliebigen Telefon einen Hands-Free, Eyes-Free Zugriff auf geschäftliche Daten und Kommunikationsmittel. Durch den Einsatz von Sprachkommandos können Anwender auch von unterwegs ihre Anrufe, Emails, Termine, Voicemails, Faxe und Kontakte verwalten.
... mehr
‘EveryZing’ sucht ‘Everything’
19.09.2007, Speech Technology Magazine
Die Grundlage des Internets sind Texte. Sinnvoll nach Multimedia-Dateien zu suchen, ist dadurch nur eingeschränkt möglich, auch wenn die dafür notwendige Technologie bereits vorhanden ist. Bezeichnenderweise dafür hat EveryZing, eine Multimedia Such- und Merchandising-Plattform, eine Reihe von Partnerschaften abgeschlossen, u.a. mit Boston.com, 890 ESPN, boston.tv und verschiedenen Radiostationen. EveryZing, ehemals die Podcast Suchmaschine PodZinger, ist eine Ausgliederung von BBN Technologies und nutzt seine Erfahrungen in der Speech-to-Text-Technologie, um Multimedia-Dateien für Suchanfragen umfassend auszuwerten.
... mehr
Palm Treo 755p mit Nuance Voice Control übertrifft Erwartungen
12.09.2007, VOICE Community
Nuance hat kürzlich erste Nutzerstatistiken ihrer Sprachapplikation „Nuance Voice Control“ präsentiert, die auf dem neuen Smartphone Palm Treo 755p vorinstalliert erhältlich ist. Vorläufige Schätzungen von ca. 48 Tansaktionen pro Nutzer und Monat wurden demnach bereits übertroffen. Die Ergebnisse seien ein Hinweis auf die vereinfachte Nutzererfahrung und die Effizienzsteigerung, die sich durch den Einsatz von Nuance Voice Control in Verbindung mit fortschrittlichen mobilen Endgeräten wie dem Treo 755p erreichen ließen.
... mehr
Charaktere des VUI-Design
12.09.2007, Speech Technology Magazine
Die Zeiten für Voice-User-Interface-Designer (VUI-Designer) sind nicht leicht. Applikation mit komplizierter Navigation und schlechten Konversationen belegen immer wieder die Missachtung existierender Best Practices. Aber wo liegt die wirkliche Ursache für solche Negativbeispiele? Ist es wirklich die Unfähigkeit der VUI-Designer, bessere Anwendungen umzusetzen, oder fehlt es ihnen eher am Durchsetzungsvermögen gegen die vielen divergierenden Interessen, die an einem Sprachprojekt beteiligt sind? Melanie Polkosky und Alexandra Auckland präsentieren in diesem Artikel des Speech Technology Magazin die Ursachen aus ihrer Sicht. Sie haben acht Personas definiert, die die häufigsten „Schwarzseher“ von Voice Projekten in Unternehmen beschreiben. Sie stellen vor, mit welchen Argumenten diese Personas angemessene VUI-Designs behindern und wie man sie als Designer überzeugen kann.
... mehr
Auch Ihr Anruf könnte aufgezeichnet werden
12.09.2007, VOICE Community
Jeder kennt es. Man ruft eine Hotline oder auch eine öffentliche Auskunft an und wird in eine Warteschlange gesetzt. Es folgt die Information, dass „Ihr Anruf zum Zweck des Kundendienstoptimierung aufgezeichnet werden könnte“. Dann wird endlich die Verbindung zu einem Agenten oder einer Sprachanwendung aufgebaut. Was der Hinweis jedoch unterschlägt, ist dass Ihr Anruf nicht bloß aufgezeichnet wird. Er kann einer tiefgehenden Analyse unterzogen werden, die nicht nur erkennt, was gesagt wird, sondern auch in welchem Gemütszustand. Diese Information kann dann in Verbindung gesetzt werden zu Ihrer Telefonnummer und beliebig vielen weiteren privaten Informationen, wie z.B. Ihrer Bonität. Call Center haben während der letzten Jahre eine technologische Revolution erlebt - allerdings eine erstaunlich stille.
... mehr
Kommunikation mit Maschinen, die sich in die Lage von Menschen versetzen
12.09.2007, Physorg
Seit den 1970ern versuchen Wissenschaftler, sprachbasierte Mensch-Maschine-Interfaces zu entwickeln. Die Verbesserungen sind zu erkennen, doch es bleiben Stimmen, die daran zweifeln, dass nach heutigen Methoden jemals eine natürlichsprachliche Verständigung möglich sein wird. Einer davon ist Roger Moore, Computerwissenschafter an der University of Sheffield. Er hat kürzlich ein alternatives Modell für die sprachbasierte Mensch-Maschine-Kommunikation vorgeschlagen, das er PRESENCE (PREdictive SENsorimotor Control and Emulation) nennt. PRESENCE setzt auf eine rekursive „Feedback Control Structure“, in der die Maschine sich in die Lage des Menschen „einfühlt“, indem sie sich selbst in die Kommunikationssituation des Sprechers imaginiert und dementsprechend seine Sprachmuster ändert.
... mehr
Tele Atlas ermöglicht sprachgesteuerte Navigation in Mercedes-Fahrzeugen
12.09.2007, VOICE Community
Die langjährige Partnerschaft zwischen Tele Atlas und Harman/Becker Automotive Systems hat einen entscheidenden Vorsprung in der sprachgesteuerten Navigation bei der neuen Mercedes C-Klasse ermöglicht und einen neuen Standard in diesem Automobilsegment etabliert. Die Navigationsfunktion erkennt die Namen aller Städte, Straßen und sogar Sonderziele (Points of Interest, POIs) in jedem von insgesamt acht europäischen Ländern. Mit gespeicherten Sätzen wie z. B. „Zur Arbeit” sind Standardziele einfacher erreichbar. Ein Tastendruck aktiviert die Spracherkennung für Navigation, Audio oder Telefon. Verlegenheitslaute wie „Ähm”, „Äh" und „Hm” werden herausgefiltert und mit einer Benutzeranpassungsfunktion wird die Spracherkennung anhand der Charakteristika des Fahrers optimiert.
... mehr
IVONA – Eine der besten synthetischen Stimmen der Welt?
12.09.2007, VOICE Community
Das IVONA Text-To-Speech-System von IVO Software hat einen der höchsten Punktwerte bei der Blizzard Challenge 2007 erzielt, an der einige der besten Universitäten und Unternehmen im Bereich synthetischer Sprache teilnehmen. Der Punktwert bewertet die Qualität gesprochener Sätze und beträgt maximal 5,0. Jedes bewertete System musste mehrere hundert gesprochene Sätze einreichen, die anschließend von Experten und Freiwilligen bewertet wurden. Das System von IVO Software erzielte 3,9 Punkte, die Referenzprobe eines menschlichen Sprechers kam auf 4,7. Veranstalter der Blizzard Challenge 2007 war die University of Edinburgh, die Bekanntgabe der Resultate erfolgte während eines Blizzard Challenge Workshops in Bonn am 25. August 2007.
... mehr
TomTom integriert Nuance-Sprachtechnologie für die Zieleingabe in seine neuen Navigationsmodelle der GO-Reihe
03.09.2007, VOICE Community
Nuance gab bekannt, dass sich TomTom entschieden hat, seine neuen Versionen von Navigationsgeräten der TomTom-GO-Familie – TomTom GO 720 und TomTom GO 920 – mit Nuance-Sprachlösungen auszustatten. Durch die Integration der Technik einer sprachaktivierten Eingabefunktion von Nuance sind diese Geräte nun wesentlich einfacher und sicherer zu bedienen, da der Nutzer die Zieladresse lediglich diktiert und nicht manuell über das Tastaturfeld eingeben muss. Die Funktion der gesprochenen Zieleingabe ist für die folgenden Länder erhältlich: Österreich, Belgien, Frankreich, Deutschland, Italien, Luxemburg, Niederlande, Portugal, Spanien, Schweden, Schweiz und Großbritannien.
... mehr
RightNow erweitert Funktionalität seiner Multichannel-CRM-Lösung
03.09.2007, VOICE Community
RightNow stellt RightNow 8.2 vor. Damit unterstreicht das Unternehmen einmal mehr sein Ziel, die robusteste On-Demand-CRM-Lösung der Enterprise-Klasse anzubieten. RightNow 8.2 ermöglicht kundenorientierten Unternehmen und Organisationen, eine einheitliche Kommunikation mit dem Verbraucher - ganz gleich, ob der Kunde per Telefon, online, per E-Mail, per Internet Chat oder im persönlichen Gespräch mit dem Unternehmen in Kontakt tritt. RightNow 8.2 enthält Verbesserungen und Neuerungen für alle wesentlichen Kundeninteraktionskanäle, wie z.B. einen Feedback-Kanal mit Emotionserkennung und einen Voice-Kanal mit personalisierten Weiterleitungsfunktionen.
... mehr
Nexidia bietet beschleunigte Speech Analytics
03.09.2007, Speech Technology Magazine
Nexidia hat die Verfügbarkeit der Nexidia QuickStart Solution Suite gemeldet. Die Lösung kann Traffic analysieren, Geschäftschancen identifizieren und die Schlüsselaspekte der Kundenbeziehungen eines Unternehmens verdeutlichen. Die Kompaktlösung entschlüsselt zentrale Informationen aus Geschäftsprozessen und generiert daraus Empfehlungen für Unternehmen. Die insgesamt drei Angebote beinhalten 16 vordefinierte Untersuchungsbereiche, die von Transferanalysen bis zur Analyse von Produktstarts reichen.
... mehr
Innovatives System verbessert Voice Sicherheit und aufreibende Arbeitsbedingungen
05.09.2007, ComplianceHome.com
Echelon hat bekannt gegeben, dass ihre Technologie in dem Sound Masking System „Spectra i.Net“ von Lencore Acoustics zum Einsatz kommt. Sound Masking nutzt fortschrittliche Technologie, um die Hintergrundgeräusche von Gesprächen behutsam anzuheben. Ziel ist es, die Privatsphäre von Mitarbeitern zu schützen oder die Belastung durch störende Geräusche im Hintergrund zu verringern. Lencores Spectra i.Net basiert auf Echelons i.LON Internet Server Plattform, um mittels einer Remote-Verbindung Einstellung des Systems ändern zu können.
... mehr
Zantaz stellt konsolidiertes Archiv aller Informationsquellen vor – einschließlich Sprache
05.09.2007, Speech Technology Magazine
Zantaz, Marktführer im Bereich Archivierung, e-Discovery und Proactive Information Risk Management (IRM), hat seine Pläne zur Erweiterung seiner Digital Safe Archiving Software vorgestellt. Zantaz plant, Autonomys fortschrittliche “Intelligent Data Operating Layer” (IDOL) und IDOL Sprachtechnologie zu integrieren, um ein umfassendes Spektrum proaktiver Funktionalitäten zum Informationsmanagement zu bieten. IDOL automatisiert die Erkennung, Verarbeitung und Analyse aller Informationsquellen aus mehr als 400 Datenarchiven in mehr als 100 Sprachen. Mit IDOL werden Kunden von Zantaz in der Lage sein, schnell und präzise beliebige Muster aus ihren Daten im Zantaz-Archiv zu erkennen.
... mehr
Sprachtechnologie: ein dynamischer Ansatz
29.08.2007, CallCenterClinic
Sprachbasierte IVRs (Interactive Voice Response) reduzieren entscheidend die Kosten pro Interaktionseinheit. Unglücklicherweise sind Kunden nun mal keine Einheiten und reagieren nicht gut darauf, als solche behandelt zu werden. Die effektivsten Voice Lösungen sind solche, die wie ein zusätzlicher Agent im Call Center funktionieren – und der Erfolg dieses Ansatzes setzt eine einwandfreie Integration der Lösungen voraus. Bruce Eidsvik, Vice President Sales EMEA Voice Portals bei Genesys, erläutert in diesem Artikel, wie eine korrekt integrierte Voice Lösung Unternehmen hilft, die eigenen Resourcen besser zu nutzen und ein effektives „Dynamic Contact Center“ zu zeitigen.
... mehr
Wie Missverständnisse per IVR überwunden werden können
29.08.2007, TMCnet
Interactive Voice Response (IVR) Systeme sind in die Kritik geraten, weil sie oftmals zu komplex und schlecht gestaltet sind und so dem Zweck ihrer Entwicklung zuwider laufen. Ein „personengebundener“ Ansatz könnte hier Abhilfe schaffen, so Steve Brown, Vice President Client Service bei Angel.com. Er führt aus, dass Systeme zu oft veraltete Methoden nutzen, die einen „unpersönlichen“ Call Flow erzeugen, z.B. wenn Anrufer über Tasteneingabe einen Unternehmensbereich auswählen müssen, von dem sie sich Hilfe erhoffen. Anstatt Anrufer in einer Warteschleife zu halten, könnten personbezogene Systeme diese Gelegenheit nutzen, um Informationen zum individuellen Anliegen zu sammeln und so die Weiterleitung gegebenenfalls anpassen, sofern ein anderer Bereich besser das Kundenanliegen bearbeiten kann.
... mehr
Avaya Update: eine neue Ära intelligenter Kommunikation
29.08.2007, CNN.com
Avaya hat gleich mehrere neue Versionen seiner Self Service Software auf der SpeechTEK 2007 präsentiert. Dazu zählen Avaya Voice Portal 4.0, die zentrale Self Service Software des Unternehmens, und Interactive Response 3.0, eine der meist verbreiteten Self Service Plattformen. Beide zeigen sich mit neuen Funktionen zur Sprachautomatisierung, um einfache und kosteneffiziente Kundendienstlösungen zu entwickeln und die Basis für produktivere Geschäftsprozesse zu legen. Außerdem wurde Avaya Dialog Designer 4.0 präsentiert, ein Entwicklungs-Tool für sprachbasierten Self Service der nächsten Generation.
... mehr
Neues Whitepaper von 3SH: Persay Technology Evaluation Results
29.08.2007, VOICE Community
Im Juli und August 2006 unternahm das National Centre for Biometric Studies der Universität von Canberra eine Evaluation der letzten Sprachauthentifizierungs-Technologien von Persay und verglich die Leistungsfähigkeit dieser mit den Ergebnissen einer Evaluation aus dem Vorjahr. Lesen Sie in diesem umfangreichen Whitepaper die Ergebnisse und das Verfahren dieser Evaluation und erfahren Sie mehr über die Leistungsfähigkeit von Persays VocalPassword 5.2.0 Standard sowie VocalPassword 6.0 Alpha (Experimental Version).
... mehr
Mit Sprache bedienbarer CarPC auf IFA erstmals präsentiert
29.08.2007, VOICE Community
Der sprachaktivierte Computer, mit dem jedes Fahrzeug ausgerüstet werden kann, entstand aus der Zusammenarbeit der Reutlinger Firma Krämer Automotive Software GmbH mit dem Brüsseler Sprachtechnologie-Unternehmen Voice-Insight SA. Der CarPC in der Größe eines Autoradios ist nahtlos in das Armaturenbrett integrierbar und kann mit einem LCD-Bildschirm verbunden werden. Bei dem Gerät handelt es sich um einen vollwertigen Computer, der über alle üblichen Funktionen eines PCs verfügt und mit den Betriebssystemen WIN-XP oder WIN-VISTA läuft. Neben Kommunikationsfunktionen, wie dem Telefonieren oder Abhören der Mailbox, kann der CarPC den gewünschten Radiosender einstellen, navigieren und Fahrzeugdaten verwalten.
... mehr
QuickConnect ASR - Neue automatisierte Auskunftsplattform von ITCV
29.08.2007, inar.de
Da ITCV neben hochperformanter Telefonietechnik jetzt auch die neueste Version der Spracherkennung Nuance Recognizer v9 einsetzt, sind selbst umfangreiche Vokabulare schnell und korrekt bearbeitet. QuickConnect ASR vermittelt in wenigen Sekunden Anrufer an bis zu 240 Auskunftsplätze. Möglich macht dies unter anderem die neue Spracherkennung von Nuance, die Keywords und Keyphrases leicht aus dem natürlichen Redefluss des Anrufers filtert, robust gegen Hintergrundgeräusche ist, durch semantische Modellierung Satzbedeutungen und Sprecherintentionen frühzeitig erfassen kann.
... mehr
Envox bringt Envox VoiceXML Studio 7 auf den Markt
29.08.2007, CallCenterClinic
Envox hat die Verfügbarkeit von Envox VoiceXML Studio 7 gemeldet, der aktuellen Version ihrer Entwicklungsumgebung für VoiceXML. Envox VoiceXML Studio 7 ist direkt in die Envox Communications Development Plattform integriert und soll den Entwicklungsprozess von VXML-basierten Sprachlösungen um bis zu 50% beschleunigen. Die Lösung ist konform zum VXML-Standard und bietet vorgefertigte Komponenten für das Voice User Interface Management, Call Control, Application Logic und Database integration sowie einen leistungsstarken grafischen VoiceXML-Debugger. Dieser reduziere die notwendige Zeit für Entwicklung, Testen und Implementierung erheblich.
... mehr
Nuance stattet Unified Messaging Lösung von Cisco mit Sprachaktivierung aus
21.08.2007, VOICE Community
Nuance wird nach eigenen Angaben Sprachlösungen für Cisco Unity 5.0 zur Verfügung stellen. Nuance Spracherkennung wird demnach als optionale Komponente von Cisco Unity 5.0 erhältlich sein, um den Kunden der Unified Messaging Lösung sprachaktivierten Zugriff zu ermöglichen. Mit Cisco Unity können Anwender Email-, Sprach- oder Faxnachrichten medienübergreifend managen. Nuance ergänzt dieses Angebot um ein „Hands-free“ Interface, mit dem die Steuerungsoptionen von Cisco Unity via Sprachbefehl ausgeführt werden können.
... mehr
VoiceObjects stellt VoiceObjects Desktop für Eclipse vor
21.08.2007, VOICE Community
Das Plug-in für Eclipse, die weltweit führende Java-Entwicklungsumgebung, vereint die Funktionalität des VoiceObjects Desktops für Web-Tools mit einer anwenderfreundlichen Benutzeroberfläche, hoher Anwenderfreundlichkeit und kurzen Antwortzeiten. Das Plug-in gibt Java-Entwicklern ein innovatives Werkzeug an die Hand, um Telefonanwendungen auf Basis des mehrfach ausgezeichneten VoiceObjects Phone Application Servers entwickeln und implementieren zu können. Zu den Highlights des VoiceObjects Phone Application Server zählen dynamische, personalisierte Dialoge, Online-Updates und Rollbacks sowie integrierte Echtzeit-Analysen und -Auswertungen. Der VoiceObjects Phone Application Server bietet dabei Unterstützung für mehr als 100 Sprach- und IVR-Plattformen.
... mehr
Neues Whitepaper von 3sh: Speaker Verification Evaluation Report
21.08.2007, VOICE Community
Die Universität von Canberra hat im Auftrag von Telstra eine unabhängige, wissenschaftliche Evaluation von vier unterschiedlichen Technologien zur Sprecherverifizierung durchgeführt. Im Besonderen interessierten hierbei Informationen über die Leistungsfähigkeit und Ausfallsicherheit der Lösungen in wirklichkeitsnahen Szenarien. Berücksichtigt wurden auch der Einsatz von Mobiltelefonen in lauten Gesprächsumgebungen, um die Brauchbarkeit der Technologien für Authentifizierungsfunktionen bei australischen Telefondiensten zu bewerten. Untersucht wurden SpeechWorks Speaker Verification SDK pro 3.0 von Scansoft, NVP 2.0.1 von Nuance, VocalPassword Build 5.0.5.0 von Persay und SpVerServer version1.3 von KAZ.
... mehr
Loquendo kündigt Loquendo TTS 7.3 an
21.08.2007, TMCnet
Im Zuge weiterer Verbesserungen an ihrer Text-to-Speech-Lösung (TTS) hat Loquendo die aktuelle Version 7.3 von Loquendo TTS angekündigt. Die Features der neuen Version sind ein leistungsfähiger Java API (Application Programing Interface) Layer, der eine verbesserte Verfügbarkeit für Java Programmierer ermöglicht, und ein neuer Algorithmus, der die Verständlichkeit von Sprache in geräuschvollen Umgebungen optimiert. Mit Hilfe des neuen Algorithmus „Dynamic Range Control“, der bereits im Loquendo TTS Director Tool zum Einsatz kommt, können Audiosignale mithilfe einfacher Laufzeitbefehle adaptiert werden. So werden verschiedene Audiogeräte und Sprecher aufeinander abgestimmt und die Verständlichkeit optimiert.
... mehr
Neues Whitepaper: Schnellladefunktion für SAP dank Voice
22.08.2007, Bitpipe
Sprachaktivierte Arbeitsprozesse innerhalb einer SAP Versorgungskette benötigen flexible Lösungen, die umgehend auf Änderungen im Ablauf reagieren können und die Risiken solcher Änderungen mindern. Erfahren Sie in diesem Whitepaper, wie der Materialfluss optimiert werden kann. Durch die Sprachaktivierung von SAP Warehouse Transaktionen werden fehlerfreie Auftragserfüllungen erreicht, selbst bei Echtzeitaktionen maximale Transparenz möglich und die Produktivität und Effizienz der SAP Versorgungskette optimiert.
... mehr
Sikom stattet Sprachportal VoiceMan mit technischen Finessen aus
22.08.2007, Verivox
Die Software VoiceMan ist in seiner aktuellen Version mit einer wesentlich vereinfachten Programmieroberfläche ausgestattet worden. Daher ist es jetzt auch Anwendern mit relativ geringen Fachkenntnissen möglich, umfassende Sprachdialoge für die automatisierte Sprachvermittlung im eigenen Unternehmen zu erzeugen. Außerdem lässt sich das Dialogsystem durch die Integration von VoIP-Technik und der Implementation eines ausgefeilten SIP-Protokoll-Stacks unabhängig von der vorhandenen ITK-Plattform einsetzen. Die Lösung erlaubt zusätzlich die kombinierte Bedienung von Internet und Telefon durch den Einsatz der grafisch orientierten Sikom-Skriptsprache (SKS) oder des Standards Voice Extended Markup Language (VoiceXML).
... mehr
Testen Sie teliSpeech für Ihre Anwendung
22.08.2007, VOICE Community
Das Softwareunternehmen telisma hat eine neue Version von teliSpeech für die deutsche Sprache auf den Markt gebracht. Mit der teliSpeech-Umgebung können Sprachapplikationen einfach und schnell entwickelt, implementiert und überwacht werden. Sie setzt auf eine hochwertige teliSpeech Spracherkennungs-Engine in Verbindung mit dem teliSpeech Framework, ein komplettes, auf Eclipse basierendes Entwicklungskit. Schließlich bietet die teliSpeech-Umgebung mehrere Sprachen an, von Britischem Englisch und Französisch bis zum indischen Englisch und Hindi. Interessenten macht telisma außerdem ein besonderes Angebot: teliSpeech für die deutsche Sprache kostenlos downloaden und die eigenen sprachbasierten Dienstleistungen (IVR, Self Service, Intelligent Call Routing, Voice Portal; etc.) einfach testen.
... mehr
Nuance bringt GPS-basierte Mobile Voice Search Lösung für BlackBerry Smartphones
15.08.2007, VOICE Community
Nuance hat Nuance Voice Control für BlackBerry Smartphones von Research In Motion (RIM) vorgestellt, ein sprachaktivierter Suchdienst, der mit einem Knopfdruck aktiviert wird. Nuance Voice Control wird ausschließlich über natürlichsprachliche Kommandos bedient. Die abonnementbasierte Applikation ist vollständig in das eingebaute GPS der Blackberry 8800 Serie integriert, wodurch sie zum ersten standortbezogenen mobilen Suchdienst mit Sprachaktivierung wird. Die Applikation unterstützt standortabhängige Unternehmenssuche und Navigation.
... mehr
Neue Kursangebote an der VoiceObjects University
15.08.2007, VOICE Community
Mit der Einführung der neuen VoiceObjects 7 Software hat der Anbieter von Sprachtechnologie das Kursangebot seiner VoiceObjects University erweitert. Zu den Highlights zählen VoiceObjects 7 Release Update (Überblick über alle Änderungen und Ergänzungen der neuen Produktversion VoiceObjects 7), Entwicklung von Text und Mobile Web Anwendungen für VoiceObjects Server (Lernen Sie, mit VoiceObjects Server textbasierte Anwendungen für die Nutzung zusätzlicher Telefonkanäle wie USSD und/oder Mobile Web zu erstellen), Phone User Interface Design für Text und Mobile Web Anwendungen (Erfahren Sie alles über die spezifischen Design-Strategien für die textbasierten Telefonkanäle USSD und Mobile Web), Installation und Wartung von VoiceObjects (Erklärung der administrativen und operativen Aspekte von VoiceObjects) und Infostore und VoiceObjects Analyzer (Lernen Sie Infostore und VoiceObjects Analyzer kennen, die leistungsstarke Lösung zur Datensammlung, Auswertung und Analyse in Echtzeit).
... mehr
Mit Voice-to-Text Messaging erreicht Skype jedes Handy
15.08.2007, VOICE Community
SpinVox gab die Unterzeichnung eines Vertrages mit Skype bekannt, im Zuge dessen die bekannte Software für Internet-Kommunikation über den Voice-to-Text Service von TuVox verfügen kann. Mit Hilfe des Services können alle eingehenden Sprachnachrichten von Skype-Nutzern direkt an ihr Handy weitergeleitet werden, falls sie nicht am PC sind. Die Skype-ID des Senders sowie seine Sprachnachricht erscheinen konvertiert als Text in einer SMS. Nutzer des Services brauchen keine neue Software auf ihr Handy laden und stellen sicher, dass jede eingehende Nachricht umgehend lesbar ist, selbst wenn ihr PC nicht eingeschaltet ist. Zu Beginn werden Deutsch, Englisch, Französisch und Spanisch unterstützt.
... mehr
Autonomy etalk revolutioniert Analyse von Kundeninteraktion
14.08.2007, DMN Newswire
Autonomy Corporation hat angekündigt, die Analyse von Contact Center Interaktionen durch eine Kombination innovativer Sprachtechnologie und Multi-Channel Analysen zu revolutionieren. Als Eckpfeiler eines intelligenten Contact Centers ermöglicht der Ansatz von Autonomy etalk sowohl ein umfassenderes Verständnis der eigenen Kunden zu erlangen sowie rechtzeitig die Trends und Themen zu erkennen, die die eigenen Kunden beschäftigen.
... mehr
Speech Analytics im Call Center
15.08.2007, CRMdaily
Immer schneller entdecken Unternehmen, wie sie die Erkenntnisse der Speech Analytics in verschiedenen Unternehmensbereichen gewinnbringend einsetzen. Dazu gehören laut Donna Fluss, President of DMG Consulting, Vertrieb, Marketing, Forschung und Entwicklung, Beschwerdemanagement, Risikomanagement, Betrugsversuche, Back-Office und natürlich das Contact Center. Speech Analytics sind innerhalb kürzester Zeit zu einem wichtigen Tool im Contact Center geworden. Wenn sie gut implementiert und überwacht werden, können solche Lösungen die Kundenzufriedenheit und Effizienz des Contact Centers steigern und die Leistungsfähigkeit der Agenten verbessern.
... mehr
Dictaphone PowerScribe von Nuance erreicht 1000. Kunden
08.08.2007, VOICE Community
Nuance ließ verlauten, dass das Unternehmen einen weiteren Meilenstein im Gesundheitsmarkt erreicht hat: die PowerScribe Lösung wurde an den 1000. Kunden ausgeliefert und belegt die breite Akzeptanz der Reporting Lösung für Radiologen. Angesichts der Verbreitung ihrer Lösung über Organisationen verschiedener Größe und verschiedener IT-Budgets erklärt Nuance, dass bezogen auf alle Anwender der Dictaphone PowerScribe die Lösung bislang $200 Mio. Transskriptionskosten eingespart hat, und von mehr Krankenhäusern und Ausbildungsstätten genutzt wird als irgendeine andere Spracherkennungssoftware.
... mehr
Speech Analytics im Call Center
08.08.2007, CRMBuyer
Der Nutzen heutiger Speech Analytics Lösungen reicht weit über die bloße Leistungssteigerung von Agenten hinaus. Es kann sogar behauptet werden, dass sie mittlerweile einen größeren Nutzen außerhalb des Call Centers zeitigen als innerhalb - dies vor allem, weil heutige Lösungen nicht nur ein paar Daten, wie z.B. einzelne Worte, erfassen können, sondern nahezu alle relevanten Daten vieler gleichzeitiger Anrufe erkennen und analysieren können. Unternehmen werden dadurch unterstützt, die Geschäftsprozesse als Ganzes zu erkennen und zu bewerten.
... mehr
Empirix bringt neue Version 6 von Testsoftware Onesight
31.07.2007, TeleTalk
Der Anbieter von Test- und Monitoringlösungen Empirix hat die neue Version 6 seiner Software Onesight herausgebracht. Mit der Lösung lassen sich sowohl Sprach- als auch Webapplikationen testen und überwachen. Admininstratoren erhalten automatisch eine Benachrichtigung, sobald die Software Abweichungen von vordefinierten Leistungsschwellen identifiziert. Weitere Merkmale und Funktionen: Visualisierung von Multi-Channel-Umgebungen, Leistungsindikatoren (KPIs), Analyse von Kundenerfahrungen, berechtigungsabhängige und anwendungsspezifische Konfigurations- und Steuerungsmöglichkeiten, Nutzergruppenspezifische Sicherheitslevel, verbessertes Reporting.
... mehr
Interactive Voice Response für Business Communications Plattformen
01.08.2007, TMCnet
Eine Business Communications Plattform (BCP) bietet Sprachservices als wiederverwendbare Komponenten in der IT-Architektur eines Unternehmens. In seiner einfachsten Form dient das BCP als flexible und softwarebasierte Alternative zu traditionellen Hardware IP-PBX Anlagen. BCPs bieten die gleichen Telefonfunktionen wie PBX-Anlagen, erweitern diese jedoch um zusätzliche Features wie Voicemail, Auto-Attendant und Conference Bridging. Im Gegensatz zu PBX-Anlagen verfügen BCPs nämlich über hochwertige Programmierschnittstellen für Anwendungen (API – Application Programming Interface), dank derer Unternehmen interaktive Sprachfunktionalitäten schnell und unkompliziert in Geschäftsprozesse, Internetseiten und Softwareapplikationen einbinden können.
... mehr
j2 Global bietet Sprachdienste jetzt auch in Deutschland und Österreich an
01.08.2007, Speech Technology Magazine
Die Produktlinien ebox, Onebox Receptionist und eVoice Receptionist von j2 Global Communications sind nun in sieben weiteren Ländern erhältlich, u.a. in Deutschland und Österreich. Die Angebotspalette des Unternehmens umfasst kosteneffektive Unternehmenslösungen, mit denen virtuelle Geschäftsstellen binnen 15 Minuten erstellt werden können. Kunden von Onebox und eVoice Receptionist können ihren Geschäftspartnern auf diesem Wege eine kostengünstige Möglichkeit anbieten, über eine inländische Telefonnummer direkt mit ihnen in Kontakt zu treten – anstatt kostspielige Auslandsverbindungen nutzen zu müssen. Anwender können ihren Kunden also die Wahrnehmung einer inländischen Geschäftsvertretung vermitteln, ohne physisch präsent zu sein. Zum Leistungsumfang von j2 gehören u.a. automatisierte Annahme mit Begrüßung in der Landessprache.
... mehr
VoiceObjects liefert Kerntechnologie für Telco Portal Suite von D+S solutions
24.07.2007, VOICE Community
VoiceObjects und D+S solutions gaben die Einführung der neuen Telco Portal Suite von D+S solutions bekannt. Die Lösung beinhaltet als technologischen Kern die Phone Application Server Software von VoiceObjects. Die Telco Portal Suite von D+S solutions ist ein Sprachportal für den automatisierten Kundenservice in der Telekommunikationsbranche und beinhaltet eine Vielzahl modular aufgebauter Funktionalitäten wie z.B. Authentifizierung, Aktivierung von Produkten, Stammdaten-Änderungen, Location-Based-Services, die Anforderung von Informationsmaterial sowie die Bereitstellung von FAQ-Antwortkatalogen über das Telefon. Durch die einfache Integration in bestehende IT-Systeme kann auf bereits existierende Daten zurückgegriffen und so die Effektivität der Anwendung weiter gesteigert werden.
... mehr
Sensory patentiert Spracherkennung via Netzwerk
24.07.2007, VOICE Community
Sensory hat die Vergabe des U.S. Patents 7,092,887 gemeldet, mit dem das Portfolio des Unternehmens über insgesamt drei Patente zur interaktiven Spracherkennung in Wireless- und Computer-Netzwerken, z.B. Handys und Internet, verfügt. Die Patente erläutern Methoden zur Durchführung sukzessiver Spracherkennungsanfragen, in denen die erkannte Antwort auf eine vorhergehende Anfrage den Ablauf des folgenden Dialogs bestimmt. Diesem liegt ein System zu Grunde, das der Architektur von Client-Server-Netzwerken nachempfunden wurde. Ein Beispiel für dieses Szenario ist eine Voice Search Anfrage von einem Wireless-Headset. Dabei wird ein Sprachinterface mit einem Spracherkenner kombiniert, damit der Anwender eine Datenbank mithilfe sukzessiver Sprachkommandos intelligent durchsuchen kann.
... mehr
Aspect Software bringt Aspect Spectrum ACD 10.1 mit SIP-basierter VoIP-Funktionalität heraus
25.07.2007, VOICE Community
Aspect gab die allgemeine Verfügbarkeit des Releases 10.1 seiner ACD-Lösung „Aspect Spectrum“ bekannt. Aspect Spectrum ACD unterstützt geschäftskritische, hochvolumige Kundeninteraktionen, indem es für die enge Integration zuverlässiger ACD-Funktionen in ausgereifte CTI-Anwendungen, sowohl in herkömmlichen leitungsvermittelten Infrastrukturen als jetzt auch SIP-basiert in IP-Umgebungen, sorgt. Mit der neuen VoIP-Funktionalität von Aspect Spectrum ACD 10.1 können Contact Center ihre Remote Agents leichter unterstützen und verwalten, jeder Anruf kann an jeden Standort im Netz umgeleitet werden. Außerdem entfallen die entsprechenden Carrierkosten; der Anruf kann über ein bestehendes LAN / WAN an andere SIP-basierte Schnittstellen geroutet werden.
... mehr
Mit Schulung und Selbststudium zum Certified Voice Professional
25.07.2007, TeleTalk
Eine Kombination von klassischen Schulungssequenzen und Selbststudium bietet der Schulungsanbieter Fast Lane mit dem Cisco Certified Voice Professional (CCVP) Blended Certification Package an. Das CCVP Blended-Programm bereitet auf das Examen zum Cisco Certified Voice Professional vor und setzt sich aus 34 Trainingstagen in den Schulungscentern von Fast Lane sowie zertifizierungsbegleitender Self Paced-Unterstützung in Form von E-Mail-Mentoring, E-Books, Labor-Simulationen, Prüfungsvouchers sowie offiziellen Cisco-Prüfungshandbüchern zusammen.
... mehr
Voice in PowerPoint Präsentationen
25.07.2007, Speech Technology Magazine
Tuval Software Industries hat die Veröffentlichung der Version 2.3 seines „Speech-Over Studios“ bekannt gegebenen. Die Software macht es möglich, Stimmen in PowerPoint Präsentationen einzubinden. Die neue Version kann dafür jede Form von Audioquellen nutzen, so z.B. Mikrofonaufnahmen, Prerecorded Files und Text-To-Speech (TTS). Anwender können ihr Ergebnis umgehend in Form einer Slide-Show überprüfen. Die eingebunden Stimmen können außerdem einfach editiert werden, ohne die Files neu aufnehmen zu müssen. Und sie können interaktiv eingebunden werden, z.B. dass beim Klicken auf ein Objekt die Stimme aktiviert wird.
... mehr
Neue optimierte Sprachsynthese von SpeechConcept überzeugt den WDR
18.07.2007, Presseanzeiger
SpeechConcept bringt erstmals eine webbasierte Anwendung auf den Markt: „SpeechOptimizer“ überzeugt mit sympathischer, weiblicher Stimme. Die TTS-Optimierung sorgt dafür, dass Wörter korrekt ausgesprochen, Wichtiges betont und Sätze natürlich intoniert werden. SpeechOptimizer ist lernfähig in Aussprache und Prosodie; das größte Lexikon deutscher Gegenwartssprache, das der Anwendung zugrunde liegt, wird dadurch stetig erweitert und verbessert. Dadurch ist die Sprachausgabe kaum von einer natürlichen Stimme zu unterscheiden. Die SpeechConcept-Lösung hat nun auch den WDR überzeugt, der in Kürze seine Verkehrsnachrichten mit SpeechOptimizer bereitstellen wird. Auch DAB- und MW-Aussendung an seine rund 10 Mio. Hörer ist geplant.
... mehr
SISR: Standardsprache für semantische Interpretation
18.07.2007, Speech Technology Magazine
Es gibt verschiedenste Wege, wie User auf den Prompt “Was möchten Sie gerne trinken?” reagieren können. Allein die unterschiedlichen Umschreibungsmöglichkeiten ein und desselben Getränkes müssen sowohl in der Grammatik eines Spracherkenners als auch in der semantischen Interpretation der benutzten Ausdrücke berücksichtigt werden. Lesen Sie deshalb im neuen Artikel des Speech Technology Magazine sowohl über die Standardisierung der „Speech Recognition Grammar Specification (SRGS)“ des World Wide Web Consortium (W3C) als auch über die „Semantic Interpretation for Speech Recognition“ (SISR).
... mehr
Mit Sprachtechnologie kulturelle Barrieren überwinden
16.07.2007, P.T. online
Vor 15 Jahren startete das Language Technology Centre (LTC) in London. Heute ist die Firma europaweit tätig und hat auch ein Büro in Washington. Wichtige Kunden und Partner sind die EU, die Deutsche Telekom, die Deutsche Post, das Fraunhofer Institut, DaimlerChrysler, EDAG, DEKRA und die IG Metall. Mit „LTC Worx“ hat das Unternehmen eine Software zur Organisation von Arbeitsabläufen entwickelt. Die Zielgruppe sind Sprachendienste in Großunternehmen und sprachbezogene Dienstleistungsunternehmen, die Dienste wie Dolmetschen und Übersetzen, Schulungen oder interkulturelle Beratungstätigkeiten anbieten. Das Computerprogramm soll die Arbeitsabläufe von der Angebotsformulierung bis zur Rechnungsstellung zielgenau steuern und sich gleichzeitig an die spezifischen Anforderungen der jeweiligen Unternehmen individuell anpassen.
... mehr
Next Id stellt neue Version seines Call Media-Steuerungstools vor
16.07.2007, TeleTalk
Next Id will mit einer neuen Version seines Steuerungstools Webcontrol Media die Kontrolle von Call Media-Aktionen wie Telefon-Gewinnspielen oder Votings erleichtern. Mit Webcontrol Media 2.1 ist eine flexible Zeitsteuerung hinzugekommen. Damit sollen Call Media-Aktionen vorausgeplant und zum Wunschtermin gestartet und beendet werden können. Die Einrichtung einer Zeitsteuerung ermöglicht es, je Wochentag mehrere Aktionen zu starten. Realtime-Monitor Funktionen, die Erweiterung um neue Dateiformate für Audios oder die Möglichkeit des Dialout in einen Ü-Wagen, ergänzen das Upgrade.
... mehr
Sprechen Sie mit HomeZIX
17.07.2007, VOICE Community
HomeZIX ist ein Freeware-Tool zum einfachen Aufbau eines privaten Heimnetzwerkes. Im Stile des intelligenten Hauses kann der Privatanwender mit dieser Lösung seine Heimgeräte via X10 und Zwave Dimmer vom Computer aus kontrollieren – auf Wunsch auch vollautomatisch. Neu ist nun die integrierte Spracherkennung VoiceZIX. Durch den Einsatz von Microsoft Sprachtechnologie können nun die Steuerungsbefehle für die Heimgeräte mit Sprachkommandos des Nutzers belegt werden. Neben dem spezifischen Sprachkommando und der erwünschten Aktion des Endgerätes kann zudem ein Audiosignal festgelegt werden, dass das den Erfolg des Sprachkommandos bestätigt.
... mehr
Portable Navigation ‚EB street director’ jetzt mit Spracheingabe
11.07.2007, VOICE Community
Die neueste Version der portablen Navigationslösung EB street director von Elektrobit hört auf Sprachbefehle. Das gewünschte Ziel kann der Benutzer jetzt einfach per Sprache eingeben. Damit hat EB als Erster Anbieter eine PND Navigation mit Voice Destination Entry vorgestellt. Präsentiert wurde die Lösung gemeinsam mit dem Hardwarehersteller Medion auf der diesjährigen CeBIT. Sämtliche Städte, Stadtteile und Dörfer eines Landes sowie Straßennamen plus Hausnummern lassen sich durch einfaches Sprechen des Namens eingeben. Vorher muss der Benutzer lediglich die Push-to-Talk-Taste drücken. Allein in Deutschland erkennt das System über 70.000 Orte.
... mehr
Microsoft überarbeitet Robotics Studio und bietet Spracherkennung
11.07.2007, telekom-presse.at
Microsoft bietet seit einigen Monaten mit seinem Robotics Studio eine Entwicklungsumgebung für die Programmierung von Robotern an. Die Plattform erlaubt Hobby-Programmierern und professionellen Entwicklern, Robotik-Anwendungen für verschiedene Arten von Hardware zu erstellen. Nun ist die 1.5-Version erschienen. Die neue Version unterstützt Windows Embedded CE 6.0 und Windows Mobile 6, bringt Verbesserungen im Bereich der Visual Programming Language sowie eine Reihe neuer Services. Unter anderem wurde auch die 3D-Simulation auf Basis der PhysX-Engine von Ageia verbessert und eine Spracherkennung integriert.
... mehr
Neues Trainingsangebot zum Thema Sprachtechnologie von telisma
11.07.2007, VOICE Community
Der teliSpeech Training Katalog bietet neue Angebote für Professionals aus dem Bereich Sprachtechnologie. Die „Integration Workshops“ sind eintägige Seminare zur Integration von teliSpeech durch MRCP oder proprietäre APIs. Das „Speech Technology Standards Program“ bietet ebenfalls an einem Tag einen Überblick über zentrale Standards wie VoiceXML, SRGS und MRCP. „Statistical Language Models“ vermittelt an zwei Tagen, wie mit eben diesen natürliche Spracherkennung gesteuert wird. Und wie die Leistungsfähigkeit eines Systems mithilfe des teliSpeech Tuning Kits optimiert wird, zeigt das „Acoustic Tuning Training“. Diese und weitere Kurse sind ebenfalls über die teliSpeechUniversity verfügbar.
... mehr
Sprachkommandos ergänzen Logistiksysteme
11.07.2007, silicon.de
Der Gerätehersteller Psion Teklogix will dem Trend Rechnung tragen, dass immer mehr logistische Prozesse das gesprochene Wort als Schnittstelle zwischen Mitarbeiter und Backendsystem nutzen. Die computergestützte Spracherkennung sei eine zunehmend unverzichtbare Hilfe beim Kommissionieren, teilte Psion mit. Das branchenweit vermarktete System 'Pick by Voice', für das Psion Technik herstellt, die teilweise weiterverarbeitet und in OEMs angepasst wird, soll die Fehlerquote bei dieser zentralen Aufgabe der Beschaffungskette spürbar senken, um bis zu 80 Prozent.
... mehr
Neue Lösung von FrontRange bietet ‚Install and Call’
11.07.2007, CRM Today
FrontRange hat die Verfügbarkeit seiner Version 5.1 von FrontRange Voice gemeldet, einer umfassenden Lösung für dynamische Unternehmen jeder Größe. Innerhalb der Produktpalette von FrontRange zeichnet sich FrontRange 5.1 durch die Kombination verschiedener Technologien aus, die in einer ausschließlich softwarebasierten IP-Telefonie-Lösung zusammengefasst wurden. Anwender benötigen nur noch einen PC, einen Breitbandanbieter und eine Internetverbindung – schon können die Anrufe beginnen.
... mehr
Sprachaktivierter Dienst zum Abwesenheitsmanagement entwickelt
11.07.2007, HR Zone
Kommunikationsgigant BT, Versicherer AXA PPP und Eckoh haben sich zusammengeschlossen und SAM (Sickness Absence Management) entwickelt. SAM kombiniert Spracherkennung mit anspruchsvoller Software, um Daten aus telefonischen Krankmeldungen von Angestellten zu erfassen und zu analysieren. Nachdem ein Anruf eingegangen ist, protokolliert SAM die Information und ordnet sie zu. Anschließend informiert er automatisch per Textnachricht vorgegebene Personen wie z.B. Vorgesetzte. SAMs Analysefunktionen können außerdem Trends aus den Krankmeldungen erkennen und Problembereiche identifizieren, die auf erhöhten arbeitsbedingten Stress zurückzuführen sind.
... mehr
Aculab präsentiert VoiceXML/CCXML Interpreter Software
11.07.2007, Speech Technology Magazine
Aculab hat die Verfügbarkeit seiner VoiceXML/CCXML Interpreter Software bekannt gegeben. Mit ihrer Hilfe können Entwickler von VoIP und PSTN Telefonie-Lösungen standardbasierte Interfaces für eine breite Palette von Anwendungen integrieren. Mögliche Anwendungen sind Interactive Voice Response (IVR), Voice Portals, Conferencing Services, Voicemail, Unified Messaging Platforms und Prepaid Services. Die Lösung ist auf den Betrieb mit Aculabs Media Processing and Signalling Plattformen konzipiert und erlaubt die nahtlose Skalierbarkeit von einem bis mehreren tausend Kanälen und aktive Anrufredundanz mit automatischer Ausfallsicherung, um sicherzustellen, dass keine Anrufe verloren gehen.
... mehr
TuVox präsentiert neue Hosting-Lösung für VoIP-Sprachapplikationen
04.07.2007, VOICE Community
TuVox meldete die Verfügbarkeit der gehosteten TuVox On-Demand-Applikationen mit VoIP-Zugang. Durch den Einsatz der dialogorientierten „TuVox Perfect Router“, „TuVox Knowledge Voice“ und der Suite von TuVox Self Service Sprachapplikationen, können Unternehmen in Kombination mit der „Genesys Voice Platform“ (GVP) ein effizientes, sprachaktiviertes Routing und eine konsistente Anrufererfahrung realisieren. Die kombinierte Lösung wird als gehostete Applikation angeboten und bringt die Vorteile von IP-basierten Schnittstellen ins Contact Center: Intelligentes Skill-Based Routing und Sprachfunktionalitäten.
... mehr
Loquendo zeigt sich erfreut über neue W3C Empfehlungen
04.07.2007, TMCnet
Wie kürzlich berichtet hat das World Wide Web Consortium zwei neue Standards zur Verbesserung der Funktionalitäten und der Interoperabilität von Voice Browsern veröffentlich: VoiceXML 2.1 und Semantic Interpretation for Speech Recognition (SISR) 1.0. Sprachtechnologie-Anbieter Loquendo zeigte sich darüber erfreut: „Als aktives Mitglied des W3C sind wir überzeugt, dass die beiden Empfehlungen essentielle Schritte auf dem Weg zu fortschrittlichen Sprachapplikationen darstellen. Sie ermöglichen einfache und schnelle Upgrades, eine verbesserte Übertragbarkeit und eine beschleunigte Annahme von Sprachtechnologie rund um den Globus“, kommentierte Daniele Sereno, Vice President of Product Engineering bei Loquendo in einer Erklärung.
... mehr
Microsoft patentiert sprachbasierte Caller ID
04.07.2007, TGdaily
Das Patent mit der Bezeichnung „Automatic Identification of Telephone Callers Based on Voice Characteristics” beschreibt eine Vision, in der nach Microsofts Vorstellungen zukünftige Telefonanrufe mittels eines „Akustischen Magazins“ geroutet werden – also einer Datenbank, die Klangmuster speichert. Diese könnte zu einem potenziellen Ersatz für verschiedene Anrufer-ID Services werden. Als Einsatzszenarien der Technologie sind reguläre Konversationen ebenso denkbar wie Interaktionen mit Call Centern. Während heute noch viele Anrufer „unkooperativ“ sind, um den langen Warteschlangen in automatischen Telefonanlagen zu entgehen, wäre eine sprachbasierte Caller ID in der Lage, Anrufer wesentlicher schneller mit den gewünschten Stellen zu verbinden.
... mehr
Nexidia Language Assessor soll Offshore Call Center Agenten unterstützen
04.07.2007, TMCnet
Größtes Risiko von Offshore Call Centern bleibt die Sprachfähigkeit ihrer Mitarbeiter. Weder dem Kunden noch dem Call Center ist geholfen, wenn Kunde und Agent nicht oder nur eingeschränkt miteinander kommunizieren können. Dieser Herausforderung nimmt sich Nexidias Language Assessor an. Er wurde konzipiert, um die Beurteilung und Verbesserung der Sprachfähigkeiten von Agenten zu automatisieren. Unternehmen können mit ihm den Sprachfluss ebenso wie die Aussprache von Mitarbeitern anhand konsistenter Standards überprüfen und gegebenenfalls ihr Training festlegen.
... mehr
Advanced Speech Services für Video Applikationen via VoiceXML nutzen
04.07.2007, VOICE Community
VoiceXML (VXML) ist eine offene Auszeichnungssprache, die aus dem wachsenden Bedarf erwachsen ist, audiobasierte Applikationen zu erstellen. Das Hauptanliegen von VoiceXML ist die einfache Entwicklung sprachbasierter Dialoge mittels Auszeichnungssprachen. VoiceXML wird hauptsächlich für die Erstellung von IVRs (Interactive Voice Response) verwendet und zeichnet sich durch die leichte Integration von TTS-Synthese (Text-to-Speech) und ASR-Servern (Automatic Speech Recognition) aus. Lesen Sie in diesem Artikel, wie die Vision VoiceXML Server von NMS die Erstellung von sprach- und videobasierten Applikationen unterstützen und in ihrer neuesten Version 3.0 auch interaktive Videoapplikationen (IVVR) ermöglichen.
... mehr
Dragon NaturallySpeaking für Salesforce AppExchange erhältlich
27.06.2007, VOICE Community
Nuance hat die Zertifizierung und Verfügbarkeit von Dragon NaturallySpeaking 9 für Salesforce auf AppExchange bekannt gegeben. Damit können Mitarbeiter erstmals nur mit ihrer Stimme Kundendaten und Bearbeitungsaufträge anlegen oder mit dem Salesforce User Interface interagieren. Das steigert ihre Produktivität und Effektivität um bis zu 300% im Vergleich zur benötigten Zeit beim Gebrauch einer Tastatur. Die Lösung von Nuance verleiht der On-Demand-CRM-Anwendung ebenso Sprachaktivität wie nahezu allen Windowsanwendungen inklusive Microsoft Office, Corel WordPerfect, allen gebräuchlichen Webbrowsern und Instant Messaging Applikationen.
... mehr
Neues Whitepaper von Nuance: Sprachbasierte Self Service Anwendungen in neue Höhen bringen
27.06.2007, Bitpipe
Sprachanwendungen spielen eine entscheidende Rolle für die Kundenerfahrung im Customer Care. Unternehmen investieren in diese Technologien, um den wachsenden Forderungen nach Informationszugang sowie Transaktionen und Kundendienstleistungen rund um die Uhr zu begegnen. Die erfolgreichsten dieser Anwendungen balancieren Automatisierung und Usability, um Self Service Interaktionen aus einer kundenzentrierten Perspektive zu bieten. Durch den intensiven Einsatz von Sprachtechnologie ermöglichen diese Lösungen effizientere Telefonkontakte, die eine größere Kundenzufriedenheit und bedeutende Kosteneinsparungen zeitigen. Dieses Whitepaper erläutert eine solche Anwendung, die höchste Genauigkeit, Verlässlichkeit und Bedienungsfreundlichkeit bietet.
... mehr
Envox Communications Development Platform unterstützt ‚EVA’
27.06.2007, VOICE Community
Envox Worldwide gibt bekannt, dass die Envox Communications Development Platform von Quentris, einem der größten europäischen Spezialisten für die Konvergenz von Sprache, Daten und Bildern, dazu verwendet wurde, einen hoch entwickelten und automatisierten Sprachassistenten zu entwickeln und einzusetzen. Dieser ist unter dem Namen EVA (aus dem Englischen: Electronic Voice Assistant) bekannt. Positioniert als virtueller Rezeptionist und persönlicher Assistent, verbindet EVA interne und externe Anrufer schnell und effizient mit ihrem Ziel, wobei der Return on Investment für Firmenkunden in wenigen Monaten gewährleistet wird. Quentris konnte EVA unter Nutzung der Envox Communications Development Platform innerhalb von nur 2,5 Monaten entwickeln.
... mehr
Fonix VoiceIn für Nintendo-Entwickler verfügbar
27.06.2007, VOICE Community
Fonix hat ein Lizenzabkommen mit Nintendo abgeschlossen und gehört nun zum „Third Party Tools Program“ für Nintendos neue Wii-Konsole. Dadurch können Entwickler von Nintendo nun die Spracherkennungstechnologie von „Fonix VoiceIn Game Edition“ und „Fonix VoiceIn Karaoke“ in Spiele für die Wii integrieren. Laut Tim K. Hong, Vice President Fonix Games, repräsentiere die Vereinbarung den nächsten Schritt in Fonix’ Vorhaben, die Nr. 1 der Anbieter von Sprachtechnologie für Videospiele zu werden. Die Technologie von Fonix treffe außerdem Nintendos Philosophie, Spaß und Innovation zu kombinieren.
... mehr
Neues Whitepaper von Nexidia: Best Practices in Speech Analytics
27.06.2007, Bitpipe
Speech Analytics haben sich ihren Platz im heutigen Arsenal der Business Intelligence und Performance Management Tools erkämpft. Trotzdem bleibt es wichtig, auf ein Set von Best Practices für die Implementierung von Speech Analytics zurückzugreifen. Nur so können Resultate optimiert werden. Erfahren Sie in diesem Whitepaper, welche Vorteile Speech Analytics Ihrem Unternehmen bringen und wie Sie von Kunden- und Marktanalysen profitieren können. Lernen Sie, wie Sie die Kundenzufriedenheit steigern, Produktangebote verbessern, operative Kosten senken und Ertrags-Chancen identifizieren bzw. maximieren.
... mehr
MediaExchange Homezone 5 von Intervoice erhältlich
27.06.2007, VOICE Community
Intervoice veröffentlicht die neueste universelle Kommunikationsplattform für Netzbetreiber, das Media Exchange mit HomeZone. Die bewährte Media Exchange Plattform wurde in Version 5 grundlegend überarbeitet und um viele Funktionen erweitert, die unter anderem Multimodale Anwendungen als Teil der individuellen HomeZone Kommunikation ermöglichen. HomeZone hilft Mobilfunkkunden persönliche Daten und Einstellungen wie Profile, Login, Kontakte oder Sprache zu verwalten. Das neue SCXML (State Chart Extensible Markup Language) ist ebenfalls Bestandteil der HomeZone und erlaubt ein von der Netzwerkinfrastruktur unabhängiges „Single Session Multitasking“, den gleichzeitigen Zugriff und Steuerung verschiedene Anwendungen durch Sprache und Dateneingabe. SCXML ermöglicht auch Multi-modale Applikationen direkt auf Netzwerkebene, daher ist es auch nicht notwendig eine Software auf das Endgerät des Kunden zu laden.
... mehr
Philips SpeechMagic erhält Citrix Ready-Status
27.06.2007, Business Wire
Royal Philips Electronics gab bekannt, dass seine professionelle Spracherkennungstechnologie SpeechMagic den Status "Citrix Ready" erhalten hat. Dieser Auszeichnung gingen erfolgreiche Evaluierungstests voraus, welche die Kompatibilität beider Systeme bestätigten. Indem Philips jene Kriterien erfüllt, die Voraussetzung für eine Teilnahme an der Initiative "Citrix Ready" sind, beweist das Unternehmen, dass es in der Lage ist, die 50 Millionen Citrix-Benutzer an 180.000 Standorten mit leistungsfähiger Technologie zu versorgen. Darüber hinaus können von nun an über 5.000 Citrix-Händler weltweit auf eine zuverlässige Spracherkennungstechnologie verweisen und so ihren Kunden dabei helfen, die Produktivität, Effizienz und Genauigkeit ihrer Arbeit signifikant zu steigern.
... mehr
Aculab stellt VoiceXML/CCXML Interpreter Software vor
27.06.2007, CompactPCI
Aculab hat die Verfügbarkeit seiner VoiceXML/CCXML Interpreter Software bekannt gegeben. Die Software erlaubt Entwicklern von VoIP- und PSTN-Telefonielösungen, standardbasierte Interfaces für eine Vielzahl von Anwendungen zu implementieren, wie Interactive Voice Response (IVR), Sprachportale, Conferencing Services, Voicemail, Unified Messaging Plattformen und Prepaid Services. Der Gebrauch der Software beschleunigt den Entwicklungsprozess von Anwendungen erheblich, da nicht mehr auf proprietäre APIs (Application Programming Interfaces) der einzelnen Komponenten zurückgegriffen werden muss. Dadurch verkürzt sich die Time-to-Market und mit ihr alle assoziierten Kosten.
... mehr
Dialogic erweitert Eiconcard Produktfamilie für X.25-Umgebungen
20.06.2007, VOICE Community
Dialogic bietet jetzt auch die Eiconcard S94 als PCI-Express-Adapter (PCIe) an. Die neue Bauweise der Eiconcard S94 ermöglicht die Integration, Konfiguration und Anbindung von Kommunikationsprotokollen für neue PCI-Express-Slots. Die Eiconcard S94 ist als weltweit erster X.25 PCIe-Adapter am Markt erhältlich. Damit wird das Engagement von Dialogic im Transaction Processing (X.25) Segment unterstrichen. Johann Rettinger, Key Account Manager DACH bei Dialogic, unterstreicht: „Mit aktuell über 900.000 Eiconcards weltweit im Einsatz ist Dialogic der führende Lösungsanbieter von X.25-Hard- und Software. Mit dem neuen Eiconcard S94 PCIe-Adapter unterstützen wir eine kurzfristig realisierbare, sanfte Lösungsmigration für die schnelle und gleichzeitig eine der sichersten Kommunikationsverbindungen zwischen Endgeräten, PCIe Server-Platformen und Rechenzentren.“
... mehr
Perfektes Team für Unified Messaging
20.06.2007, VOICE Community
Die Unified Messaging-Lösung IXI-UMS von serVonic ist erfolgreich für die neuen Dialogic 3000 Media Gateways getestet. Damit kann die Unified Messaging-Lösung ab sofort noch flexibler im Zusammenspiel mit Microsoft Unified Messaging und Microsoft Exchange Server 2007 eingesetzt werden. Mit dem neuen Microsoft Exchange Server 2007 stehen erstmals integrierte Unified Messaging-Funktionen für Faxempfang, Voice Box und Mobility zur Verfügung. Unternehmen, die diese Microsoft Unified Messaging-Funktionen nutzen wollen, bietet serVonic ab sofort eine IXI-UMS Special Edition an, die die fehlenden UM-Funktionen Faxversand und SMS ergänzt.
... mehr
Intervoice bringt Media Exchange 5 auf den Markt
20.06.2007, TeleTalk
Intervoice hat das Release 5 seiner Kommunikationsplattform Media Exchange auf den Markt gebracht. Sie unterstützt Unternehmen bei der Migration von traditioneller Telefontechnik auf SIP- oder IMS-basierte Technik. Die Plattform bietet Anwendungen wie Voice Mail, Voice to SMS, Voice to MMS, Video Mail, Adressbuch und Kalender. Das neue Relase umfasst zudem die so genannte Home Zone, mit der Nutzer nach Intervoice-Angaben persönliche Daten wie Log-ins, Profile oder Kontakte verwalten können.
... mehr
Kostenloses Whitepaper von Aspect: Human vs. Computer
20.06.2007, Speech Technology Magazine
Halten Sie Ihre Kunden in der Leitung. Geben Sie ihnen keinen Grund auszusteigen. Sprachbasierter Self Service kann ihrem Contact Center helfen, eine herausragende Kundenerfahrung zu bieten, die ihren Kunden positiv in Erinnerung bleibt. Dieses Whitepaper führt durch die Vorteile einer sorgsam geplanten Automatisierung des Contact Centers und zeigt die Grenzen von Touch-Tone-Systemen auf. Lernen Sie, wie fortschrittliche Technologien und effizientere Prozesse Ihre Geschäftsziele unterstützen: geringere Kosten, zufriedenere Kunden und gesteigerte Erträge durch Agenten, die weniger Zeit mit Standardanfragen verbringen, um sich Wichtigerem zu widmen: der Ertragsgenerierung.
... mehr
W3C standardisiert neue Funktionalitäten für VoiceXML und intelligentere Spracherkennung
20.06.2007, Speech Technology Magazine
Das World Wide Web Consortium (W3C) hat neue Standards veröffentlicht, die die Funktionalitäten und die Interoperabilität von Voice Browsern sowie Spracherkennungssystemen steigern. Die W3C Voice Browser Working Group hat ihre Arbeit an “VoiceXML 2.1” sowie “Semantic Interpretation for Speech Recognition (SISR) 1.0” abgeschlossen, zwei entscheidenden Komponenten des W3C „Speech Interface Framework“. Zu den neuen Features der VoiceXML-Erweiterung gehören dynamische Referenzen auf Grammatiken und Scripts. Die Überarbeitung des „Semantic Interpretation for Speech Recognition (SISR 1.0)” macht es möglich, die Resultate eines Spracherkennungsprozesses einzelner Worte aus einem vollständig gesprochenen Satz so zu strukturieren, dass die Sprachanwendung sie direkt weiterverarbeiten kann ohne die erforderlichen Eingaben einzeln abzufragen.
... mehr
Es geht um die Persona, nicht die ‘Personality’
20.06.2007, Speech Technology Magazine
Haben Unternehmen früher Monate und Millionen in die Entwicklung „persönlicher“ IVR-Systeme investiert, stößt dieser Trend heute zunehmend auf Kritik. Auf der Suche nach einer möglichst perfekten Corporate Voice wurden nicht nur Stimmen sondern ganze Biografien um diese herum erschaffen, um die vormals synthetisch klingenden Computerstimmen mit mehr Menschlichkeit auszustatten. Doch Kunden brauchen nicht zu wissen, dass ihre automatische Bearbeiterin einen Stanfordabschluss in Gesundheitswesen hat und in ihrer Freizeit gerne Musik hört. Sie wissen, dass es eine Computerstimme ist. Im Gegenteil zur beabsichtigten Wirkung bieten diese Details Angriffsfläche für Kritik, wenn es zu Schwierigkeiten im System kommt – und diese reflektieren die Kunden auf das Unternehmen.
... mehr
Nuance präsentiert Dictaphone PowerScribe 4.8 und neue Features
13.06.2007, VOICE Community
Nuance meldet die Verfügbarkeit der PowerScribe Workstation 4.8, der führenden sprachaktivierten Reporting-Lösung für Radiologen. Die neue Version bietet ein vereinfachtes User Interface durch die Integration von Vocada’s „Veriphy“, dass die kurzfristige Kontaktierung anderer Klinikangestellter in kritischen Fällen ermöglicht. Die Integration von Amirsys STATdx Clinical Decision Support unterstützt Radiologen durch den sprachbasierten Zugriff auf Referenzmaterial in Situationen der Entscheidungsfindung. Außerdem kündigte Nuance die Verfügbarkeit der radiologischen „Macro Library“ von StructuRad für PowerScribe an, die ein Archiv mit mehr als 900 Vorlagen für Berichte bietet.
... mehr
Eine Einführung in Spracherkennungslösungen: die Technologie, die Anbieter und der Markt
13.06.2007, Speech Technology Magazine
Dieses Whitepaper von RightNow bietet einen einfachen Einstieg in Lösungen heutiger Sprachtechnologie. Lernen Sie alles über die Technologie, ihre Vergangenheit und ihre Anwendung im heutigen Geschäftsleben. Verstehen Sie die Geschäftsvorteile, die Sprachlösungen bringen, und entdecken Sie die einzelnen Komponenten, die zu einer solchen gehören. Gewinnen Sie außerdem einen Überblick über den aktuellen Markt für Sprachlösungen mit seinen Händlern, Produkten und Angeboten. Zu dem Whitepaper gehören ebenfalls strategische Empfehlungen von Datamonitor, die sich an Unternehmen richten, die den Einsatz von Spracherkennung im Kundendienst erwägen.
... mehr
Aspect veröffentlicht Unified IP 6.5
13.06.2007, TMCnet
Aspect Software meldet die Veröffentlichung von „Aspect Unified IP 6.5“ zum 28. Juni. Es handelt sich dabei um eine vereinheitlichte VoIP Contact Center Lösung auf Basis des SIP (Session Initiation Protocol). Sie bietet Automatic Call Distribution (ACD), Predictive Dialing, Voice Portal Capabilities, Internetkontakte, Workflow Management, Multichannel Recording und Qualitätsmanagement, um Unternehmen zu unterstützen bei der Umsetzung ihrer Geschäftsziele im Kundenservice, beim Inkasso sowie beim Handel und Telemarketing.
... mehr
Fonix bringt FonixTalk auf den Markt
30.05.2007, VOICE Community
Fonix Speech hat FonixTalk 6.0 veröffentlicht, ein erweitertes Update ihrer früheren Text-to-Speech-Lösung (TTS). FonixTalk 6.0 ist eine mehrsprachige TTS-Software, die mit dem flächenmäßig kleinsten Speicher in der Branche erhältlich ist. Das macht sie ideal für den Einsatz in „embedded“ Applikationen. Die Software setzt auf Fonix´ vormaligem DECtalk auf, bietet aber signifikante Verbesserungen im Bereich der natürlichen Spracherzeugung, die weniger synthetisch und „robotisch“ klingt.
... mehr
SoundBite Communications veröffentlicht ‘Autopayment Interface’
30.05.2007, Speech Technology Magazine
SoundBite hat für seine Kundenkommunikations-Plattform das “SoundBite Agentless Direct Collect Autopayment Interface” freigegeben. Das neue Interface erlaubt es SoundBite, voll automatisierte Inbound- und Outbound-Gespräche durch eine Kombination aus fortschrittlicher Telefonie und XML nahtlos in mehrere marktführende Plattformen zur Zahlungsabwicklung einzubinden. Agentless Direct Collect wird exklusiv für die On-Demand Customer Contact Plattform von SoundBite angeboten, mit deren Hilfe über einen Web-Browser automatisierte, interaktive Sprachnachrichten initiiert werden können, mit deren Hilfe Kunden unmittelbar einen Zahlungsprozess einleiten können.
... mehr
RightNow Connect' für unternehmensweite Integrationsfunktionen
23.05.2007, VOICE Community
RightNow stellt RightNow 8.1 vor, eine On-Demand-Lösung für Kundenservice, Vertrieb, Marketing und Feedback. Bestandteil der neuesten Version ist RightNow Connect, eine auf Standards basierende SOA Integrationsumgebung, mit der Unternehmen ihre CRM-Lösung mit anderen Systemen integrieren können. Darüber hinaus unterstützt RightNow’s CRM-Lösung jetzt 21 Sprachen und Dialekte. Die Integrationsfunktionen von RightNow Connect umfasst einen vorkonfigurierten Adapter für Genesys 7.5. Wenn ein Kunde hier eine Self-Service-Verbindung verlassen möchte, um stattdessen mit einem Agenten zu sprechen, wählt die Lösung automatisch den jeweils am besten geeigneten Agenten aus.
... mehr
Neues Whitepaper von RightNow: Voice Self-Service nutzt Informationsdatenbanken um Kundenerfahrung zu verbessern
23.05.2007, Speech Technology Magazine
In diesem kostenlosen Whitepaper erläutert RightNow, wie Informationen konsistent, termingerecht und kostenneffizient zu Kunden gelangen, wie der Service ohne zusätzliche Kosten verbessert werden kann und wie von mehrfach verwendbaren Komponenten aus Wissensdatenbanken und webbasiertem Self Service profitiert werden kann. Die Vorteile von sprachbasiertem Self Service sind unabstreitbar attraktiv. Dank neuer Fortschritte der Sprachtechnologie ist besserer, schnellerer und kosteneffizienterer Service nun für jedermann möglich.
... mehr
Loquendo versorgt Cystelcom mit Text-to-Speech
23.05.2007, TMCnet
Loquendo meldet, dass Cystelcom, spanischer Anbieter von Contact Center und 3G-Telefonie-Lösungen, auf Text-to-Speech (TTS) Technologie von Loquendo setzt. Cystelcom wird die Technologie in ihre Veedia-Plattform für mobile Videolösungen integrieren. Mit den TTS-Funktionalitäten wird es dann möglich sein, sprachbasiert Zugriff auf Video-Applikationen zu erhalten, Videonachrichten zu empfangen und zu versenden oder auch Kamerasysteme zu überwachen und Videozeitungen zu lesen.
... mehr
Call Recording für Ciscos Unified Communications System
23.05.2007, TMCnet
Telrex, Entwickler der Call Recording und Monitoring Software CallRex IP, hat Unterstützung für Ciscos Smart Business Communications System angekündigt. CallRex IP sei in die Lösung zu integrieren und biete IP-basiertes Recording und Monitoring für die IP Phones von Cisco. Kunden aus dem Bereich KMU könnten Lizenzen für die Software beliebig kombinieren. So erlaubten unlimitierte Lizenzen kriterienabhängige automatische Aufzeichnungen aller oder ausgewählter Anrufe, während On-Demand-Lizenzen die manuelle Aufzeichnung in Echtzeit ermöglichten.
... mehr
VoiceSignal veröffentlicht neueste Version von VSpeak
23.05.2007, Speech Technology Magazine
Die aktuelle Version von VoiceSignals VSpeak, einer “embedded“ Text-to-Speech-Lösung (TTS), ist in Englisch, Französisch, Deutsch, Italienisch und Spanisch erhältlich. Dank neuester Technologien ist VSpeak 1.1 besonders für den Einsatz auf Mobiltelefonen konzipiert und trägt der begrenzten Speichergröße der Geräte Rechnung. Es kann auf Geräten mit weniger als 500 Kilobyte Speicher zum Einsatz kommen, um Sprachsynthese auch dort zu nutzen. Damit vervollständigt VoiceSignal seine Produktlinie VSuite und VMode, mit der Hersteller von Mobiltelefonen ein vollständiges Sprachinterface anbieten können.
... mehr
Genesys veröffentlicht VoiceXML Sandbox
16.05.2007, Targetwire.com
Die VoiceXML Sandbox richtet sich an Unternehmen, die ihre ersten Schritte im Bereich sprachbasierten Self-Services machen wollen. Zentrale Elemente des Angebots sind die Genesys Voice Platform und der IBM WebSphere Voice Server. Sandbox versetzt Unternehmen in die Lage, sprachbasierte Self-Service Anwendungen in ihre Inbound Aktivitäten einzubinden ohne die technischen Risiken und finanziellen Hürden, die bisher mit der Integration sprachbasierter Dienste in Verbindung standen. Dadurch verfügen IT- und Telekommunikationsabteilungen erstmals über die Fähigkeit, VoiceXML basierte Protokolle auf einem einzigen System zu entwickeln und zu testen – mit der Option, Daten aus bestehenden Webanwendungen des Unternehmens zu integrieren.
... mehr
Whitepaper von Intervoice: Personalisierung von Kundenkontakten durch High-Tech Channels
16.05.2007, InformationWeek
Dieses Whitepaper bietet aktuelle Best Practices aus der Call Center Branche mit besonderem Fokus auf der Personalisierung von Anruferlebnissen durch den Einsatz sprachbasierter IVR-Kundendienst-Channels. Obwohl Personalisierung noch immer als das bezeichnet wird, was durch Automatisierung nicht erreicht werden kann, zeigt dieses Whitepaper Beispiele, in denen Automatisierung den Kunden ein gutes Erlebnis bietet und sie durch die Berücksichtigung vorhandener Kundendaten gleichzeitig individuell behandelt.
... mehr
Intervoice veröffentlicht Next-Generation Voice Portale
16.05.2007, Hardwarezone
Intervoice stellte auf der “Interactions 2007” Konferenz die neuen Voice Portale hunderten von Kunden vor. Die neuen Portale erlauben komplexe, simultane Sprach- und Daten-Interaktionen zur Bereicherung und Veredelung von Anruferlebnissen unabhängig vom verwendeten Gerät. Mithilfe dieser fortschrittlichen Funktionalitäten, die zu Intervoice´ Unified Communications-Strategie für mobile Geräte zählen, können Unternehmen ihren Kunden personalisierten Self-Service auf höchstem Niveau bieten - gleichwohl ob diese ein Telefon, einen Computer oder ein Mobilgerät nutzen.
... mehr
serVonic Unified Messaging startklar für Microsoft Exchange 2007
16.05.2007, VOICE Community
Mit dem neuen IXI-UMS Exchange 2007 Connector steht die serVonic Unified Messaging Lösung IXI-UMS ab sofort für Microsoft Exchange Server 2007 zur Verfügung. Mit nahtloser Integration in das Active Directory, konsequenter Single Store Architektur und einem modularen Konzept ist die serVonic Unified Messaging-Lösung mit allen Diensten Fax, Voice und SMS eine komplett in die neue Messaging Plattform von Microsoft integrierte Lösung. Zeitgleich mit dem neuen Connector released der Olchinger Softwarehersteller die neuen IXI-UMS Clients Tools 5.7, die an Arbeitsplätzen mit Microsoft Windows Vista, Outlook 2007 und Office 2007 System genutzt werden können.
... mehr
Neuer Channel auf TMCnet: Virtual Call Center
16.05.2007, TMCnet.com
Technology Marketing Corporation (TMC) meldete, dass der neue Virtual Call Center Channel, gesponsort von Sentillion vBusiness, als 111. Erweiterung des TMCnet Channel-Programms gestartet wurde. Der neue Channel stellt Call Center Lösungen für Home-based Agents vor und bietet einen Überblick über die Produkte des Sponsors. Außerdem können Interessierte wertvolle Ressourcen wie Produktinformationen, Evaluationen, Reviews, Sonderbeiträge und Branchennews zum Thema finden.
... mehr
Nuance bringt sprachaktivierte Feature von Mercedes-Benz in Fahrt
09.05.2007, VOICE Community
Nuance meldet, dass seine Sprachtechnologie in der 2007er Mercedes-Benz C-Klasse zum Einsatz kommen werde, um Sicherheit und Komfort der Bedienung von Audio-, Navigations- und Kommunikationssystemen zu revolutionieren. Das neue Steuerungssystem der Wagen „Command APS“ ermögliche Fahrern, per Sprachbefehl Kontakte aus ihrem Telefonbuch anzurufen, Musik auszuwählen und Adressen in das Navigationssystem einzugeben. DaimlerChrysler präsentierte die sprachaktivierte In-vehicle Applikation als eine Ausstattungsoption der neuen C-Klasse auf dem Genfer Auto Salon.
... mehr
Genesys und ClickFox verbessern Kundenerfahrung durch Analyse und Customer Behaviour Intelligence
09.05.2007, VOICE Community
Genesys und ClickFox melden die Integration der Customer Behavior Intelligence (CBI) Software von ClickFox in die Genesys 7.5 Customer Interaction Management Suite sowie den Vertrieb der ClickFox Software durch Genesys. In der Vergangenheit stellte die Nachverfolgung von Kundeninteraktionen für Unternehmen dann ein Problem dar, wenn Kunden diese z.B. im Internet begannen aber in einem anderen Kanal des Kundendienstes beendeten oder vor Abschluss des Interaktionsprozesses diesen gar abbrachen. Mögliche Probleme oder Erkenntnisse blieben unausgewertet. Als Folge finden Kunden heute oftmals schwere Kontinuitätsbrüche, wenn sie zwischen verschiedenen Kontaktkanälen wechseln. Die kombinierte Lösung von Genesys und ClickFox will hier Abhilfe schaffen.
... mehr
Neuer ‚VoiceObjects Analyzer’ als beste Self-Service-Analysesoftware eingestuft
09.05.2007, VOICE Community
VoiceObjects gab bekannt, was ein kürzlich veröffentlichter Bericht des Analystenunternehmens Opus Research, “Analytics and Reporting for Phone-Based Self-Service” zeigt: Der neue VoiceObjects Analyzer, eine Komponente der VoiceObjects 7 Software Suite, übertrifft vergleichbare Produkte durch die Bereitstellung einer Lösung für Analysen und Auswertungen, die kompatibel mit unternehmensweiten Business Intelligence- und Analyse-Lösungen ist. VoiceObjects Analyzer ist eine vollständige Service-Analyseumgebung, die im gesamten Unternehmen eingesetzt werden kann, um damit zahlreiche Fragestellungen zum Anruferverhalten, zur Leistung des Systems und der Awendung sowie zu Erkennungserfolgen zu beantworten.
... mehr
Loquendos Text-To-Speech haucht den virtuellen Assistenten von As An Angel eine Stimme ein
09.05.2007, TMCnet
As An Angel, ein Start-up das 2001 gegründet wurde, bietet transaktionale, animierte Agenten für die Anwendung im Kundendienst von Marketing- und Kommunikationsabteilungen. Die virtuellen Agenten werden durch einen Avatar repräsentiert und durch Echtzeit-Animationstechnologie erzeugt. Sie sehen nicht nur lebensecht aus, sondern bewegen sich auch natürlich und verfügen über verschiedene Gesichtsausdrücke. Nachdem sie bereits sprachbasierte Interaktionen verstehen konnten, können sie nun, dank der Technologie von Loquendo, auch sprechen und antworten. Im Betrieb sollen sie echte Agenten bei Standardanfragen unterstützen und diese für anspruchsvollere Aufgaben freistellen.
... mehr
Geldgespräche: Acapela Group und die schwedische SEB Bank verleihen schwedischen Geldautomaten eine Stimme
09.05.2007, VOICE Community
Acapela, die führende europäische Gruppe für multilinguale Sprachlösungen, und die schwedische Finanzgruppe SEB haben in ganz Schweden sprechende Geldautomaten installiert. Der neue Service soll sehbehinderten und dyslexischen Menschen die Verwendung der Geldautomaten vereinfachen, aber auch für ausländische und ältere Verwender kann ein sprachlicher Zugang Erleichterung bringen. Die neue Anwendung kommt an allen 400 Geldautomaten der SEB Bank in Schweden zum Einsatz. Der Sprach-Mechanismus wird per Knopfdruck vor Eingabe der Bankkarte aktiviert. Die Sprachsynthese-Option gibt es nicht nur für die Geldabhebung, sondern auch für gewisse Auskünfte über den Kontostand und zum Wertaufladen des Mobiltelefons.
... mehr
Vocollect präsentiert Sprachsoftware auf Open Source-Basis
09.05.2007, VOICE Community
Vocollect bringt mit “VoiceLink 3.0” erstmals eine Software für seine Sprachanwendungen heraus, die mit einer Open Source-Plattform, der „Vocollect Voice Integration Platform” arbeitet. Das Unternehmen schafft damit ein Komplettangebot, das nicht nur zu Verbesserungen bei Distributions-, sondern auch bei IT-Prozessen führt. Aufgrund seiner Open Source-Architektur ist Voice Link 3.0 einfach in verschiedenste handelsübliche und kundenindividuelle Lagerverwaltungssysteme integrierbar.
... mehr
Kostenloses Whitepaper: Wie stellen Sie sicher, dass Ihre Kunden zufrieden auflegen?
09.05.2007, Speech Technology Magazine
In der Vergangenheit ging es auf den Agendas der Contact-Center fast ausschließlich um kostenbezogene Wettbewerbsfähigkeit. In letzter Zeit hat sich jedoch ein Umschwung hin zu Kundenbindung und optimiertem Kundenservice gezeigt. Kundenservice hat sich zu einem entscheidenden Differenzierungsmerkmal entwickelt, so dass Contact-Center heute versuchen, ihren Service zu verbessern und kosteneffizient zu sein. In diesem Whitepaper erfahren Sie, wie sie durch den Einsatz automatisierter Sprachdialogsysteme über die bloße Erfüllung wachsender Kundenansprüche hinausgehen können - bieten Sie ihnen ein Erlebnis, das sie wirklich zufrieden auflegen lässt.
... mehr
Nuance veröffentlicht den Recognizer V9
02.05.2007, VOICE Community
Nuance hat den „Nuance Recognizer v9“ präsentiert, eine neue Spracherkennungs-Engine, die speziell für eine Verbesserung der Leistungsfähigkeit und Qualität sprachbasierter Kundenpflege und Suchfunktionen konzipiert ist. Das Projekt mit dem Entwicklungsnamen „Quantum“ stelle den Gipfel jahrelanger Entwicklungen und Innovationen im Bereich Sprachtechnologie dar, so Nuance. Die neue Engine bietet ein flexibles User-Interface, fortschrittliche akustische Modelle und hochwertigen Natural Language Support. Sie ist darauf ausgelegt, Anwendungen mit umfangreichem Vokabular zu bewältigen, wie telefonbasierten Kundendienst, Verzeichnisdienste und Suchfunktionen.
... mehr
Neuer Podcast von Nuance: Die Vorteile von Sprachaktivierung im Unternehmen
02.05.2007, Bitpipe.com
Neue Innovationen machen es Unternehmen möglich, durch den Einsatz von Spracherkennung und intelligentem Call-Routing Geld zu sparen, ihre Produktivität zu steigern und ihren Kunden wie auch Mitarbeitern moderne Dienste zu bieten. Der „Speech Attendant” von Nuance ist eine startbereite Lösung, durch die Anrufer bei Nennung eines Namens, einer Abteilung, eines Dienstes oder einer bestimmten Stelle an die jeweils richtige Abteilung weitergeleitet werden. Das Suchen nach Telefonnummern und Warten auf einen freien Mitarbeiter in der Auskunft entfallen dadurch. Tom Hayes, Major Accounts Manager bei Nuance, diskutiert in diesem Podcast einige der Applikationen aus dem Bereich Spracherkennung und intelligentem Call-Routing, die bei Kunden bereits realisiert wurden.
... mehr
Neues Whitepaper von Envox: Den Wert sprachaktivierter IVRs abschätzen
02.05.2007, Speech Technology Magazine
Nahezu jeder, der schon einmal gebührenfreie Telefonnummern angerufen hat, hat den Trend zu IVR-Systemen bemerkt. Die Technologie funktioniert und macht sich täglich für unzählige Unternehmen und Organisationen bezahlt. Aber wie jede Technologie muss Sprachtechnologie nicht unter allen Umständen die beste Wahl sein. Was sind ihre Vorteile und, ebenso wichtig, wo liegen ihre Grenzen? Dieses Whitepaper bietet einen Plan zur Bewertung von Sprachtechnologie und ihren Möglichkeiten für Unternehmen sowie zur Erstellung einer erfolgreichen Applikationsstrategie.
... mehr
Whitepaper von Nexidia: Best Practices mit Speech Analytics
02.05.2007, VOICE Community
Speech Analytics haben sich mittlerweile ihren Platz im heutigen Arsenal der Business Intelligence verdient. Der entscheidende Erfolgsfaktor jetzt liegt in einem bewährten Set von Best Practices für die Implementierung von Speech Analytics in einer bestehenden Unternehmensumgebung. Die Vorteile von Speech Analytics lassen sich in drei Kategorien einteilen: Verbesserung der operationalen Effektivität, Verfeinerung des Kundenerlebnisses und Weiterentwicklung der Market bzw. Business Intelligence.
... mehr
VoiceObjects 7 bringt Text, Video und Web auf mobile Telefone
25.04.2007, VOICE Community
VoiceObjects meldete die Verfügbarkeit von VoiceObjects 7, der Phone Application Server Software Suite. Die neueste Version der preisgekrönten Software bietet jetzt auch Support für Telfonapplikationen, die Text- und Web-Channels nutzen, und unterstützt elf weitere Medienplattformen. VoiceObjects kündigte zugleich auch „VoiceObjects Analyzer” an, eine Komponente von VoiceObjects 7, die von Opus Research als bestes Self-Service Analyse-Tool ausgezeichnet wurde.
... mehr
Intonationsstrukturen in Sprachdialogsystemen
25.04.2007, VOICE Community
Bei der Gestaltung eines Sprachdialogsystems steht der Designer vor der Herausforderung, die einzelnen Systempfade sprachlich möglichst flüssig zu gestalten. Eine solche flüssige Gestaltung ist nicht nur abhängig von Dialog-Fluss und Text, sondern auch von der Intonationsstruktur. Eine wichtige Fragestellung, mit der sich die Sprachdialogexperten von EXCELSIS schon sehr lange beschäftigen und durch das sich EXCELSIS Anwendungen auszeichnen, wie Geschäftsführer Dr. Nils Herda betont. Adäquate Intonierungen geben Aufschluss darüber, wie das Gesagte gemeint ist, und machen komplexe Texte leichter verständlich. In der Praxis stellt dies jedoch häufig ein Problem dar, weil Texte nach ihrer Fertigstellung durch den Dialog-Designer dem Sprecher in der Regel fragmentiert ohne Kontextinformationen vorgelegt werden. Diesem Problem beugt man bei EXCELSIS vor.
... mehr
SISR jetzt ‘W3C Recommendation’
25.04.2007, VOICE Community
Das World Wide Web Konsortium hat den Standard Semantic Interpretation for Speech Recognition (SISR) Version 1.0 nun als W3C-Empfehlung (Recommendation) veröffentlicht. Als Teil des starken Trends in Richtung Zugang zu Internetinhalten via Spracherkennung werden SISR-Tags genutzt, um innerhalb der Spracherkennung Bedeutungen zu bestimmen. SISR definiert die Syntax und Semantik der Tag-Inhalte im Speech Recognition Grammar Specification (SRGS), um einen Output in standardisierte Variablen für XML- oder ECMA-Skripte zu ermöglichen.
... mehr
Neuer State Chart XML (SCXML) Arbeitsbericht
25.04.2007, VOICE Community
Die W3C Voice Browser Working Group hat einen neuen Arbeitsbericht für State Chart XML (SCXML) herausgegeben: „State Machine Notation for Control Abstraction“. SCXML ist eine flexible Sprache für Zustandsautomaten, die die Konzepte von CCXML mit den State Tables von Harel kombiniert. SCXML erweitert das grundlegende Konzept der Zustandsautomaten um solch leistungsfähige Konzepte wie Übergangszustände und verschachtelte bzw. parallele Zustände. SCXML kann u.a. Anwendung als zukünftige Version der W3C Call Controll Language (CCXML) finden oder als Möglichkeit, die in VoiceXML enthaltenen Sprachmodule zu steuern (Voice Formulare, Voice Picklist, etc.).
... mehr
Loquendo: Was bedeutet der neue SISR-Standard für die Sprachtechnologie?
25.04.2007, VOICE Community
In diesem aktuellen Artikel von Loquendo wird die Bedeutung der neuenW3C-Empfehlung Semantic Interpretation for Speech Recognition (SISR) für die Sprachtechnologie diskutiert. Der neue Standard vervollständigt die SRGS-Grammatik (Speech Recognition Grammar Specification) durch die Möglichkeit zur standardisierten Ausgabe von Ergebnissen der ASR (Automatied Speech Recognition) Verarbeitung. Der Fokus des Artikels liegt dabei nicht nur auf einer Beschreibung des neuen Standards, sondern versucht auch dessen Bedeutung für den derzeitigen Stand der Sprachapplikationen darzustellen.
... mehr
Kostenloses Whitepaper von Angel.com: Virtual Call Center
25.04.2007, Angel.com
In diesem Whitepaper wird beschrieben, wie durch den Einsatz moderner Technologie ein Call-Center auf Weltklasse-Niveau kosteneffizient geleitet und gleichzeitig qualitativ hochwertiger Kundenservice geboten werden kann. „Five Simple Strategies to Make Your Support Center Callers Smile“ erläutert, wie Call-Center kosteneffizient an die Anforderungen ihrer Kunden angepasst werden können, wie die Vorzüge intelligenter IVR-Applikationen Anrufer schneller zum Agenten bringen, wie Datenbestände in automatisierte Lösungen eingebunden werden, damit Kundenanliegen schneller und sicherer identifiziert werden können, wie die Leistungsfähigkeit von Call-Centern in Echtzeit überwacht werden können, und wie die Ausgaben traditioneller Call-Center Applikationen vermieden werden können.
... mehr
Avaya bietet ‘Customer Interaction Express’
25.04.2007, Speech Technology Magazine
Avaya hat “Customer Interaction Express” veröffentlicht, eine Software-Suite für kleine und mittlere Contact-Center. Um die Implementierung zu vereinfachen, arbeitet Customer Interaction Express mit praktisch allen Kommunikationssystemen zusammen, inklusive dem Avaya Communication Manager. Die Lösung verarbeitet alle ein- und ausgehenden Kundentransaktionen quer über alle verwendeten Kanäle, wie Telefon, Email, Fax und Textnachrichten für Mobilgeräte. Customer Interaction Express bietet außerdem Funktionalitäten wie Call Routing und Reporting.
... mehr
Neues Whitepaper bei VoiceObjects: Analyse und Reporting für telefonbasierten Self-Service
25.04.2007, VOICE Community
Dieses Whitepaper stammt von Opus Research und untersucht Lösungen zur Analyse von Voice-Response-Aplikationen, die der Umsetzung unternehmensweiter Zielvorgaben dienen. Das Whitepaper behandelt finanzielle Überlegungen zur Implementierung, Kundenzufriedenheit als Kriterium, frühzeitige Analyse und entsprechendes Tuning als Wettbewerbsvorteil, Monitoring und Reporting als Unterstützung von Business Intelligence Systemen, sprachbasierter Self-Service als Komponente unternehmensweiter Kundenpflege, u.v.m.
... mehr
Neues Produkt von EXCELSIS: Customer Prequalification
18.04.2007, VOICE Community
EXCELSIS Customer Prequalification ist eine schlüsselfertige Software zur sicheren und schnellen Vorqualifizierung von telefonischen Kundenanfragen im Service Center. Anrufer werden automatisch anhand ihrer Telefonnummer identifiziert, wenn diese beim Anruf übermittelt wird. Alternativ können auch beliebige eindeutige Daten wie beispielsweise Kunden-, Vertrags- und Kontonummern abgefragt werden. Zur Erhöhung der Sicherheit erfolgt zusätzlich eine PIN-Abfrage oder eine Überprüfung der biometrischen Merkmale der Stimme des Anrufers. Das Produkt entlastet die Mitarbeiter im Service Center, da der Kunde bereits identifiziert und authentisiert sowie der Grund seines Anrufs erhoben wurde. Der Kunde erfährt einen besseren Service, weil er schnell und direkt mit dem richtigen Ansprechpartner verbunden wird.
... mehr
Gesprächsqualität in Call Centern
18.04.2007, VOICE Community
EXCELSIS und die almato GmbH bieten durch die Integration ihrer Lösungen eine ganzheitliche Sicht auf die Gesprächsqualität im Contact Center. Durch die Integration von Sprachportal und Quality Monitoring werden externes und internes Feedback zusammengeführt. Die sprachgesteuerte Kundenumfrage EXCELSIS Customer Survey stellt das Kundenfeedback zum geführten Gespräch zur Verfügung und almato das interne Feedback der Teamleiter, Trainer und Coaches aus dem durchgeführten Quality Monitoring. Gezielte Vergleiche beider Sichten ermöglichen die Identifizierung wertvoller Potenziale zur Qualitätssteigerung. Die Kunden bewerten am Telefon nicht nur die Produkte des Unternehmens, sondern auch das Auftreten der Agenten sowie die Zufriedenheit mit der telefonischen Abwicklung ihres Anliegens.
... mehr
Gratis-Whitepaper: Eine Einführung in Spracherkennungslösungen
18.04.2007, Speech Technology Magazine
Heutzutage wird Spracherkennung zunehmend populär als Lösung zur Reduktion von Kosten und Mehrwertsteigerung im Bereich Kundenpflege und Dienstleistungen. Mehr als sieben Millionen Anrufe werden sprachbasiert durch Self-Service Anwendungen, Routing und Portale abgewickelt, hunderte von mittelständischen Unternehmen haben Sprachanwendungen bereits implementiert. Investitionen in Sprachtechnologie wachsen jährlich um 22,6%. In diesem Whitepaper erfahren Sie, wie Marketing, Kundendienst und Vertriebssystem zusammenarbeiten können, um außergewöhnliche Kundenerfahrungen zu zeitigen.
... mehr
Nuance Dictaphone bringt innovative Spracherkennungslösung PowerScribe für das Gesundheitswesen auf den deutschen Markt
18.04.2007, VOICE Community
Dictaphone, der Unternehmensbereich für das Gesundheitswesen des Spracherkennungsmarktführers Nuance, hat die Spracherkennungslösung PowerScribe auf den deutschen Markt gebracht. Diese wurde speziell für die Radiologie entwickelt und ermöglicht daher eine präzise Dokumentation der Befunde und effizientere Abläufe in der Dokumentenerstellung. Das entlastet die behandelnden Ärzte und ihre Mitarbeiter, während Patienten und mitbehandelnde Ärzte von der besseren Kommunikation profitieren. Der Kommunikationsprozess zwischen den verschiedenen Spezialisten wird vereinfacht, die Befunde werden schnell weitergeleitet und der Patient kann von einem früheren Beginn seiner Therapie profitieren. Die Investition in PowerScribe macht sich für Kliniken und Ärzte binnen kurzer Zeit bezahlt: Nach 9 bis 24 Monaten hat sich die Anschaffung in der Regel amortisiert.
... mehr
Loquendo und Activa Multimedia 'humanisieren' Computer-Interaktionen
18.04.2007, TMC
Wenn es um Mensch-Maschine-Interaktion geht, wurde vielfach Sprachtechnologie wegen ihrer Fähigkeit gelobt, die Kommunikation zwischen beiden einfacher und natürlicher zu gestalten. In Erweiterung dieses Trends bietet Activa Multimedia Digital nun eine interaktive All-in-One-Lösung für digitales TV. Ihre iVAC (interactive Virtual Automatic Characters) Produktlinie bietet automatisierte Charaktere, die Videos für TV, Internet und Mobile erzeugen. Mit der Einbindung der TTS-Funktionalitäten (Text-to-Speech) von Loquendo sind die virtuellen Charaktere in der Lage, Informationen aus einer Datenbank zu beziehen und diese dann in einer natürlich klingenden, ausdrucksstarken Stimme und in verschiedenen Sprachen wiederzugeben.
... mehr
Nuance präsentiert ‚Nuance Voice Search’
11.04.2007, VOICE Community
Nuance hat “Nuance Voice Search” (NVS) vorgestellt, einen hochwertiges Portfolio von Sprachlösungen für automatisierte Verzeichnisdienste (Directory Assistance - DA). Die Lösung stellt den technologischen Rahmen dar, um Anrufern – unabhängig ob von kabelgebundenen oder auch kabellosen Endgeräten - einen schnellen und einfachen Zugang zu gesuchten Informationen zu bieten. Gleichzeitig ermöglicht sie die zunehmende Automatisierung dieser Anfragen für Carrier und Diensteanbieter. NVS ergänzt diese Sprachumgebungen um neuartige Möglichkeiten für Das, wie z.B. Interpretationsfunktionalitäten, Anwendungen zur Suche nach Geschäftskategorien und durch Anzeigen gesponsorte Suche.
... mehr
Spracherkennung mal anders
11.04.2007, ZDNet Asia
Wer kennt sie nicht, all die langen Sprachnachrichten von Freunden, Bekannten oder Geschäftspartnern. Einige Firmen, wie Simulscribe, SpinVox und Callwave schicken sich an, eine Lösung für dieses Problem zu finden. Durch eine Text-to-Speech Lösung in umgekehrter Richtung erscheint jedes Wort einer Konversation oder Sprachnachricht als Text auf dem Display. Mitgeteilte Telefonnummern und Adressen brauchen dadurch nicht mehr umgehend notiert werden, sie sind bereits als Text vorhanden. Gleichsam wird eine schnelle Vorauswahl mehrere Sprachnachrichten erleichtert, da sie als Text schnell nach Anliegen überblickt und nach Wichtigkeit kategorisiert werden können.
... mehr
Ist Ihr VUI nicht mehr im Einklang?
11.04.2007, Speech Technology Magazine
Das Tuning einer Anwendung kann verschiedene Zielsetzungen verfolgen. Üblicherweise trägt es die Konnotation einer Abstimmung von Parametern im Spracherkenner, um die Genauigkeit der Spracherkenner zu erhöhen. Aber Tuning-Aktivitäten müssen nicht zwangsläufig nur auf die Funktionalität der automatischen Spracherkennung (ASR) beschränkt sein. Genauso gut kann es Test-Prompts für funktionale Effektivität enthalten oder auch Trimming-Prompts gegen unnötige Inhalte, zur Bestimmung von Fehlerquellen, zur Änderung von Timern, zur Änderung der Barge-In Einstellungen, und vieles mehr. Lesen Sie mehr über das Tuning von Sprachanwendungen im aktuellen Artikel des Speech Technology Magazines.
... mehr
Neues Whitepaper des Speech Technology Magazines: Testing, Tuning und Tools
11.04.2007, Speech Technology Magazine
Da Sprachdialogsysteme meist den ersten Kontaktpunkt des Kunden zum Unternehmen darstellen, obliegt dem Test- und Tuning-Prozess vor seiner In-Betriebnahme eine elementare Wichtigkeit. Sobald implementiert und im Betrieb sollte sie einer stetigen Qualitätskontrolle unterliegen, die Ihre Wirkung und Funktionalität kontinuierlich verfeinert. Das Tuning muss in der Lage sein, den wachsenden Ansprüchen von Stammkunden ebenso zu begegnen wie zuvor undefinierten Anfragen realer Kunden aus dem Tagesgeschäft. Nur so kann die Investition des Systems in Ertrag umgesetzt werden. In dem aktuellen Whitepaper des Speech Technology Magazines sollen Interessierte an Testing- und Tuning-Prozesse sowie verfügbare Tools herangeführt werden, um sicherzustellen, dass ihr Sprachprojekt erfolgreich implementiert und produktiv gewahrtet wird.
... mehr
Spracherkennung in der Logistik
04.04.2007, Logistik-Inside
Der Identtechnikhersteller ACD Elektronik bietet sein Datenfunkterminal M250 seit kurzem auch mit Voice-Funktionalität für sprachgestütztes Arbeiten im Lager an. Der Anwender habe beim „M250-V“ die Wahl zwischen display- und sprachgeführter Arbeitsweise und könne je nach Aufgabenstellung in den effizienteren Modus umschalten. Um Voice-Funktionalität bieten zu können, haben die Ingenieure der schwäbischen ACD-Gruppe die Audiosignalverarbeitung des Terminals M250 verbessert, eine Schnittstelle für das Headset integriert und das Gerät mit einem Voice-Modul ausgestattet. Damit arbeitet das M250-V nach dem Fat-Client-Prinzip, bei dem die Sprachverarbeitung im Terminal erfolgt. Die synthetische Stimme lässt sich in der Sprechgeschwindigkeit individuell einstellen.
... mehr
Neues Whitepaper von Cisco: Die Vereinheitlichung von Kommunikationsinfrastrukturen
04.04.2007, ZDnet
Ciscos Visionen von Unified Communication kombinieren disparate Systeme mit unterschiedlichen Kommunikationsfunktionalitäten zu einem einzigen, zusammenhängenden und effektiven Kommunikations-Ökosystem. Die Wirkkraft dieses Systems liegt dabei nicht im System selber, sondern in den menschlichen Ressourcen, die durch die Nutzung des Systems freigesetzt werden. Menschliche Zusammenarbeit sorgt für die Umwälzung, Unified Communications ermöglichen sie. Zu den thematisierten Funktionalitäten des Unified Communitations Systems von Cisco gehören Cisco Call Manager, Computer Telephony Integration (CTI), Geographical Routing, Mobility, Mobility Manager, Voice Mail und Media Applications.
... mehr
Intervoice stellt die nächste Generation von Sprachportalen vor
04.04.2007, VOICE Community
Intervoice stellte auf der „Interactions 2007“- Nutzerkonferenz vor Kunden aus allen Branchen die neue Generation von Sprachportalen vor. Die neuen Sprachportale erlauben eine komplexe Mischung von Sprachdialogen und klassischer Dateneingabe für eine noch einfachere Handhabung selbst anspruchsvoller Self-Service-Anwendungen. Mit der neuen Version von Sprachlösungen können Unternehmen ihren Kunden ein immer gleichbleibend hohes Service-Erlebnis bieten, unabhängig ob der Service am Telefon, Computer oder über das Mobilfunknetz abgerufen wird. Diese neuen Intervoice Produkte für mehr Flexibilität und Nutzerfreundlichkeit sind Teil der umfassenden Unified Communications Strategie für mobile Anwendungen.
... mehr
Envox CT Connect 7 kompatibel zu Avaya
04.04.2007, Speech Technology Magazine
„Envox CT Connect 7“, die standard-basierte Computer Telephony Integration (CTI) Software von Envox, wurde von Avaya auf ihre Kompatibilität mit den IP-basierten Telefonie- und Contact-Center-Lösungen des Unternehmens getestet. Envox CT Connect erlaubt Anwendungsentwicklern und Systemintegratoren die Entwicklung von sprachbasierten Self-Service-, Contact-Center- und Unified Communications-Lösungen für IP- und TDM-Netzwerke. Die getestete Kompatibilität gilt für Avayas IP-Telefonie Software „Communications Manager 3.1.2“.
... mehr
Nuance bietet sprachbasierte Suche nach ‘Mobile Music Content’
04.04.2007, VOICE Community
Nuance hat das „Nuance® Mobile Music Service Package” für seine „Nuance® Mobile Speech Platform” veröffentlicht. Das neue Angebot ermöglicht mittels Sprache den unmittelbaren Zugriff auf Musik-Inhalte. Dadurch sind Anwender mobiler Dienste nicht darauf angewiesen, Texte einzutippen oder durch hierarchische Menüs zu navigieren, wenn sie auf der Suche nach Musik und Klingeltönen zum Download sind. Nuance sei damit der erste Anbieter, der erfolgreich die technischen Herausforderungen meistert, Zugang zu dynamischen Datenbanken mit mehr als einer Million Musiktiteln anzubieten.
... mehr
Audi und Fraunhofer IIS entscheiden sich für SVOX
04.04.2007, Speech Technology Magazine
SVOX kooperiert mit Audi und dem Fraunhofer Institut für integrierte Schaltungen (ISS), um einen digitalen „In-Car Radio News Service“ via „Digital Radio DAB“ (Digital Audio Broadcasting) zu entwickeln. Der „NewsService Journaline“ genannte Dienst bildet die Basis für Audis persönlichen Nachrichtendienst, der sich mittlerweile in der finalen Testphase befindet. Dieser „Teletext“ fürs Radio stellt fortlaufend aktualisierte Informationen zur unmittelbaren Verfügung. Fahrer können Textnachrichten nach Themen sortiert aus einem hierarchisch organisierten Menü auswählen.
... mehr
Nuance setzt auf Hands-free
28.03.2007, VOICE Community
Die Veröffentlichung gleich zwei neuer Lösungen kündigte Nuance an. Der „Nuance Vocalizer for Mobile”, eine neue Text-to-Speech (TTS) Lösung, sorgt für eine erhebliche Verbesserung bei Klang und Qualität von automatisierter Sprache auf mobilen Handsets. Er erzeugt natürlich klingende, verständliche und saubere Sprachausgaben, um einwandfreie Hands-free Interaktionen mit mobilen Geräten zu unterstützen. In die gleiche Bresche schlägt die Ankündigung von „Nuance Mobile Messaging“, einer Diktier-Lösung auf Basis von Dragon NaturallySpeaking 9. Mit ihr können Anwender Textnachrichten bis zu sechsmal schneller verfassen als durch Tippen. Basis der bis zu 160 Wörter pro Minute erkennenden Lösung ist eine Client-Server-Architektur, die eine konkurrenzlose Genauigkeit ermöglichen soll.
... mehr
Das dritte Ohr des (Call) Agenten
28.03.2007, VOICE Community
Bei Anruf Kundeninformation auf dem Monitor – das ist Stand der Technik in den Contact Centern von heute. Neu ist die Möglichkeit, gesprochene Informationen aus Telefonaten zu verarbeiten, um den Call Agenten professionell zu unterstützen. Die patentierte Software „SpeechAgent“ von SpeechConcept erkennt Zusammenhänge innerhalb des Gesprächs und stellt wertvolle Zusatzinformationen zur Verfügung: Während der Agent noch zuhört, sieht er bereits die Antwort auf seinem Bildschirm.
... mehr
Loquendo erweitert TTS um ‘Mixed Language Support’
20.03.2007, TMCnet
Loquendo reagiert auf Gesprächssituationen, in denen pro Äußerung mehr als eine Sprache benutzt wird, und nennt es „Mixed Language Support“, eine Erweiterung phonetischer Zuordnungsalgorithmen. Ein Beispiel dafür sind ausländische Namen und Orte. Ohne die neue Funktionalität versucht das System, ausländische Worte mit der inländischen Betonung zu artikulieren. Zu verstehen sind solche Worte nur schwer, da ihre Aussprache eng mit verwendeten Akzenten und Betonungen der jeweiligen Landessprache zusammenhängen. Eine differenzierte Unterscheidung soll hier erhebliche Vorteile bringen.
... mehr
Ausgeprochen sicher ans Ziel mit Nuance-Sprachlösung in den neuen MEDION GoPal Navigationssystemen
20.03.2007, VOICE Community
Nuance gibt bekannt, dass in den neuen Advanced und Premium Editionen der GoPal®-Navigationssoftware von MEDION die Spracherkennungslösung VoCon von Nuance eingesetzt wird. Die Navigationsanwendung von GoPal® sowie das Sprach-User Interface wurden von Elektrobit Automotive Software, einem Anbieter von sogenannten 'white label'-Navigationslösungen, entwickelt. MEDION präsentiert auf der CeBIT 2007 (in Halle 11, Stand D03) die neuen
GoPal®-Navigationssysteme als hochwertige Multimedia-Reisebegleiter
mit benutzerfreundlicher Bedienoberfläche und großen Bildschirmen mit
optimaler Auflösung. GoPal® wird ab April 2007 in Deutschland,
Frankreich und Großbritannien im Einzelhandel erhältlich sein.
... mehr
Cisco stellt neue TelePresence-Technologien für virtuelle Konferenzen vor
21.03.2007, VOICE Community
Auf der CeBIT 2007 zeigt Cisco neue Technologien für seine Meeting-Lösung Cisco TelePresence: Virtuelle Konferenzen lassen sich jetzt problemlos über mehrere Standorte hinweg initiieren. Unternehmen gewinnen dadurch Spielraum für Meetings mit Partnern und Kunden - jenseits der Firewalls des eigenen Firmennetzwerks. Neue Tools für Cisco TelePresence verbessern außerdem die Zusammenarbeit während einer Konferenz. Beispielsweise wird es für Teilnehmer deutlich einfacher, Textdokumente, Tabellen und Bilder gemeinsam zu bearbeiten. Überdies sorgt der neue Cisco TelePresence Virtual Agent für die nahtlose Integration virtueller Contact-Center-Agenten in netzwerkbasierte Lösungen zur Kundenbetreuung.
... mehr
Microsoft bringt sprachaktivierte Telefonanlage für KMU
21.03.2007, Inside-IT
Auf dem "Small Business Summit" am Microsoft-Hauptsitz in Redmond kündigte der Software-Riese ein Produkt an, das einen großen Markt verändern könnte: Eine vorläufig "Response Point" genannte Telefonie-Anlage für KMU. "Response Point"-Telefone werden über Spracherkennung gesteuert und die Telefonieanlage soll über ein PC-Interface sehr einfach konfiguriert werden können. Gemäß Microsoft sollen die Kenntnisse eines "durchschnittlichen PC-Users" genügen, um die Anlage zu installieren und einzurichten. Ebenfalls über die Spracherkennung soll man interne Gespräche aufbauen, Anrufe parkieren und vermitteln können. Die Telefonzentrale kann auf Outlook-Adressverzeichnisse zugreifen, man kann Aufzeichnungen des Telefonbeantworters per E-Mail verschicken und in Outlook abspeichern. Zudem verspricht Microsoft "one click" Backup-Funktionen.
... mehr
Intervoice zertifiziert Open Access IP Media Processing Produkte von NMS Communications für ihre EVIP Produktlinie
21.03.2007, Speech Technology Magazine
Intervoice wird NMS’ Open Access Kommunikationsprodukte in ihre EVIP Plattform integrieren. EVIP ist ein Interactive Voice Response System (IVR), mit dem Unternehmen Sprachapplikationen unternehmensweit entwickeln, ausführen und managen können. Mit der Open Access Technologie bietet das System Features wie Mehrsprachigkeit, natürlichsprachliche Erkennung, Barge-In Funktionalitäten und Anwendbarkeit in nahezu jeder Branche.
... mehr
CeBIT: CreaLog kombiniert Voice Portal mit Video-Ausgabe
21.03.2007, Computerwoche
Der Münchner Spezialist für intelligente Sprachdialogsysteme ergänzt seine VoiceXML-Plattform um die visuelle Ebene. Besonders im Bereich Mobile Shopping, Helpdesk oder Entertainment liegt es nahe, Sprachportal-Anwendungen mit interaktiver Videotelefonie zu verschmelzen. CreaLog spricht in diesem Zusammenhang von Interactive Voice Video Response (IVVR). Seine auf VoiceXML 2.0 basierende Sprach-Portallösung hat der Hersteller dahingehend erweitert, dass sich auf UMTS-Handys oder VoIP-Telefonen zusätzlich zum Sprachdienst der dazu passende grafische Content etwa in Form von Produktfotos oder Video-Clips anzeigen lässt.
... mehr
Neue Studie von Frost & Sullivan: Robotik auf Basis maschinellen Lernens in unstrukturierten Umgebungen
21.03.2007, VOICE Community
Exklusiv in der VOICE Community gibt es die Management Summary der neuen Studie von Frost & Sullivan. Maschinelles Lernen, ein Unterbereich der Künstlichen Intelligenz (KI), untersucht, wie Roboter lernen und eine dem Menschen ähnliche Intelligenz erwerben können. Robotik auf Basis maschinellen Lernens kann als bewährte Technologie bezeichnet werden, sofern sie für Aufgaben in unstrukturierten Umgebungen programmiert ist. Das Problem, Roboter lernen zu lassen, ist wesentlich für ihren Einsatz anstelle von Menschen in unstrukturierten Umgebungen. Die aktuelle Studie erläutert zentrale technische Bereiche des maschinellen Lernens, wie Arten maschinellen Lernens, Probleme des Lernens, das Lernen von Algorithmen, Bedeutung von Sensortechnologie sowie Fragen zur Hardware, Paradigmen und Technologie für die Entwicklung von Robotik auf Basis maschinellen Lernens. Erfahren Sie mehr über zwei zentrale Anwendungsbereiche, Service-Robotik und Netzwerk-Robotik, und lernen Sie die Treiber und Herausforderungen jedes Bereiches kennen.
... mehr
Whitepaper von Genesys erklärt, wie ‘dynamische Contact-Center’ den Geschäftswert steigern
14.03.2007, VOICE Community
Kann Ihr Contact-Center auf schnelle Änderungen reagieren? Genesys präsentiert ein neues Whitepaper mit dem Titel „Genesys 7.5: Delivering the Dynamic Contact Center“. Darin beschreibt Genesys, wie Unternehmen auf die wechselhafte Dynamik des Kundenservices reagieren können, indem Ressourcen orchestriert und im Sinne der Kundenanforderungen eingesetzt werden. Das Whitepaper richtet sich an Unternehmen, die die Bewältigung kurzfristiger Änderungen in Echtzeit verbessern wollen, wie z. B. Flugunternehmen, bei denen durch Ausfälle oder Verzögerungen plötzlich die Anrufvolumina drastisch ansteigen.
... mehr
Nuance präsentiert 'Dragon NaturallySpeaking Medical 9' für Ärzte und medizinisches Personal
14.03.2007, VOICE Community
Nuance stellt erstmalig eine deutschsprachige Medical-Version von
Dragon(tm) NaturallySpeaking® vor. Diese leistungsstarke Spracherkennungs-Software von Nuance ist speziell für Ärzte und medizinisches Personal konzipiert. Dragon NaturallySpeaking Medical 9 ist mit einem vorkonfigurierten allgemeinmedizinischen Fachwortschatz ausgestattet. Die Software wandelt Spracheingaben mit einer Geschwindigkeit von bis zu 160 Wörtern pro Minute in eine elektronische Textdatei um. Einfache Diagnosen bis hin zu wissenschaftlichen Abhandlungen können nun per Sprache direkt in den Computer diktiert werden. Das Resultat: Mit dem Einsatz von Spracherkennungs-Software ergeben sich schnellere Arbeitsabläufe, denn die Diktate können in wenigen Minuten umgesetzt und die Befunde schnell an die Patienten und an andere Ärzte weitergegeben werden.
... mehr
Continental AG entwickelt neue Telematiksysteme
14.03.2007, Speech Technology Magazine
Die Abteilung für Automotive Systeme der Continental AG entwickelt Telematiksysteme für kabellose portable Geräte wie MP3-Player und PDAs. Diese sollen portable Geräte und externe digitale Inhalte ohne Steckverbindungen mit dem Fahrzeug verbinden und dem Fahrer ermöglichen, während der Fahrt auf die persönliche Musiksammlung zuzugreifen. Die Fahrer werden per Sprachkommandos nicht nur Hands-free Telefonate durchführen können, sondern auch Musik abspielen und Songs auswählen können. Die Kompatibilität zu zukünftigen Technologien und Standards soll durch Updates sichergestellt werden.
... mehr
Cisco bringt Kommunikationssoftware fürs Handy - Unified Mobile Communicator soll im Frühjahr erscheinen
07.03.2007, ZDNet.de
Mit der neuesten Version seiner Unified-Communications-Software will Cisco künftig auch Nutzern mobiler Geräte Zugriff auf den kompletten Funktionsumfang der Kommunikationslösung bieten. Bisher war die Anwendung nur mit Desktop-Systemen kompatibel. "Unified Mobile Communicator" wird voraussichtlich noch dieses Frühjahr erscheinen. In der neuen Version können dann auch mobile Nutzer Statusinformationen einsehen, die beispielsweise darüber Auskunft geben, ob ein Kollege gerade telefoniert oder für ein Gespräch zur Verfügung steht. Zudem lassen sich mit der neuen Software Voice-Mail-Nachrichten als E-Mail betrachten.
Mehr über das brandaktuellen Thema "Unified Communications" lesen Sie im kürzlich erschienenen Forumbeitrag der VOICE Community.
... mehr
Avaya präsentiert neues Tool zur Automatisierung von Geschäftsprozessen
07.03.2007, TechNewsWorld
Laut Zeus Kerravala, einem Analysten der Yankee Group, sei die neue Anwendung gleich wegen mehrerer Gründe von Bedeutung. So reduzierten sich viele der Aussichten von VoIP auf die Senkung von Telefonkosten, was zwar gut zum Sparen sei, jedoch kaum die Voice Branche auf lange Sicht voranbrächte. Abhilfe verschaffe nun Avaya mit ihrem neuen „Communications Enabled Business Process“ (CEBP). Die Kombination aus Software und Service integriert „Intelligent Communications Produkte“ von Avaya in Geschäftsprozesse, um menschliche Zusammenarbeit so weit wie möglich zu automatisieren.
... mehr
Nuance veröffentlicht ‚Voice Control Healthcare Edition’
28.02.2007, VOICE Community
Nuance hat einen Durchbruch in ihrer Sprachtechnologie angekündigt, die mobilen Zugang zu den Informationssystemen von Krankenhäusern ermöglicht. „Voice Control Healthcare Edition“ ermöglicht Smartphones und Handhelds unmittelbaren Zugriff auf Informationsangebote der Gesundheitspflege. Es stellt die erste vertikal fokussierte Technologie von Nuances „Voice Control“ dar, einem mobile Such- und Messagingdienst, der bereits mehr als eine Million Transaktionen von Endkunden abwickelt. Voice Control Healthcare Edition, das Nuance derzeit gemeinsam mit Sprint entwickelt, unterstützt Steuerung durch Sprachkommandos. Der Anwender spricht einfach sein Anliegen in das Telefon und das Anfrageergebnis wird direkt auf dem Display des Endgerätes angezeigt.
... mehr
Envox Worldwide stellt ‚Envox 7’ vor
28.02.2007, VOICE Community
Es handelt sich dabei um die nächste Generation seiner preisgekrönten, offenen, Standard basierten Entwicklungsplattform. „Envox 7“ reduziert signifikant die Zeit, die Kosten und die Komplexität bei der Entwicklung und der Einführung von Sprach- und IP-Kommunikationslösungen. Das Produkt verbindet eine umfassende Unterstützung traditioneller Sprachkommunikation mit der in der Industrie umfassendsten Unterstützung von IP-Kommunikationslösungen wie IP-Telefonie, Video-Messaging, SMS und E-Mail auf einer einzigen Plattform. Die neuen Videofunktionalitäten von Envox 7 ermöglichen Entwicklern die Erstellung von Videoanwendungen einschließlich Lösungen für Video-Messaging, Video-Call-Recording und Interactive Voice and Video Response (IVVR).
... mehr
‚Silver Bullet’ bringt interaktive Sprachapplikationen so schnell und einfach auf den Markt wie niemals zuvor
28.02.2007, VOICE Community
Seitdem Sprachapplikationen in mehr und mehr Anwendungen integriert werden, steigt der Bedarf an Entwicklungslösungen, die alle notwendigen Hilfsmittel kombinieren und einfach zu benutzen sind. VoxPilot, Speech Village und Loquendo haben ihre Kompetenzen gebündelt und bieten Entwicklern wie auch Designern einen schnelleren und Kosten effizienteren Weg, interaktive Sprachdienste auf den Markt zu bringen. Mit einer Lösung, die es Nutzern jeder Qualifikation erlauben, mit Leichtigkeit hochwertige Sprachanwendungen zu kreieren. Die Lösung - „Silver Bullet“ – ist eine einfach zu integrierende Plattform und macht es gleichermaßen möglich, fortschrittliche Applikationen zu entwickeln wie auch sauber von DTMF zu Sprachanwendungen zu wechseln.
... mehr
In Wismar haben Computer Ohren
28.02.2007, SVZ-online
Googeln in Wort- und Bilddateien war bisher, jetzt können mit Know-how aus Mecklenburg-Vorpommern auch Radio- und Fernsehbeiträge auf Web-Seiten durchforstet werden. Das entwickelte Spracherkennungssystem („AudioClipping“) einer kleinen Wismarer Technologiefirma sorgt bundesweit für Aufsehen. 365 Tage im Jahr, sieben Tage in der Woche hören in der Softwareschmiede ComVision Hightech-Maschinen Radio- und Fernsehprogramme ab, um per Spracherkennungssystem gesuchte Begriffe aus kompletten Sätzen und Beiträgen herauszufiltern und sie anschließend als geschriebenen Text zusammenzustellen. Inzwischen haben die Ingenieure auch Sprachsteuerungssysteme für sich als Marktfeld entdeckt. Mit „Genie“ sollen Verbraucher künftig beispielsweise mit ihrem Videorekorder reden können oder Fahrkartenautomaten bedienen.
... mehr
‘Customer Interaction Management Platform Version 7.5’ von Genesys erhältlich
28.02.2007, VOICE Community
Genesys hat ein Upgrade seiner Contact-Center Software bekannt gegeben, die es Kunden erlaubt, ihre Ressourcen und Geschäftsprozesse durch das gesamte Unternehmen zu orchestrieren. Viele Contact-Center haben heutzutage Schwierigkeiten damit, verfügbare Arbeitskräfte und automatisierte Systeme zu balancieren, je nach Änderungen im Traffic (als Anrufe, eMails oder andere Interaktionen) und in Übereinstimmung mit anvisierten Geschäftszielen sowie Kundenzufriedenheitsraten. Genesys stellt dagegen die Vision des „dynamischen Contact-Centers“, das alle diese Bereiche der Kundenservice-Automatisierung ausbalanciert.
... mehr
CreaLog-Neuheit auf der CallCenterWorld 2007: Voice Portal erkennt jetzt Alter und Geschlecht an der Stimme
28.02.2007, VOICE Community
Keine Science Fiction, sondern nützliche Realität: Ein Sprachdialogsystem erkennt an der Stimme des Anrufers, ob er es mit einer jungen Frau, einem Jugendlichen oder einem älteren Herrn zu tun hat. Vor allem für die Gestaltung eines optimalen, Zielgruppen spezifischen Sprachdialoges (Voice User Interface Design) bringe diese Innovation große Vorteile. Aber auch das Reporting und die Statistik im Call Center profitiere von der Alters- und Geschlechtserkennung. Zu hören und zu sehen ist diese Innovation jetzt am Stand des Voice Portal Spezialisten CreaLog auf der CallCenter World in Berlin (27.02. - 01.03.). Dort präsentiert das Münchener Systemhaus zudem attraktive Kundenprojekte mit „Interactive Voice Video Response“ (IVVR).
... mehr
Philips Diktierlösung ‚Digital Pocket Memo 9600 Serie’ setzt neue Maßstäbe bei Design, Sicherheit und Mobilität
28.02.2007, VOICE Community
Philips hat heute die Einführung der neuen Digital Pocket Memo 9600 Serie (DPM 9600) mit mehreren innovativen Funktionen bekannt gegeben. Das DPM 9600 definiert das digitale Diktieren neu und unterstützt als erstes Gerät das DSS Pro-Format. Der neue Standard erhöht die Kompressionsrate, bietet eine Verschlüsselung in Echtzeit und verbessert die Tonqualität. Mit der der ersten computerlosen LAN-Docking Station setzt Philips ein ganz neues Konzept des computerlosen Dateitransfers um. Die Ladestation sendet Diktate über LAN direkt vom Digital Pocket Memo an eine Schreibkraft oder an ein Spracherkennungssystem, ohne dass dafür eine Verbindung zu einem PC nötig wäre. Die Philips Digital Pocket Memo 9600 Serie, die LAN-Docking Station und das Barcode-Modul sind ab März 2007 im Handel erhältlich. Testgeräte für die Redaktionen stehen ab sofort zur Verfügung.
... mehr
Nuance und TeleCommunication System bringen sprachaktivierten Navigationsservice für Handys auf den Markt
21.02.2007, Speech Technology Magazine
Nuance und TeleCommunication Systems (TCS) haben ein sprachaktiviertes Navigationssystem für Handys entwickelt. TCS entschied sich für Sprachlösungen von Nuance, um die Zieleingabe ihres White Label Produkts TCS Navigator zu vereinfachen, woraus ein Navigationssystem für Handys resultierte. Das „Nuance Mobile Navigation Service Package” erweitert den TCS Navigator um eine sprecherunabhängige Spracheingabe, die selbst umständliche Adressangaben verstehen soll. Verfügbar soll der TCS Navigator ab dem Frühjahr sein.
... mehr
VoiceObjects kooperiert mit Oracle im Rahmen der Partner-Initiative ‚Service Delivery Platform’
20.02.2007, VOICE Community
VoiceObjects gab bekannt, dass das Unternehmen zukünftig die Oracle-Partner-Initiative “Service Delivery Platform“ (SDP) unterstützen wird. Die Oracle SDP baut auf der hohen Leistungsfähigkeit und hohen Verfügbarkeit der „Oracle Fusion Middleware“ und „Oracle Grid Infrastructure“ auf. Durch den Einsatz der Oracle SDP möchte VoiceObjects es seinen Kunden ermöglichen, offene, standardbasierte und umsatzstarke Dienste in IP Multimedia Subsystems (IMS) zu betreiben. Die Oracle SDP, die auf IP, SIP, SOA, offener Hardware und offenen Betriebssystemen basiert, kann anstelle von Proprietären IVR-Systemen und Telco-Carrier-Sprachsystemen betrieben werden.
... mehr
Neue Case Study von Avaya: Call-Center-Funktionen - Anrufverteilung für Dr. Hirsch Dialog & Service
20.02.2007, tecCHANNEL
Besonders vorteilhaft ist die intelligente Anrufverteilung, die eingehende Anrufe nach zuvor definierten Kriterien an den bestqualifizierten Mitarbeiter oder verschiedene Agentengruppen weiterleitet. „Als Dienstleister müssen wir uns praktisch jederzeit auf die individuellen Anforderungen unserer Kunden bzw. auf die Besonderheiten bestimmter Telemarketing-Kampagnen einstellen können. Hierbei ermöglicht das BCC eine einfache, schnelle Routing-Anpassung und optimale Nutzung unserer Ressourcen“, erklärt Sven Hirsch. Mit der Betreuung der MDR/ARD-Spendenhotline für Opfer der Flutkatastrophe von 2002 hat das Call Center seine Professionalität und Flexibilität bereits kurz nach der Inbetriebnahme unter Beweis gestellt.
... mehr
Excelsis und Almato ermöglichen ganzheitliche Sicht auf die Gesprächsqualität in Contact Centern
20.02.2007, VOICE Community
Excelsis und Almato bieten durch die Integration ihrer Lösungen eine ganzheitliche Sicht auf die Gesprächsqualität im Contact Center. Die sprachgesteuerte Kundenumfrage „Excelsis Customer Survey“ stellt das Kundenfeedback zum geführten Gespräch zur Verfügung und Almato das interne Feedback der Teamleiter, Trainer und Coaches aus dem durchgeführten Quality Monitoring. Die Kunden bewerten am Telefon nicht nur die Produkte des Unternehmens, sondern auch das Auftreten der Agenten sowie die Zufriedenheit mit der telefonischen Abwicklung ihres Anliegens. "Dieses schnelle Kundenfeedback hilft Unternehmen, den Erfolg von Marketing- und Verkaufsaktionen unmittelbar zu überprüfen und steuernd einzugreifen" so Excelsis Vorstand Christian Sauter.
... mehr
Sprachlösungen von Nuance verbessern die mobile Suche und Möglichkeiten für Werbeeinnahmen
20.02.2007, TMCnet
Nuance arbeitet nach eigenen Angaben mit verschiedenen Organisationen daran, Sprachtechnologie auf mobilen Endgeräten verfügbar zu machen und dadurch Suchfunktionen zu erleichtern. Durch Sprache könnten mobile Suchfunktionen für Endkunden vereinfacht werden, was die Wahrscheinlichkeit ihrer Nutzung erhöhe und dadurch auch die Möglichkeit von Gewinnen aus Werbemaßnahmen verspreche. „Voice Control“ von Nuance bietet dafür die passende Plattform. Laut Angaben von Nuance wurden 2006 $871 Milionen für mobile Werbung ausgegeben bei $24 Milliarden für Werbung im Internet. Den Grund dafür sieht Nuance in der schlechten Verfügbarkeit mobiler Suchen, die ohne Sprache arbeiten.
... mehr
Das fortschrittliche ‚Messaging Gateway’ von Intervoice hilft dem Fortschritt der Mobilbranche
20.02.2007, TMCnet
In dem Maße wie Wettbewerbsfähigkeit und Differenzierung im Mobilmarkt zu einer Notwendigkeit werden, sind Diensteanbeiter damit konfrontiert, innovative Lösungen für außerordentliche Kundenerlebnisse anbieten zu müssen. Das Messaging Gateway von Intervoice wurde kürzlich auf den zwölften „Annual GSM Association Global Mobile Awards” für seinen wegbereitenden Einfluss auf die Mobilbranche gewürdigt. Das Messaging Gateway ist eine flexible und auf offenen Standards basierende Lösung, die Roaming-Dienste und Unterstützung von VoiceXML-Applikationen sowie Netzwerk-Protokollen bietet.
... mehr
SSML wird international - eine Standard-Geschichte
20.02.2007, VOICE Community
Auf der Website von Loquendo bietet ein Artikel eine Erläuterung zur Entwicklung von SSML (Speech Synthesis Markup Language), dem W3C-Standard (World Wide Web Consortium) zur Verhaltenssteuerung von TTS. Nachdem SSML 1.0 im März 2004 bereits zur W3C-Empfehlung ernannt wurde, begann anschließend die Sammlung öffentlicher Anmerkungen zur Anwendungsverbesserung. Daraufhin organisierte das W3C insgesamt drei Workshops in verschiedenen Teilen der Welt - Beijing (China), Kreta (Griechenland) und Hyderabad (Indien) – und gründete außerdem eine SSML 1.1 Arbeitsgruppe. Lesen Sie in diesem Artikel über die neuesten Features von SSML 1.1 und lernen Sie den Standard kennen.
... mehr
SISR (Semantic Interpretation for Speech Recognition) Spezifikation als W3C-Empfehlung vorgeschlagen
20.02.2007, Loquendo Newsletter
Dies ist der letzte Schritt vor Aufnahme der Spezifikation als offizielle W3C-Empfehlung. SISR hat mit der Veröffentlichung eines Implementierungsberichts seine Implementierbarkeit bewiesen und erfüllt außerdem alle öffentlichen Anmerkungen die eingebracht wurden. Mit der Erklärung von SISR 1.0 zur W3C-Empfehlung, wahrscheinlich innerhalb des nächsten Monats, steht dann ein neuer wichtiger Standard für den Markt der Sprachtechnologie zur Verfügung. SISR erlaubt die Anwendung von bekannten ECMA-Script-Sprachen, auch bekannt als JavaScript, um Resultate des Erkennungsprozesses zu generieren und zu validieren. Weiterhin können die Resultate sauber in XML-Format dargestellt werden sofern das ASR-Interface (d. h. das MRCP-Protokoll) dies benötigt.
... mehr
Genesys bringt erste Sprachplattform mit integrierter Unterstützung für Video-Contact-Center auf den Markt
13.02.2007, VOICE Community
VoiceGenie 7.1 von Genesys unterstützt als erste sprachbasierte Selfservice-Plattform mit integriertem Support für Video-Contact-Center zentrale Standards für fortschrittliche Netzwerkdienste, die von sprachaktivierter Voicemail bis IP-basierten Services auf Grundlage des SIP (Session Initiation Protocol) reichen. Mit Video Play-and-Record-Anwendungen, die speziell auf den Gebrauch von 3G-Handys zugeschnitten sind, sollen Dienste wie Video Voicemail, Videokonferenzen, Musik- und Spieleappplikationen auf Videobasis und Video Call-Recording realisiert werden können. So sollen Diensteanbieter z. B. Kopien von Videokonferenzen leichter verteilen können oder Kunden bei technischen Installationen vom Helpdesk mit anleitenden Videos unterstützt werden. Weitere mögliche Einsatzgebiete seien die Telemedizin, Videosharing und Unterhaltungsangebote.
... mehr
Sprachsteuerung am Handy
13.02.2007, Computerwelt.at
Nuance hat auf der aktuell in Barcelona stattfindenden Mobilfunkmesse 3GSM mit Nuance Mobile eine Software-Lösung vorgestellt, mit der man das Handy komplett sprachsteuern kann. Zu den unterstützten Funktionen zählen beispielsweise die Steuerung des Geräts durch Sprachbefehle oder die Umwandlung von Sprache in Text. Damit können E-Mails, SMS oder Dokumente diktiert und sofort versendet werden. "Dieser Markt hat ein enormes Potenzial", ist Steve Chambers, Bereichsleiter Sprache bei Nuance, überzeugt. "Bei den 2,5 Mrd. aktuell verwendeten Mobiltelefonen wird Spracherkennung nur von fünf Prozent eingesetzt. Ähnlich wie bei Navigationssystemen und anderen mobilen Endgeräten, eröffnet sich dabei ein Markt mit Millionen von Usern."
... mehr
TÜV-Siegel für CreaLog Voice Portal
13.02.2007, VOICE Community
Höchste Belastbarkeit bescheinigt der TÜV jetzt der Voice Portal-Plattform von CreaLog. Laut Zertifikat des TÜV Saarland kann diese Plattform, die größte ihrer Art in Europa, problemlos 1.680 Anrufe pro Sekunde bewältigen. Das ist die im deutschen Festnetz maximal erreichbare Rate. Sie stellt einen Spitzenwert dar, der bei Televoting- oder Spenden-Aktionen sowie bei anderen großen Medien-Events wie interaktiven Telefon-Kampagnen und Gewinnspielen tatsächlich erreicht wird. Die TÜV-Urkunde bestätigt dem Münchner Voice Portal-Spezialisten wörtlich: „Es wurde nachgewiesen, dass die Mass Calling-Plattform in der Lage ist, 1.680 Anrufe pro Sekunde bei einer Rufhaltezeitdauer von 3 Sekunden pro Anruf im bundesweiten Mittel verlustfrei unter Dauerlast zu verarbeiten.“
... mehr
Kostenloser Webcast: Datamonitor und SAP über telefonbasierten Selfservice
13.02.2007, VOICE Community
Experten von Datamonitor und SAP diskutieren in diesem Webcast die neuesten Strategien für telefonbasierten Selfservice-Portalen. Entdecken Sie, wie Kundenzufriedenheit und Akzeptanz gesteigert werden können, während die Kosten des Kundenservices niedrig bleiben. Dieser Webcast bietet neueste Marktstudien zu telefonbasierten Selfservice-Portalen, Erläuterungen zur Effizienzsteigerung durch führende Technologien in dieser Klasse sowie zu den Vorteilen von Serviceorientierten Architekturen (SOAs) bzw. Phone Application Server Standards für die Vereinfachung und Personalisierung von Interactive Voice Response-Systemen (IVRs).
... mehr
VoiceObjects Server anerkannt als ein Nortel-kompatibles Produkt
13.02.2007, TMCnet
VoiceObjects gab bekannt, dass der Phone Application Server die Kompatibilitätstests im Rahmen des Nortel Developer Program erfolgreich durchlaufen hat und nun die Bezeichnung ‚Nortel-kompatibles Produkt’ trägt. Insbesondere wurde VoiceObjects 6 als kompatibel zum Nortel Media Processing Server 500 3.5 ausgewiesen. “VoiceObjects Server hat die Interoperabilität mit dem Nortel Media Processing Server unter Verwendung einer VoiceXML-Standardschnittstelle nachgewiesen. Unsere gemeinsamen Kunden profitieren davon durch niedrige Integrationskosten und eine leichte Implementierung von Nortel-IVR-Lösungen”, sagte Michael Codini, Chief Technology Officer von VoiceObjects.
... mehr
Dialogic präsentiert neue Media Boards in PCI Express
13.02.2007, VOICE Community
Dialogic (ehemals Eicon Networks) bietet ab sofort seine Media Boards mit erweiterter PCI Express Bus-Architektur an. Features und Funktionalitäten der neuen Boards umfassen hierbei jene der bereits bestehenden PCI Universal Boards. Die intelligenten Boards lassen sich von Lösungsanbietern in bestehende Anwendungen und Systeme einsetzen und sind ab sofort verfügbar. Da zunehmend mehr Serverhersteller auf die neue Architektur setzen, wird Dialogic im Laufe des Jahres weitere Boards in PCI Express-Konfiguration auf den Markt bringen. Dadurch soll Entwicklern, OEMs und Systemintegratoren eine breitere Wahl neuester Server ermöglicht werden.
... mehr
Erweiterung von DSS zu DSSPro
14.02.2007, ntz-online
DSS, vor 10 Jahren gemeinsam von Grundig, Olympus und Philips etablierter de-facto Sprachstandard für professionelle Anwendungen, wurde zum DSSPro weiterentwickelt und verfügt nunmehr über zwei neue wesentliche Funktionen. Die bereits hohe Audioqualität wurde mit einer 16-kHz-Abtastung nochmals verbessert, und es wird erstmalig ein Verschlüsselungs-Algorithmus (Encryption) unterstützt. Mit dem neuen DSSPro ist wie schon beim DSS sichergestellt, dass digitalisierte Sprache einfach, schnell und vor allem standardisiert bearbeitet werden kann. Dabei ermöglicht eine spezielle Komprimierungstechnik auch weiterhin die Aufzeichnung in Form kleiner Dateien, wie es für die Versendung von Diktaten per E-Mail von unterwegs, den Datenverkehr im Netz und die Archivierung unabdingbar ist.
... mehr
T-Coms intuitive Sprachanwendungen jetzt offiziell zum Test freigegeben
06.02.2007, VOICE Community
Nachdem VOICE Community-Mitglieder bereits einen ganzen Monat früher die beiden neuen Anwendungen der T-Com testen durften, stehen Voice Navigator und Customer Feedback nun auch allen anderen Interessierten offen. Nutzen Sie die intelligenten und vollautomatischen Sprachanwendungen für die Routineabläufe Ihrer telefonischen Services: Der Voice Navigator selektiert Anrufer vor, mit Customer Feedback führen Sie automatische Kunden-Befragungen durch. Beide Anwendungen können einfach und intuitiv per Webbrowser gesteuert werden. Das Angebot der T-Com für Interessierte bleibt aber auch weiterhin: Jetzt kostenfrei testen – und vielleicht einen von zehn T-Mobile MDA Vario II gewinnen!
... mehr
Sprachdialogsystem Aspect Customer Self Service 7.2 ist ‚Product of the Year’
06.02.2007, VOICE Community
Das Sprachdialogsystem Aspect® Customer Self Service™ 7.2 wurde vom amerikanischen Fachmagazin Customer Inter@ction Solutions zum Product of the Year 2006 gekürt. Die Lösung aus der Signature-Produktreihe von Aspect Software nutzt Internet-basierte oder herkömmliche Sprachverbindungen, sie bietet fortschrittliche Spracherkennung und Sprachsynthese (Text-to-Speech). Als Product of the Year zeichnet das Fachmagazin Produkte aus, die das Potenzial haben, die Callcenter- und CRM-Branche weiter nach vorne zu bringen.
... mehr
RightNow mit neuen Sprachlösungen im Programm
07.02.2007, VOICE Community
RightNow kündigte drei neue Sprachlösungen an: Web Click-To-Call Back, Voice Caller Information Delivery und Voice Outbound Survey. Unternehmen können mit den sprachaktivierten Anwendungen überdurchschnittliche Kundenerfahrungen durch einen schnellen Zugang zu vielfältigen Inhalten und Selfservice-Optionen bieten, während Kosten entscheiden gesenkt werden. Die neuen Anwendungen sind über das Software-as-a-Service-Modell (SaaS) von RightNow verfügbar, durch das Unternehmen die Anwendungen rasch implementieren können, ohne erhebliche Investitionen in die Infrastruktur von EDV- oder Telefonsystemen vornehmen zu müssen.
... mehr
Grundig Business Systems veröffentlicht kabelloses Diktiergerät mit Anbindung an Spracherkennung
07.02.2007 Speech Technology Magazine
Die Grundig Business Systems GmbH hat DigtaCordEx veröffentlicht, das über USB-Anschluss mit dem PC verbunden wird. Es ist mit einem Akku ausgestattet und ermöglicht dem Nutzer, in einem Radius von etwa zehn Metern die Diktierfunktionen zu verwenden. Warnmeldungen weisen zudem auf einen niedrigen Akkustand oder das Verlassen des Empfangsbereichs hin. Außerdem arbeitet es mit der neuen DigtaSoft Enterprise Speech Solution zusammen, die mittels Spracherkennung die gesprochenen Worte direkt in Text umwandeln kann. Dank der neuen Netzwerkarchitektur kann die Software auch sämtliche Geräte zentral verwalten und sogar Fern- und Heimarbeitsplätze integrieren.
... mehr
Neues Whitepaper von Nuance: Unterstützung von Zwei-Faktoren-Authentifizierung und FFIEC-Vorgaben per Telefon
30.01.2007, VOICE Community
Institutionen sind auf der Suche nach Sicherheitsverbesserungen elektronischer Kanäle, um ihren Kunden anspruchsvollen Service zu bieten und aktuelle Vorgaben der Federal Financial Institutions Examination Council (FFIEC) gewährleisten zu können. Erfahren Sie in diesem Whitepaper, was die FFIEC-Vorgaben bedingen. Lernen Sie außerdem mehr über die Wichtigkeit von Multi-Channel Sicherheit in modernen Banking-Umgebungen, über die Schwachstellen aktueller Authentifizierungsmethoden per Telefon, darüber wie Spracherkennung und Sprecherverifizierung die FFEIC-Vorgaben erfüllen und über Best-Practices aus diesem Bereich.
... mehr
Loquendo veröffentlicht neues Embedded Speech Recognition Tool
30.01.2007, TMCnet
Dank der Ausgabe einer neuen Version von Loquendos ASR können integrierte Sprachanwendungen nun noch einfacher und sorgfältiger in Geräte integriert werden. Loquendos ASR Speech Recognition 7.0.6. bietet verbesserte Erkennungsraten, Unterstützung für größeres Vokabular, Funktionen zur File-Archivierung sowie Unterstützung von Pocket-PCs und anderen Systemen. Die Verbesserungen des Spracherkennungsmodells haben nicht nur die Erkennungsraten gesteigert, sondern ermöglichen auch das fehlerfreie Erkennen von Personen- und Straßennamen. Die neue Version ist in vielzähligen Sprachen erhältlich und funktioniert sogar in Umgebungen mit starken Hintergrundgeräuschen, da durch eine manuelle Start-/Stop-Funktion die ASR auf bestimmte Sprachsegmente fokussiert werden kann.
... mehr
Erfolgreich Sprachprojekte managen
31.01.2007, TMCnet
Sprachtechnologie bietet Managern von Callcentern wichtige Möglichkeiten, die Kundenzufriedenheit zu steigern und Kosten zu senken. Laut Branchenanalysten von Forrester bieten gute sprachbasierte Selfservice-Systeme Interaktionsvorteile, die selbst geschickt gestaltete Touch-Tone-Systeme nicht überbieten. Wie auch immer bringen Sprachprojekte Schwierigkeiten und sogar Risiken mit sich, die sorgsam zu managen sind. Dean Harper, Manager der Speech University von Nuance, erläutert auf TMCnet.com, wie die zehn größten Fehler bei der Realisierung von Sprachtechnologie-Projekten vermieden werden können. Behandelt wird der gesamte Entwicklungsprozess von Planungs- über Design- und Realisierungs- bis zur Optimierungsphase.
... mehr
Whitepaper: Fünf Best Practices, wie man Wissensdatenbanken zum Reden bringt
31.01.2007, TMCnet
Durch die Möglichkeiten, vielerlei Prozesse zu automatisieren, Telefonkosten zu reduzieren und dem Kunden schneller Ergebnisse zu bieten, haben Sprachtechnologien einen enormen Einfluss auf Unternehmen ausgeübt. Trotzdem haben bislang nur wenige Unternehmen das volle Potenzial von Sprachtechnologien ausgeschöpft, besonders was Selfservice-Kanäle betrifft. In diesem Whitepaper von TuVox wird erklärt, wie Unternehmen durch die Integration von Sprache in vollständige Wissensdatenbanken bis zu 90 Prozent der Kosten eines Anrufes einsparen können. Erfahren Sie mehr über die Anwendung von Sprachautomatisierung als Zugang zu Datenbankinhalten und wie dies zur Verbesserung des Kundenservices sowie zur Kapitalaktivierung beiträgt.
... mehr
Neues Whitepaper von Intervoice: Personalisierung des Kundenkontakts durch Hightech-Kanäle
31.01.2007, VOICE Community
Das Risiko, dass aus einem Kunden ein Ehemaliger wird, ist extrem hoch. Die Kosten, um neue Kunden zu akquirieren, übersteigen bei Weitem die Aufwendungen, um bestehende zu halten. Daher zielt dieses Whitepaper auf die Callcenter-Branche mit Fokus auf die Personalisierung der Anrufererfahrung durch den Einsatz sprachaktivierter IVR-Kundenkanäle (Interactive Voice Response). Personalisierung wird oft als Unmöglichkeit im Automatisierungsprozess betrachtet. In diesem Whitepaper werden daher Best Practices aufgezeigt, in denen Kunden automatisiert abgewickelt werden und sich trotzdem gut fühlen. Erreicht wird dies durch den konsequenten Einsatz von Wissen, das das Unternehmen bereits über seine Kunden besitzt.
... mehr
Wie gut ist gut genug?
31.01.2007, Speech Technology Magazine
Eine beharrliche Frage all jener, die sprachbasierte IVR-Anwendungen (Interactive Voice Response) entwickeln, richtet sich danach, ob die Leistungsfähigkeit ihrer Anwendung ausreichend ist. Tuning und Analysen ermöglichen Leistungsbewertungen und Verbesserungen. Doch trotzdem bleibt oft die Frage, wie gut gut genug ist? Viele betrachten Zielwertvorgaben als Lösung, wie Erkennungsrate, In-Grammar/Out-of-Grammar Raten, Call-Containment, Time on Task, Fehlerrate, und First Call Resolution. Vereinfacht ist das richtig: Eine Erkennungsrate von 92 Prozent ist natürlich besser als beispielsweise eine von 87 Prozent. Doch ob eine Verbesserung der Erkennungsrate auf einen Vorgabewert auch angebracht ist, hängt nicht allein von Richtlinien oder Zielerwartungen ab. Eine bedeutende Rolle spielt die Relation zu den Kunden und ihren Meinungen.
... mehr
IBM entwirft den Standard für Text-to-Speech
31.01.2007, Speech Technology Magazine
Entwickelt, um auf Microsoft Windows und Linux Systemen zu laufen, ermöglicht das IAccessible2 Interface Text-to-Speech Technologien, mit nahezu jedem Programm zu arbeiten. Das Interface unterstützt sogar Open Document Format (ODF), Browser basierte Rich Internet Applications, Web 2.0, AJAX (Asynchronous Javascript and XML) und DHTML (Dynamic Hypertext Markup Language) Dokumente. Einige Text-to-Speech Technologien hatten in der Vergangenheit Schwierigkeiten bei der Übersetzung von komplexen Grafiken, Editierfunktionen, Hyperlinks, Diagrammen, Menüs, Überschriften und Beschriftungen in Tabellen sowie bzgl. Fonts, Textfarben und Textselektierungen in Sprache.
... mehr
T-Coms VoiceIdent: Die Stimme als Schlüssel
24.01.2007, teltarif.de
Die T-Com hat ein VoiceIdent genanntes Produkt angekündigt, bei dem die Zugangsauthentifizierung zu verschiedenen Diensten über ein biometrisches Stimmerkennungsverfahren abgewickelt wird. Beim telefonischen Zugang - beispielweise zu Banking- oder Shopping-Diensten - müsse man sich kein Passwort mehr merken. Das Motto lautet: Die Stimme wird zum Schlüssel. "Im Gegensatz zu PIN-Nummern, Passwörtern oder TAN-Bogen kann die persönliche Stimme nicht vergessen, verloren oder entwendet werden", lobt die T-Com ihren neuen Dienst. Die T-Com will VoiceIdent zunächst ihren Geschäftskunden in den Bereichen Banken, Versandhandel, Transport und Logistik sowie Service-Dienstleistungen anbieten, die den Dienst dann wiederum ihrerseits ihren Kunden zur Verfügung stellen können.
... mehr
Q-Check – Sichere Qualitätskontrolle auch für kostenpflichtige Service-Nummern
22.01.2007, VOICE Community
Wie zufrieden sind Anrufer mit den gebotenen Informationen? Entsprach der Service Ihren Erwartungen? Haben sie die gewünschte Lösung erhalten? Fragen wie diese beantwortet Q-Check, die neue Zufriedenheits-Analyse von ITCV. Sie befragt Anrufer direkt im Anschluss an das Service-Telefonat. Bei gebührenpflichtigen Rufnummern kann Q-Check einen Rückruf initiieren, damit der Anrufer nicht unnötig belastet wird. Q-Check kann bei ITCV on demand als zusätzlicher oder als integrierter Service gebucht werden. Q-Check hat einen umfangreichen Fragenkatalog als Basis, der sich leicht um individuelle Fragen erweitert lässt. Anrufer bewerten mit Schulnoten von 1 bis 6 oder „ja“ und „nein“. Die Bewertung erfolg mittels Tastendruck oder per Spracheingabe. Sie können auch ganze Sequenzen aufsprechen.
... mehr
Avaya weitet Unified Communications Lösungen für IBM Lotus Nutzer aus
24.01.2007, Yahoo! Finance
Auf der Lotusphere, IBMs jährlicher Kundenkonferenz für Lotussoftware, verkündete Avaya eine deutliche Ausweitung ihrer Palette an Unified Communications Lösungen. Die neuen Anwendungen erweitern Avayas Portfolio für die Lotus Plattform und setzen die Unternehmensstrategie fort, für Veränderungen in der Art und Weise zu sorgen, wie Unternehmen ihren Mitarbeitern strategische Kommunikationsmittel und Werkzeuge zur Zusammenarbeit zu Verfügung stellen, unabhängig von ihrem Arbeitsort oder verwendeten Netzwerken, Plattformen und Endgeräten. Avayas Unified Communications Lösungen für Lotus Sametime, Lotus Notes und Lotus Domino beinhalten derzeit vielfältige Anwendungen, wie Unified Messaging, Sprachzugang zu Email-Nachrichten, Kalendereinträgen, Ordnern und Kommunikationsfunktionen.
... mehr
Nuance bringt IP-basierte Sprachwahl für unternehmensinterne Kommunikation auf den Markt
24.01.2007, VOICE Community
Nuance hat den SpeechAttendant® Internal Dialer vorgestellt, ein startbereites IP-basiertes System mit sprachaktivierter Auto-Attendant-Funktionalität für die unternehmensinterne Kommunikation. Nuance trägt damit den steigenden Investitionen in VoIP und IP-Telefonie Rechnung sowie der daraus resultierenden Nachfrage nach IP-basierten Tools. Nuance hat den neuen SpeechAttendant Internal Dialer so konzipiert, dass er nicht nur zusätzlichen Gewinn aus der IP-Infrastruktur der Unternehmen generiert, sondern ihre Produktivität steigert. Die Lösung von Nuance unterstützung IP-Standards, wie SIP (Session Initiation Protocol) und ist dadurch kompatibel zu IP-basierten Infrastrukturen der führenden Anbieter wie Avaya, Cisco, Genesys etc.
... mehr
Loquendo und Vida-Software verbessern natürliche Interaktion mit mobilen Geräten
24.01.2007, TMCnet
Vida-Software kooperiert mit Loquendo, um deren Spracherkennungs- und Text-To-Speech-Technologien in eine neuartige Technologie zu integrieren, die die Interaktion mit Mobiltelefonen vereinfachen und gleichzeitig verbessern soll. Die innovative Technologie nennt sich Natural Interaction und ermöglicht es Anwendern, einen Servicedienst per Sprache zu nutzen während sie synchron auf dem Bildschirm lesen und schreiben. Die Integration der hochwertigen Sprachtechnologie von Loquendo soll das Kundenerlebnis dabei deutlich verbessern und die natürliche Interaktion auf ein neues Niveau heben. Durch ein multisensorisches Interface können Informationen dann mittels Berührung, Sprache, Optik und Tönen zugänglich gemacht werden und auch biometrische Technologie als Funktionalität berücksichtigt werden. Vida-Software und Loquendo erwarten von ihrer kombinierten Lösung Impulse für den Mobile-Markt durch neue Anwendungsmöglichkeiten.
... mehr
Envox Worldwide stellt Envox CT ADE 9.2 vor
24.01.2007, VOICE Community
Envox Worldwide hat Envox CT ADE 9.2, ein Major Upgrade des am weitest verbreiteten IVR-Entwicklungstools (Interactive Voice Response) vorgestellt. Zu den wichtigsten Neuerungen gehören Funktionalitäten für die Entwicklung von IP-basierten Sprachlösungen, eine erweiterte Integration in die Microsoft .NET-Entwicklungsumgebung sowie leistungsstarke CTI-Funktionen (Computer Telephony Integration), die durch eine native Integration mit Envox CT Connect ermöglicht werden. "Die erweiterten Funktionen in Envox CT ADE 9.2 gewährleisten, dass Entwickler - auch solche, die mit Microsoft .NET arbeiten - den Aufwand und die Kosten zur Entwicklung modernster Sprachlösungen drastisch senken können." sagt Mark D. Flanagan, President und CEO von Envox Worldwide.
... mehr
EXCELSIS Password Management: Neues Release
17.01.2007, VOICE Community
Bis zu 50% aller internen Anrufe im Help Desk eines Unternehmens gehen auf vergessene Passwörter zurück. Die Bewältigung dieser Aufgabe kann eine zentrale Rufnummer für die automatische Passwortrücksetzung von EXCELSIS unterstützen, die auf innovativen Technologien zur Spracherkennung und Sprecheridentifizierung beruht. Das neue Release des EXCELSIS Password Management ist jetzt für zwei weitere Plattformvarianten zertifiziert: envox/Nuance und Genesys/IBM. Es handelt sich um die erste kommerziell verfügbare Lösung auf Basis der IBM Speaker Identification and Verification [SIV], die weiterhin durch den gewohnt kurzen ROI von unter einem Jahr besticht.
... mehr
Nuance Mobile übersteigt 1 Million Transaktionen
17.01.2007, VOICE Community
Nuance ließ verlauten, dass Nuance VoiceControl, ein sprachbasierter Such- und Messaging-Dienst, mehr als eine Million mobiler, sprachaktivierter Transaktionen abgewickelt hat. Während der letzten neun Monate verdoppelte sich die Zahl der Nutzer sogar nahezu. Nutzer des Dienstes brauchen nur einen Knopf drücken und in ihr Telefon sprechen, um umgehend eine Information zu erhalten oder eine präzise Nachricht zu erstellen. Das Tippen auf den kleinen Tastaturfeldern von Handys entfällt. Der Dienst ist verfügbar auf Palm Treo, Blackberry und Windows Mobile Device von Sprint oder als Download von Handango.
... mehr
Robert Weideman von Nuance im Radio-Interview
17.01.2007, VOICE Community
Das in Amerika bekannte Radioformat Let`s Talk Computers hieß am 13. Januar Robert Weidemann, Senior Director of Product Marketing bei Nuance, zum Interview willkommen. Im ersten von zwei Interviews spricht er über die Spracherkennungssoftware Dragon Naturally Speaking 9 und erläutert, wie sie es schafft, ohne Training des Vokabulars der Anwender enorme Genauigkeit zu erreichen. Das Interview ist als Datei für Realplayer oder Windows Media Player herunter zu laden.
... mehr
Neues Whitepaper von RightNow: Eine Einführung in Sprachlösungen
09.01.2007, VOICE Community
Sich in der Technologie, den Anbietern und dem Markt für Sprachlösungen zurecht zu finden, kann ein abschreckender Weg sein, auf dem man sich nur zu leicht in technischen Begrifflichkeiten, Markttrends und Produktdifferenzen verliert. Dieses Whitepaper bietet eine einfache Einführung in Spracherkennungslösungen und erläutert die Technologie, ihre Entwicklung und heutige Anwendung sowie ihre Vorteile für Unternehmen. Dazu kommen der Markt für Sprachlösungen, deren Zusammensetzung und ihre Unterscheidung. Das Whitepaper stützt sich auf strategische Empfehlungen von Datamonitor, die Sprachlösungen derzeit in ihrem Kundenservice sowie in Servicestrategien einsetzen bzw. auswerten.
... mehr
Genesys bietet sieben zentrale Strategien für den Wechsel von IVR zu sprachbasiertem Selfservice
09.01.2007, TMCnet
Interactive Voice Response Systeme (IVR) wurden mit einem klaren Ziel in den Callcenter-Betrieb eingeführt. Sie sollten die Arbeitsbelastung der Agenten verringern und Zeit einsparen, indem Kunden die Möglichkeit zur selbständigen Navigation zum richtigen Agenten gegeben wurde. Heute nutzen rund 67% der Callcenter IVRs auf Basis von Touch-Tone oder Sprache. Genesys bietet nun sieben Strategien für einen Wechsel auf sprachbasierten Selfservice. Dazu gehört: Integrierung von Agent-Assisted Services, Übertragung von Geschäftslogiken aus bestehenden webbasierten Anwendungen, Anpassung des Automatisierungsgrades an die Kundenbedürfnisse, offene Standards fördern, die Einbindung von VoIP-Systemen und Nachverfolgung und Auswertung aller Kundeninteraktionen.
... mehr
Neuer Mehrwertdienst von T-Com: T-VoteCall Plattform
09.01.2007, VOICE Community
Die Innovation für Fernsehsender und Medien-Unternehmen: Mit der leistungsstarken T-VoteCall Plattform ermitteln Sie die Ergebnisse telefonischer Zuschauerabstimmungen einfach, schnell und mit individueller Ansage. Die extrem hohe Spitzenlastfähigkeit ermöglicht dabei noch mehr Zuschauern, per Telefon an Ihren Gewinnspielen und Abstimmungen teilzunehmen. Dazu wartet T-Com mit einem echten Novum auf. Im Gegensatz zu anderen Voting-Plattformen kann die T-VoteCall Plattform auch individuelle Sprachbotschaften der Anrufer entgegennehmen. Die aufgezeichneten Botschaften stehen sofort für die Auswertung zur Verfügung. Die Experten der technischen Infrastruktur sorgen darüber hinaus ständig für die reibungslose Funktion der Plattform. Detaillierte Informationen gibt es unter freecall 0800 330 1370.
... mehr
Intervoice kündigt 'Packaged Voice Banking'-Anwendung der nächsten Generation an
10.01.2007, HULIQ.com
Intervoice hat die generelle Verfügbarkeit ihrer Next-Generation-Bankanwendung erklärt, die sowohl über Sprach- als auch über Touch-Tone-Optionen verfügt. Intervoice Banking 3.0 trifft recht gut das erneute Interesse der Finanzbranche an den Fähigkeiten sprachbasierter Anwendungen, um ihren Kundenservice zu verbessern und Kosten zu senken, indem Hierarchien von Touch-Tone-Menüs durchbrochen werden.
... mehr
Nuance und VoiceBox stehen vor Zusammenarbeit
10.01.2007, Speech Technology Magazine
Nuance und VoiceBox arbeiten gemeinsam an Anwendungen, die Sprachtechnologie und die Natural Language Suite von Nuance mit dialogorientierten Suchprozessen auf Sprachbasis von VoiceBox kombinieren. Diese erkennen Kontext und Absicht in frei formulierter Sprache und ermöglichen die Funktionalität eines persönlichen Navigationsgerätes (Personal Navigation Device - PND). Dialogorientierte Sprachinterfaces haben sich zu einem Zugang zu Informationen und Funktionalitäten heutiger Navigationssysteme entwickelt. Dazu gehören u. a. Musik und Medien, freihändiges Wählen, Adresseingabe und Kartensteuerung.
... mehr
Neues Whitepaper von Envox: Gehostete IVR- und Contactcenter-Lösungen
10.01.2007, Speech Technology Magazine
Die Entwicklung der VoIP-Technologie hat einen interessanten Einfluss auf Lösungen gehosteter IVR- und Contactcenterlösungen sowie deren Anbieter ausgeübt, denn auch dort wurde VoIP rasant übernommen. In Verbindung miteinander bietet dies besonders kleinen und mittleren Unternehmen klare Vorteile. Die VoIP-Verbindung zwischen Hosted-Service-Anbieter und dem Unternehmen ermöglicht die Durchleitung von Anrufen ohne Kosten eines traditionellen Telefonnetzwerks. Außerdem reduziert die Verbindung von VoIP mit gehosteten Services Zeit, Kosten und Komplexität für die Einrichtung einer wegbereitenden IVR- und Contactcenter-Lösung.
... mehr
Voxtron: Fachbuch beschreibt automatisierte Telefonie anhand von agenTel und Axxium
20.12.2006, VOICE Community
Was „Spracherkennung und automatisierte Telefonie“ inzwischen leisten können, zeigt das gerade erschienenen Fachbuch „Dialog-Center-Lösungen für Banken“ anhand einer Reihe von Applikationen auf Basis von Voxtrons Software agenTel und Axxium. Das Buch der Herausgeber Detlef Effert und Markus Wunder deckt ein weites Spektrum ab: Von Strategie über Controlling, Qualitätsmanagement, Zusammenführung von Callcentern bis zu Techniklösungen reicht die Palette. Das wichtige Thema Spracherkennung wird mit einer Reihe von Lösungen von Voxtron beleuchtet. Wichtige Erkenntnisse des Buchbeitrags sind: Spracherkennung ist vor allem dann sinnvoll, wenn Auswahlmenüs mehr als drei Punkte umfassen sollen. Ist die Planung gut ausgeführt, entlastet der automatisierte Service das Personal deutlich.
... mehr
Bestelllogistik leicht gemacht
20.12.2006, commit
Deutschlands größter Drogerie-Filialist SCHLECKER ist seit dem Jahr 2000 auch im Versandhandel aktiv. Kunden können aus dem Bestellmagazin Artikel ordern, die nicht in den Märkten vor Ort erhältlich sind. Der Bestellvorgang erfolgt dabei per Post, via Internet, Hotline oder direkt über die 10.000 Märkte in Deutschland. Die Bearbeitung der Bestellung erfolgt durch die SCHLECKER-Mitarbeiter vor Ort. Mit Hilfe der dtms wurde ein speziell auf die SCHLECKER-Organisation zugeschnittenes Telefon-Portal entwickelt. Der SCHLECKER-Mitarbeiter vor Ort bekommt über eine zentrale 0800-Rufnummer Zugang zu einem automatisierten Erfassungsdialog. Der Clou: Die Interaktion erfolgt per DTMF-Tonwahl-Funktion oder per Spracherkennung, die Inhalte werden wie bei einer SMS über die entsprechende SMS-Mimik der Telefontastatur eingegeben. Schnell, einfach, effektiv.
... mehr
SOA: Verbindung der Einzelteile
21.12.2006, Speech Technology Magazine
Sprachbasierte Lösungen verarbeiten in zunehmendem Maße nicht mehr nur statische Informationen. Vielmehr bieten sie Kunden und Angestellten die Möglichkeit, Geschäftstransaktionen zu initiieren oder abzuwickeln, mit dem Unternehmen auf bequemere und effektivere Art zu interagieren sowie auf Informationen in Echtzeit zuzugreifen, während Geschäftsprozesse abgespeckt werden. Dazu müssen Sprachlösungen jedoch als Teil der Informationssysteme, wie CRM, Workforce Management, etc. im Unternehmen begriffen werden. Die Herausforderung für Unternehmen besteht also in der engen Verknüpfung von Sprachlösung und Informationssystemen. Eine SOA bietet hier die Flexibilität und Interoperabilität, die unabhängige Lösungen zumeist vermissen lassen, und legt so den Grundstein für Innovationen der Organisation in der Zukunft.
... mehr
Neues Whitepaper: Speech Self-Service – entdecken Sie den wirklichen Wert
21.12.2006, Speech Technology Magazine
Die meisten Kunden sind durch ihre Erfahrungen im Umgang mit dem Internet und dessen Anwachsen bereits geübt darin, dieses als Selfservice-Kanal zu nutzen. In dem Maße, in dem Seiten brauchbarer und zugänglicher für Kunden wurden, hat sich das Internet über die Zeit von einem Informationswerkzeug zu einer Transaktionsbasis weiterentwickelt. Ebenso steht es mit der Entwicklung sprachbasierter Services. Unternehmen müssen sicherstellen, dass ihre Anwendungen nutzerfreundlich sind und ihre Kunden die Anwendungen benutzen können, benutzen wollen und Spaß daran haben. Dieses Paper erläutert Gemeinsamkeiten von Internet und sprachbasierten Selfservice-Kanälen, Strategien für die erfolgreiche Akzeptanz dieser Services beim Kunden und sowohl den aktuellen Stand der Anwendung als auch den wirklichen Wert von sprachbasierten Anwendungen für Unternehmen wie auch Kunden.
... mehr
Neue Veröffentlichung: EXCELSIS user Help desk Suite 2.0
13.12.2006, VOICE Community
Mit der EXCELSIS User Help Desk Suite können Unternehmen aller Branchen ihren User Help Desk (UHD) optimieren. Durch die Automatisierung geeigneter Abläufe und Prozesse des UHD kann der Servicelevel gesteigert und die Betreuung der Mitarbeiter oder Support-Kunden verbessert werden. Die EXCELSIS User Help Desk Suite ist mandantenfähig und basiert auf einzelnen, aufeinander abgestimmten Sprachmodulen. Die Module sind miteinander kombinierbar und können so konfiguriert werden, dass sie die individuellen Prozesse und Aufgaben des UHD im jeweiligen Unternehmen bestmöglich unterstützen.
... mehr
Auf zu natürlichsprachlichen Abläufen
13.12.2006, Speech Technology Magazine
Manche Softwareentwickler verstehen unter dem Begriff "natürlichsprachlich" alles, was jenseits diskreter Spracherkennung angesiedelt ist. Die folgenden vier Technologien jedoch sind weitaus „natürlicher“ als irgendeine Einzelworterkennung: System-Directed Dialogues, Hilfestellungen durch die Maschine, um Anrufern die Eingabe adäquater Befehle zu erleichtern; Statistische Grammatiken, die einen offenen Einstieg in Interaktionen erlauben und Antworten von Anrufern statistisch abgleichen, um in angemessene System-Directed Dialogues zu gelangen; Mixed-Initiative Dialogues, ein Dialogverlauf, in dem je nach Bedürfnissen des Anrufers sowohl von der Maschine als auch vom Anrufer die Initiative ausgehen kann, und komplexe Grammatiken mit semantischer Interpretation, die gesprochenen Text im ASR nach natürlichen Bedeutungsmustern untersuchen und einordnen kann.
... mehr
Loquendo kündigt die Veröffentlichung von Loquendo ASR mit Partial Results Recognition und Grammatikzwischenspeicher an
14.12.2006, VOICE Community
Neue Funktionalitäten wurden im aktuellen Loquendo ASR veröffentlicht. Während des Spracherkennungsprozesses gibt Loquendo ASR partielle Resultate aus, so bald sie verfügbar sind, anstatt das Ende der Eingabe abzuwarten. Dies bringt z.B. Vorteile bei langen Äußerungen: So muss ein Kunde beim Eingeben seiner Kreditkartennummer keine Zeit für das vollständige Eingeben einer ungültigen Nummer verschwenden, da falsche Angaben unmittelbar erkannt werden. Dieser Erkennungsprozess wird durch die Übernahme von Grammatiken in den Zwischenspeicher weiter beschleunigt: Grammatiken, die einmal aufgerufen wurden, werden nicht mehr abgelegt, sondern verbleiben im Zwischenspeicher, damit bei wiederholten Formulierungen oder Eingaben im Laufe eines Gespräches erneut auf sie zurückgegriffen werden kann.
... mehr
Neuer Arbeitsbericht des W3C: Multimodale Architekturen and Interfaces
14.12.2006, VOICE Community
"Dieses Dokument beschreibt eine lose zusammenhängende Architektur für multimodale User Interfaces, die kooperierende und verteilte Implementierungen erlaubt und fokussiert auf Markup und Scripting und die Nutzung genau definierter Interfaces zwischen den Bestandteilen." (aus dem Abstract des Dokuments)
... mehr
Neuer Arbeitsbericht des W3C: Call Control Extensible Markup Language (CCXML) 1.0
14.12.2006, VOICE Community
"Dieses Dokument beschreibt CCXML, die Call Control eXtensible Markup Language. CCXML wurde entwickelt, um Telefonie-Call Control Support für VoiceXML oder andere Sprachanwendungen zu ermöglichen. Obwohl CCXML mit jedem Dialogsystem genutzt werden kann, das Medien verarbeitet, wurde CCXML entwickelt, um VoiceXML Interpreter zu ergänzen und zu integrieren. Daher gibt es in CCXML viele Hinweise zu den Möglichkeiten und Begrenzungen von VoiceXML sowie zur Integration von VoiceXML und CCXML. Dennoch sollte festgehalten werden, dass es sich hier um zwei unterschiedliche Sprachen handelt, die nicht notwendigerweise ineinander integriert oder eingebunden werden müssen. Zum Beispiel könnte CCXML integriert werden mit einem eher traditionellen Interactive Voice Response (IVR) System oder einer 3GPP Media Resource Function (MRF). VoiceXML oder andere Dialogsysteme könnten ebenso mit anderen Call Control-Systemen integriert werden." (aus dem Abstract des Dokuments)
... mehr
Nortel erweitert SIP-Contact Center-Lösung
06.12.2006, TeleTalk
Nortel erweitert seine SIP-Contact Center-Lösung Contact Center 6.0 um neue Funktionen. Sie eröffnen Kunden weitere Kommunikationswege: So können sie sich mit Contact Center-Agents per Videoübertragung austauschen oder das Kommunikationsmedium während eines Anrufs wechseln. Zudem können sie auf Webseiten geleitet werden, die Informationen zu ihrer Anfrage erhalten, während sie auf einen Agenten warten. Die Beratung kann dabei künftig auch im Team stattfinden: Agenten können sich per Telefon, E-Mail, Instant Message, Chat oder Video austauschen und den Kunden im Team betreuen.
... mehr
Apple iPhone mit Nuance Spracherkennung?
06.12.2006, Mobility Site
Für den Auftritt des neuen iPhone wird erwartet, dass Apple etwas aus dem Hut zaubert. Und genau betrachtet können sie auch gar nicht anders. Unternehmen wie Nokia und Motorola z.B. produzieren seit mehr als zwanzig Jahren Mobiltelefone und haben es zur Kunstform erhoben. Es scheint unglaubwürdig, dass Apple mit dem Kultstatus seines iPod daher kommt und nun auch Handys produzieren will. Es wird nicht reichen mit einer Mischung aus iPod und Handy aufzutreten. Um sich im bestehenden Markt etablieren zu können wird das iPhone cool, funky und irgendwie anders sein müssen. So mehren sich in letzter Zeit die Gerüchte um die Implementierung von Spracherkennung aus dem Hause Nuance in das geplante Handy.
... mehr
Ein Schritt in Richtung mobile Spracherkennung
06.12.2006, Processor
Die Mobile Speech Platform von Nuance bietet Programmierern ein einziges System, das eine ganze Fülle von Aufgaben leisten kann. Sie können sprachbasierte Funktionen als lokale Suche, Suche nach Inhalten und Web-Suche sowie als Ordnerverwaltung, Menü-Navigation und zum Einsprechen von Nachrichten implementieren. Das System zeichnet sich durch seine einfache Handhabbarkeit aus und richtet sich an Entwickler, Carrier, OEMs und Content-Provider.

... mehr
Neues Produkt: EXCELSIS Customer Loyalty Suite
06.12.2006, VOICE Community
Die EXCELSIS Customer Loyalty Suite ist das branchenübergreifende Sprachportal für die Optimierung des Customer Relationship Managements [CRM]. Der Schwerpunkt der Lösung liegt auf einer verbesserten Betreuung und Ausschöpfung von Bestandskunden. Des Weiteren stehen Funktionen für ein umfangreiches, personalisiertes Informationsangebot und zur Unterstützung der Mitarbeiter bei der Neukundengewinnung sowie Kundenreaktivierung zur Verfügung. Die Basis der EXCELSIS Customer Loyalty Suite ist ein durchgängiges Konzept mit aufeinander abgestimmten Sprachmodulen zur effizienten Unterstützung wesentlicher CRM-Aufgaben und Prozesse. Bei den jeweiligen Modulen handelt es sich um fertige Softwarelösungen, deren Funktionsumfang individuell erweitert werden kann, so dass maßgeschneiderte Lösungen zusammengestellt werden können.
... mehr
Lernen Sie wirklich alles, was sie können, über Ihre Lösungen zur Kundenbetreuung?
06.12.2006, Speech Technology Magazine
Steigen Sie ein in die Diskussion zwischen Elizabeth Herrell, Vice President von Forrester Research, und Scott Taylor, General Manager von Nuance Business Consulting, über den Wert von Verhaltensanalysen und wie diese helfen können, Einsicht in die operationale Leistungsfähigkeit der Kundenbetreuung zu gewinnen. Weitere Schwerpunkte der Diskussion sind Möglichkeiten von Unternehmen, diese Erkenntnisse zu nutzen, um verborgene Möglichkeiten zur Verbesserung der Kundenbetreuung freizulegen, sowie die neuesten Werkzeuge auf dem Markt, mit deren Hilfe Unternehmen ihre Angebote zum Selfservice optimieren können.
... mehr
Die ersten 100 Tage
29.11.2006, Speech Technology Magazine
Die Design- und Entwicklungsphase Ihrer sprachbasierten Self-Service-Anwendung sind abgeschlossen. Das System ist installiert und ein Prozess konsequenter Usability- und Kundenakzeptanz-Tests wurde durchgeführt. Doch was jetzt? Wie können Sie sicherstellen, dass Ihre Kunden nach der Aktivierung das System so nutzen, wie Sie es sich vorgestellt haben? Genau darüber entscheiden die ersten 100 Tage einer Anwendung. Nach der ersten Inbetriebnahme einer Sprachlösung sollte stets ein strikter Kontrollprozess eingeleitet werden, der das Voice-Design überprüft und sicherstellt, dass ein konsequentes Tuning der Anwendung betrieben wird.
... mehr
Jamba bietet Sprachportal
29.11.2006, TeleTalk
Jamba, Anbieter von Klingeltönen für das Handy, hat ein Sprachportal für seine Kunden eröffnet. Diese können damit nicht mehr nur per SMS, sondern auch über einen Telefonanruf bestellen. Das Voice-Portal wird von Legion Solutions bereitgestellt. Anrufer können in dem Portal Klingeltöne anhören oder Kurzbeschreibungen von Spielen fürs Mobiltelefon. Der Service steht für Deutschland und zahlreiche weitere Länder zur Verfügung, zum Beispiel für die USA, Großbritannien, Australien und Italien.
... mehr
Envox forciert mit CT Connect 7 den Übergang zu offenen Standards
29.11.2006, VOICE Community
Unter dem Namen Envox CT Connect 7 hat der Sprachlösungsanbieter Envox eine brandneue Version seiner Softwaresuite für Computer-Integrated Telephony (CTI) vorgestellt. Die neue Fassung zeichnet sich vor allem durch eine engere Verknüpfung von herkömmlicher CTI-Technologie mit IP-Kommunikationsnetzen (Internet Protocol) aus. Als weiteres Novum nennt Envox die nahtlose Integrierbarkeit mit Webservices und Service-orientierten Architekturen (SOA). Dadurch wird den Unternehmen der Übergang von traditionellen herstellerspezifischen Kommunikationslösungen auf offene Standards wie SIP (Session Initiating Protocol) und Webservices erleichtert. Envox nennt die neue Version 7 den ‚Sprung von der klassischen Telefon-Welt in den neuen Internet-Kosmos’.
... mehr
Lernen mit Multimedia: Automatische Spracherkennung schafft Zugang und Interaktion
29.11.2006, University of Southampton
Vorlesungen können für viele Studenten Barrieren bereithalten. Obwohl die online-Bereitstellung multimedialer Materialien technisch einfacher geworden ist und viele Vorteile beim Lernen wie auch Lehren bringt, werfen Zugang, Koordinierung und Verwertung oft Schwierigkeiten auf. Diese Arbeit soll zeigen, wie automatische Spracherkennung durch die kostengünstige Produktion von Multimedia-Materialien sowohl konventionelle Lernmethoden wie auch e-Learning für jedermann zugänglich macht. Beispiele dafür sind: Die Unterstützung von Personen, die in der Wahrnehmung eingeschränkt sind, etwa blinde, gehörgeschädigte oder lese-/rechtschreibschwache Lernende, aber auch Methoden zum schnellen und präzisen Finden von online-Ressourcen.
... mehr
Das Sprachdialogsystem Aspect Customer Self Service 7.2 erhält Nuance-Zertifizierung
29.11.2006, VOICE Community
Das Sprachdialogsystem ‚Aspect Customer Self Service 7.2’ wurde offiziell für den Einsatz der ‚Open Call Steering’-Funktionalität von Nuance zertifiziert. Mit dieser Zertifizierung wird bestätigt, dass Aspect Customer Self Service 7.2 die strikten Leistungsvorgaben einhält, die Nuance für seine Open Call Steering-Funktionen festlegt. Die Funktion von erlaubt es Anrufern, ihr Anliegen in ihren eigenen Worten zu beschreiben und direkt zu ihrem Ziel zu gelangen - ohne sich mühsam durch Tastenmenüs zu bewegen. Der Leistungs- und Last-Test des Open Call Steering-Systems wurde in verschiedenen Szenarien durchgeführt.
... mehr
Wie zufrieden sind Ihre Kunden eigentlich mit Ihrem telefonischen Kundenservice?
22.11.2006, VOICE Community
Um die Qualität seines Kundenservices permanent zu beobachten, setzt ein großer deutscher Versandhändler jetzt auf das Produkt CreaVoice Survey. Kunden des Versandhändlers werden dazu nach dem Telefonat mit dem Kundenberater an das CreaVoice Kundenbefragungssystem weitervermittelt. Sie werden dort aufgefordert, das vorangegangene Gespräch und die Leistung des Mitarbeiters nach Schulnoten zu bewerten. Die Fragen werden über eine webbasierte Benutzeroberfläche administriert. Sobald die Bewertung durch den Kunden einen vorher festgelegten Schwellwert unterschreitet, werden die Kunden aufgefordert, zu den Fragen einen Kommentar aufzusprechen, um genauere Informationen zum Grund der Unzufriedenheit zu erfahren.
... mehr
Neues Whitepaper von RightNow und Strativity: Fünf Schritte auf dem Weg zum Kundenerlebnis
22.11.2006, VOICE Community
Die Erfahrungen von Kunden sind klare Indikatoren für die Gesundheit eines Unternehmens und die Kraft einer Marke. Sie fördern Ertragssteigerungen, verhindern den Verlust von Kunden und erhöhen den Marktanteil. Doch noch immer setzen Unternehmen stärker auf Produkt orientierte Transaktionen als auf Geschäftsmodelle, die auf Kundenbeziehungen basieren. Sowohl im Bezug auf die Kundeninteraktion als auch auf die Versorgung von Angestellten mit Ressourcen zur Realisierung eines guten Kundenerlebnisses bleiben die Strategien unterentwickelt. Lernen Sie in diesem Whitepaper, wie der Kundenwert maximiert wird, Frustrationsfaktoren ausgeschlossen werden und jede Interaktion mit einem Kunden zur Chance wird, Gewinn zu generieren.
... mehr
Neues Whitepaper von IBM: Die Integration von IBM-Sprachlösungen in Serviceorientierte Architekturen
22.11.2006, Bitpipe.com
Serviceorientierte Architekturen (SOA) haben in den vergangenen Jahren eine beachtliche Eigendynamik entwickelt. Seitdem Unternehmen die Vorzüge von On-Demand-Modellen, auf Standards basierten Entwicklungen und SOA als Teil von Produktangeboten erkannt haben, veränderten sich SOA von einem bloßen Konzept zu einer brauchbaren Methode, verschiedenste IT-Ressourcen miteinander zu verbinden und zu steuern. Lesen Sie in diesem Whitepaper, wie die Integration von Sprachlösungen aus dem Hause IBM diese Vorzüge auch in Ihrem Unternehmen leisten kann.
... mehr
Neuer Webcast von VoiceObjects, Genesys und der Yankee Group: Personalisieren Sie Ihre IVRs durch VoiceXML und Phone Application Server
22.11.2006, VOICE Community
Anrufer erwarten personalisierte und Kontext bezogene Dialoge bei der Nutzung von Telefon Self-Services über IVRs (Interactice Voice Response). Unternehmen müssen die entsprechenden Systeme bereitstellen, um diese Anforderungen zu erfüllen. Stattdessen bieten viele Unternehmen nur ein identisches Angebot für alle Anrufer mit generischen und somit individuell nur begrenzt nützlichen Dialogen, was für eine zunehmende Frustration bei den Anrufern sorgt. Schlechte IVR Anwendungen sind schlecht fürs Geschäft. Unternehmen müssen Ihre Strategie in diesem Bereich neu überdenken. Heute präsentieren Ihnen die Yankee Group, Genesys, und VoiceObjects einen Überblick über aktuelle IVR-Systeme und wie die Kombination von Phone Application Servern und VoiceXML Unternehmen helfen kann, Kundenzufriedenheit und Effizienz zu steigern und Unternehmensziele zu erreichen.
... mehr
Neues online-Tutorial von Alcatel, Cisco und dem IEC: Sprachportale – eine Einführung in die Netzwerkservices der nächsten Generation
22.11.2006, International Engineering Consortium
Der Markt für Sprachportale wächst mit zunehmender Geschwindigkeit und bietet enorme Möglichkeiten für Service-Dienstleister. Sprachbasierter Internetzugang setzt auf schnell fortschreitende Spracherkennungstechnologien, die den Anwendern jederzeit und an jedem Ort Zugriff auf Web basierte Informationen ermöglichen. Als Mittel dient die universalste Form menschlicher Kommunikation – die Stimme – von zu Hause, aus dem Büro oder auch kabellos via Telefon. Dieses Tutorial erläutert Faktoren für Geschäftsmodelle und Technologien, die Sprachportale zu einem Erfolg machen, und zeigt Methoden, mit deren Hilfe Anbieter und Entwickler die Möglichkeiten des neuen Marktes erfolgreich erschließen können.
... mehr
Neuer W3C Arbeitsbericht: Semantic Interpretation for Speech Recognition (SISR) Version 1.0
22.11.2006, VOICE Community
"Dieses Dokument definiert den Prozess semantischer Interpretation von Spracherkennung und die Syntax und Semantik der Befehle für die semantische Interpretation. Diese wird den Grammatiken von Spracherkennern hinzugefügt, um Informationen für die Rückgabe an eine Anwendung auf Basis von Regeln und Tokens aufzubereiten, die der Spracherkenner verarbeiten kann. Im Besonderen werden die Syntax und die Semantik von Befehlsinhalten der Speech Recognition Grammar Specification definiert.
Die Ergebnisse semantischer Interpretation beschreiben die Bedeutung einer natürlichsprachlichen Äußerung. Die vorliegende Spezifikation stellt diese Information als ein ECMAScript Objekt dar und definiert einen Mechanismus, um das Ergebnis in XML auszugeben." (aus dem Abstract des W3C-Dokuments)
... mehr
Neues Whitepaper von Voxify: Die vier wichtigsten Gründe für die Implementierung von sprachbasiertem Self-Service – eine Notwendigkeit für Call-Center
15.11.2006, bitpipe.com
Trotz eines Anstiegs der Web basierten Interaktionen erklärt Forrester, dass das Telefon auch weiterhin der Kundenkanal erster Wahl sein wird. Indes machen entgegengerichtete Faktoren wie die Größe von Contact-Centern und Budgetgrenzen den Ausbau des Personals unmöglich. Lernen Sie, wie ausufernde Kosten im Contact-Center verhindert werden können, während dem Kunden dennoch der erwartete Service zukommt. Dieses White Paper erläutert sprachbasierten Self-Service, ein fortschrittliches System, das Anrufe durch interaktive Spracherkennung auf Konversationsebene automatisiert. Entdecken Sie, wie Informationsdienste, Transaktionsdienste und Outbound-Calls unabhängig von ihrer Komplexität automatisiert werden können.
... mehr
Intervoice veröffentlicht Voice Banking Applikation als Pauschalpaket
15.11.2006, Speech Technology Magazine
Intervoice hat ihre Voice Banking Applikation der nächsten Generation veröffentlicht, die sowohl Sprach- als auch Touch-Tone-Optionen bereithält. Intervoice Banking 3.0 bietet sprachaktivierte Anwendungen, die einen personalisierte Self-Service auf Sprachbasis ermöglichen. Neben den mehr als 200 Optionen der natürlichen Spracherkennung, mittels derer Kunden Kontoinformationen erhalten und Transaktionen ausführen können, beinhaltet Intervoice Banking 3.0 folgende Funktionalitäten: Kreditkartenaktivierung und –deaktivierung, Authentifizierung anhand multipler Faktoren, Routing-Anwendungen, Rücktritt von Barschecks, englische und spanische Touch-Tone-Version sowie eine englische Sprachversion. Intervoice Banking 3.0 bietet zudem neue Backend-Interfaces zur Integrierung bestehender Umgebungen von Finanzinstitutionen.
... mehr
Stimmen hören leicht gemacht mit TextAloud
15.11.2006, VOICE Community
NextUp.com, Entwickler der Synthesesoftware TextAloud, hat für die neueste Version seines Produktes die Sprachsynthese Acapela gewählt. TextAloud erlaubt es dem Nutzer, jedweden Text in gesprochene Worte umzuwandeln, um diesen anzuhören und zu verstehen. Damit kann die Textlektüre durch Audiodateien ersetzt werden, welche am iPod, PocketPC oder anderen Mobilgeräten angehört werden. Dank der hochqualitativen Sprachsynthese von Acapela ist der mit TextAloud vertonte Text besser verständlich und flüssiger und kann auch fernab vom Bildschirm angehört werden. Darüber hinaus können bei der Audio-Wiedergabe bestimmte Worte besonders hervorgehoben werden, um auf die besonderen Bedürfnisse von Legasthenikern einzugehen.
... mehr
Jetzt Systeme aus Kundensicht testen
16.11.2006, VOICE Community
Damit ein Contact-Center erfolgreich am Markt agieren kann, müssen viele Faktoren stimmen. Was nutzt die ausgefeilteste Dialogregie, wenn die Verbindung gestört ist oder das System auf die Eingaben des Anrufenden kaum oder nur verzögert reagiert. Hier ist es für die Betreiber der Contact-Center hilfreich, wenn sie ihr System auch aus Kundensicht testen können. Genau zu diesem Zweck gibt es die Contact-Center-Testlösungen von Empirix, mit deren Hilfe nicht nur die Sprachapplikation überprüft sondern auch die Leistungsfähigkeit und Belastbarkeit der Technik getestet und dargestellt werden können. Möglich sind beispielsweise Funktionalitätstests der verschiedenen Call Flows eines IVR-Systems auf korrekt gespielte Prompts, Antwortzeiten und Routingtests.
... mehr
RightNow und Informatica optimieren das Kundenerlebnis
16.11.2006, VOICE Community
RightNow wird künftig die Datenintegrationstechnologie von Informatica vertreiben. Durch die Kombination der Datenintegrationstechnologie von Informatica mit den Service-, Vertriebs- und Marketinglösungen von RightNow können Kunden die Vielzahl der im Unternehmen verteilten Datenquellen wirksamer einsetzen. Ein perfektes Kundenerlebnis kann das mächtigste Argument sein, um sich als Firma von den Mitbewerbern zu differenzieren. Um besondere Kundenerlebnisse zu gewährleisten, sind Mitarbeiter mit direktem Kundenkontakt oft auf Daten angewiesen, die sich in unterschiedlichen Systemen befinden. Mit der Technologie von Informatica werden diese Informationen innerhalb der RightNow-Applikationen sofort bereitgestellt.
... mehr
Vereinfachte Spracheingabe für Navigation
08.11.2006, Wunschauto24.com
Forscher von DaimlerChrysler arbeiten an einer schnellen und einfachen Spracheingabe für Navigationsziele. "Information Refinement" heißt die neue Methode, die sich an menschlicher Kommunikation orientiert und Dialoge mit dem Navigationssystem so natürlich wie möglich macht. Um ein Fahrziel klar zu definieren, sind häufig Zusatzinformationen erforderlich. Welche am sinnvollsten sind, haben die Forscher untersucht, indem sie das durchschnittliche Fahrerwissen geprüft haben. Die Studie ergab, dass die Benutzer in der Regel eine nächstgrößere Stadt, das Bundesland, die Region oder den Fluss kennen. Städtekürzel auf dem Nummernschild, Postleitzahl und Vorwahl hingegen wussten die meisten nicht.
... mehr
Nuance veröffentlicht eine neue Familie sprachaktivierter Unternehmensanwendungen
08.11.2006, Speech Technology Magazine
Nuance hat SpeechAttendant Large Enterprise Edition (SA-LEE) auf den Markt gebracht, eine integrierte Produktfamilie, die automatisierte Vermittlung mit fortschrittlichen Verzeichnisdiensten kombiniert. Die Basis bildet ein automatischer sprachaktivierter Vermittler, mit dessen Hilfe Angestellte interne Gespräche weiterleiten können, indem sie den Namen einer Person oder Abteilung nennen. Das System richtet sich vor allem an größere Unternehmen und bietet allen Nutzern Zugang über eine einzige Nummer. Auf diesem sprachaktivierten Angestelltenverzeichnis aufbauend führt SA-LEE Zusatzmodule ein, wie eine Funktion zur Passwortrückstellung für Angestellte sowie spezielle Kommunikationsfunktionen zur Unterstützung der betrieblichen Kontinuität und der Notfallwiederherstellung.
... mehr
Call for Papers – Voice User Interface Workshop: Die 10 Top-Richtlinien der Fehlerbehandlung
08.11.2006, Speech Technology Magazine
Es gibt bisher nur wenige Leitfäden darüber, wie mit Fehlern der Spracherkennung umzugehen ist (Nomatch, Noinput und Help). Die angemessene Fehlerbehandlung in solchen Situationen wird Nutzern helfen, mit passenden Worten oder Phrasen zu reagieren, damit der Dialog fortgesetzt werden kann. Im Falle einer sachgemäßen Bedienung könnten die Benutzer so nicht einmal bemerken, dass ein Fehler auftrat. Aus diesem Grund findet im Rahmen der SpeechTEK West 2007 ein nicht-öffentlicher Workshop statt, auf dem die ausgewählten Teilnehmer einen Tag lang ihre Erfahrungen und ihr Fachwissen zusammentragen können, um die zehn wichtigsten Richtlinien festzulegen.
... mehr
Neues White Paper von Loquendo: Auf Hybrid HMM/Neural Network basierte Spracherkennung in Loquendos ASR
01.11.2006, VOICE Community
Dieses White Paper beschreibt hybride „Hidden Markov Models / Artificial Neural Networks“-Modelle (HMM/ANN), die allgemein in Spracherkennung und im Besonderen in Loquendo HMM/ANN zur Anwendung kommen, dem Kern von Loquendo ASR. Während Hidden Markov Models (HMM) ein dominanter Ansatz in den meisten modernen sprecherunabhängigen, ununterbrochenen Spracherkennungssystemen sind, beschränkt sich die Bekanntheit von Artificial Neural Networks (ANN) im Allgemeinen auf ihre Anwendung als leistungsstarke, non-lineare Methode zur Mustererkennung, Zeitreihenvorhersage, Optimierung und Prognose. Hybride HMM/ANN sind aktuell sowohl bezüglich ihrer Performance als auch der Erkennungsgenauigkeit eine wettbewerbsfähige Alternative zu reinen HMM.
... mehr
Neues White Paper von VoiceObjects: Contact Center-Optimierung – Verbesserung des Einsatzes von Self-Service Applikationen durch Dialoganalyse
01.11.2006, bitpipe.com
Der Geschäftserfolg von automatisierten Sprachservices hängt im Wesentlichen von dem Verständnis ab, wie erfolgreich solche Services von Kunden genutzt werden. Moderne Werkzeuge zur Dialoganalyse gestatten es Unternehmen, aussagekräftige Berichte zu erzeugen, die einen 360 Grad-Blick auf Kunden erlauben, um die Steuerung und Optimierung von Applikationen sowie Systemen im Contact Center zu unterstützen. Lesen Sie in diesem Whitepaper, wie Sie mit Hilfe der Dialoganalyse unternehmensweite Richtlinien festlegen können, die zu größerer Kundenzufriedenheit, Kostensenkung und Ertragssteigerung führen.
... mehr
Krems Research entwickelt automatische Reservierungsanfrage
01.11.2006, VOICE Community
Lange Wartezeiten am Telefon können schon viel über das Service eines Unternehmens aussagen. Vor allem in der Hotellerie kann sich der Gast schnell für eine andere Unterkunft entscheiden, wenn sein Anruf warten muss. Um die Serviceleistung für seine Gäste zu optimieren, entwickelte das Tourismus Research Center Krems, kurz Krems Research für die Orange Wings Hotels das computerbasierte Sprachdialogsystem "RESA" für die Hotelbuchung. Der Gast teilt "RESA" seinen Buchungswunsch in einem Telefongespräch mit und "RESA" führt die Reservierung für ihn durch. "RESA" soll die Call Center Mitarbeiter in Spitzenzeiten entlasten, so dass diese sich auf komplexere Anfragen konzentrieren können.
... mehr
Neues Whitepaper von Genesys: Von IVR zu Voice Self-Service - Sieben Schlüsselstrategien
01.11.2006, TMCnet
In der nächsten Zeit werden sich viele traditionelle IVR-Anbieter wegen auslaufender Linzenz- und Produktzyklen mit der Notwendigkeit konfrontiert sehen, ihre hardwarebasierten IVR-Systeme auszutauschen oder sie an die heutigen Erfordernisse anzupassen. Trotz massiver Investitionen bedeutet dieser Schritt jedoch auch eine wertvolle Chance: Warum die völlige Entfernung des alten Systems nicht nutzen, um die gesamte Infrastruktur des Contact Center neu auszurichten und auf die Implementierung zukünftiger Innovationen vorbereiten? Erfahren Sie in diesem Whitepaper mehr über die sieben zentralen Strategien, um tradionelle IVR-Systeme souverän zu ersetzen und eine Self Service-Plattform zu bewerten und auszuwählen, die auf offenen Standards basiert und Ihnen Wettbewerbsvorteile sichert.
... mehr
Vision VoiceXML Server Release 2.0 – Jetzt erhältlich
02.11.2006, VOICE Community
Der Vision VoiceXML Server Release 2.0 ist jetzt in der Auslieferung. Er ermöglicht Anbietern von Netzwerkausrüstung und Anwendungsentwicklern die zügige Entwicklung und Anwendung neuer, innovativer VoiceXML gesteuerter Sprach- und Video-Applikationen, wie z.B. interaktives Voice- und Video-Response (IVVR), sprachaktiviertes IVR, Sprach- und Video-Messaging sowie interaktives Entertainment in IP-, PSTN- und 3G-Netzwerken.
... mehr