20.11.2017
 
 
abonnieren!


Home  >  News  >  Technologie & Produkte



Deutsche Allianz für vernetztes Haus der Zukunft
03.09.2011, heise online
Eine deutsche Industrie-Allianz unternimmt einen neuen Anlauf für das vernetzte Haus der Zukunft. Die Deutsche Telekom, Eon, EnBW und Miele stellten auf der IFA in Berlin die Plattform "Smart Connect" vor, über die Haushaltsgeräte und Gebäudetechnik wie Heizung oder Jalousien gesteuert werden können. Ein Ziel der Partnerschaft ist es, einen Standard zu etablieren, der auch international durchsetzbar ist.
Von Mitte 2012 an will die Telekom die Plattform in Deutschland anbieten. Unabhängig vom Telekommunikationsanbieter soll sie an jedem Breitband-Anschluss funktionieren. Zentrale Komponente des Systems ist die "Smart Connect Box" im Haus des Kunden. Über sie werden lokale Anschlüsse mit Internet-Diensten verbunden.
Eine Schlüsselfrage sind dabei jedoch die Standards. Aktuell gibt es zwar schon diverse Anbieter von Lösungen für Heimautomation, aber viele Systeme sind nicht miteinander kompatibel. Die Kooperation der Industrieschwergewichte könnte jetzt helfen, einen Standard zu etablieren.
Dass die Plattform zuerst in Deutschland eingeführt wird, habe auch gute Gründe. "Der Deutsche Markt ist ideal, um zu starten", betonte Urban Keussen von Eon. Insbesondere nach der Entscheidung für den Atomausstieg sei Deutschland eine Art "Showroom für die Zukunft". Zudem sei hierzulande die Bereitschaft der Bürger, sich mit Themen wie Energiesparen und Umweltschutz auseinanderzusetzen, höher als in vielen anderen europäischen Ländern.
... mehr


Universal-App für iPhone und iPad präsentiert einen Web-Browser mit Sprachausgabe
02.09.2011, Pressearbeit
Ein Web-Browser sollte mehr können, als nur durch die zahllosen Online-Seiten zu scrollen. Voice Reader Web ist ein Universal-Browser für die drei mobilen Apple-Plattformen iPhone, iPod touch und iPad. Dabei bietet er drei wichtige Zusatzfunktionen: Er kann zuvor gespeicherte Web-Seiten offline laden, im Textmodus störende Bilder und Werbebanner ausblenden und alle Texte laut vorlesen – in 21 Sprachen und mit 32 Stimmen. Beim Autofahren, im Zug oder beim gemütlichen Dösen spart man sich so das mitunter anstrengende Lesen am kleinen Bildschirm und lauscht der glasklaren Sprachausgabe in professioneller Qualität.
Die App lässt sich genau auf die Bedürfnisse der Benutzer anpassen. So kann man sich entweder die ganze Website vorlesen lassen oder nur einzelne Abschnitte. Es gibt sogar eine Pausentaste. Die Anwender können auch die Vorlesegeschwindigkeit, die Tonhöhe und die Lautstärke für die Sprachausgabe frei wählen. Wer möchte, speichert die gelesene Sequenz in einer Audiodatei (M4A, CAF oder WAV), die sich im Gerät verwalten oder per E-Mail versenden lässt.
Voice Reader Web 1.0 ist ab sofort im Apple AppStore verfügbar und kostet 1,59 Euro.
... mehr


Lernen aus Krankenakten
02.09.2011, Technology Review
In den USA flossen bereits Milliarden in Projekte zur Einführung elektronischer Krankenakten. Die Versorgungsqualität hat sich dadurch allerdings noch nicht wie erwartet erhöht. Eines der Probleme: Die Daten lassen sich bislang nur schwer automatisiert analysieren. Eine neue Studie zeigt nun, dass Verfahren aus der Computerlinguistik beim Verarbeiten von Patienteninformationen helfen könnten.
In den USA wird bereits bei der Erstellung von Rezepten mit solchen Analysemethoden gearbeitet. Weil Rezeptdaten bereits hochstrukturiert vorliegen, ist das technisch kein großes Problem. Dagegen ist das, was ein Arzt in die Krankenakte schreibt, zumeist wenig strukturiert – Ärzte haben hier ein freies Textfeld, in das sie den Zustand, die Krankengeschichte und andere Aspekte hineinschreiben können, die sie für wichtig halten. Kollegen verstehen das, was es dort zu lesen gibt zwar problemlos – ein Computer und sein Suchalgorithmus hingegen nicht.
Eine normale, unintelligente Volltextsuche findet zwar das Wort "Lungenentzündung" in einer Krankenakte. Das Vanderbilt-System kann aber beispielsweise solche Ergebnisse ausfiltern, die keine Relevanz haben, etwa, wenn vor "Lungenentzündung" ein "keine Anzeichen von" steht.
... mehr


Start-up will beste Preise für Hardware vorhersagen
01.09.2011, heise online
Es ist eine klassische Frage, die sich jeder Freund neuer Produkte aus dem Techniksektor stellt: Wann ist der richtige Zeitpunkt, zuzuschlagen? Wer früh kauft, kann zwar damit angeben, zu den "Early Adoptern" zu gehören und ein neues Gerät länger genießen. Doch dabei zahlt man oft drauf.
"Die Leute haben ständig das Gefühl, über den Tisch gezogen zu werden", meint Oren Etzioni, Technikchef und Mitbegründer des Start-ups Decide, einer US-Internet-Firma, die versucht, Kunden die Entscheidung abzunehmen. Decide hat dazu Vorhersagemodelle entwickelt, bei denen Preistrends ebenso berücksichtigt werden wie Nachrichten, Gerüchte und aktuelle technische Spezifikationen.
Die Vorhersage von Preisen für Unterhaltungselektronik ist komplex. Gadgets werden über viele Monate behalten und genutzt. Die Leute wollten nicht zu lange warten, damit sie nicht mit veralteten Geräten vorlieb nehmen müssen, sagt Etzioni. "Da geht es oft weniger um den Preis. Wir glauben, dass nur eine beschränkte Anzahl an Kunden wirklich warten will." Aus diesem Grund berechnen die Decide-Algorithmen nicht nur neue Modelle und bereits erschienene Geräte mit ein. Es werden auch Sonderfälle berücksichtigt. "Es kommt manchmal vor, dass neue Geräte sogar billiger sind als ihre Vorgänger", sagt Etzioni.
... mehr


Chatbots - Die automatischen Gesprächspartner
22.08.2011, DRWissen
Er muss ziemlich von den Socken gewesen sein, der US-amerikanische Psychologe Dr. Robert Epstein. Zwei Monate lang hatte er romantische E-Mails ausgetauscht mit seiner russischen E-Mail-Dating-Affäre Ivana. Aber die Frage, ob er sie an einem bestimmten Tag in Moskau besuchen dürfe, ignorierte sie wochenlang. Als Ivana dann immer wieder die gleichen langweiligen Geschichten wiederholte, dämmerte ihrem Verehrer: Ivana ist gar keine attraktive, junge Dame mit schlechtem Englisch, sondern ein Chatbot.
Das war 2007. Epstein begann die Welt der Chatbots zu erforschen und wurde einer der weltweit führenden Experten in Sachen künstliche Intelligenz.
Was Epstein passiert ist, ist nicht ungewöhnlich. Im Internet werden so genannte Chatbots eingesetzt, um den Kontakt zu einem Menschen zu suggerieren und so an Informationen über die Chattenden zu gelangen, etwa Kreditkartendaten oder Passwörter. Und diese Software wird besser und besser.
DRadio Wissen präsentiert einen spannenden Hör-Beitrag über die automatischen Gesprächspartner, bei dem sogar zwei der Chat-Computer zu einem romantischen Gespräch verkuppelt werden.
... mehr


Der Touchscreen stupst zurück
12.07.2011, golem.de
Künftig könnten sich mobile Geräte durch die Vivitouch-Technik von Artificial Muscle von Wettbewerbern abheben. Vivitouch basiert auf elektroaktiven Polymeren, die taktile Rückkopplung mit Frequenzen von 50 bis 300 Hz erzeugen können. Die künstlichen Muskeln sollen sehr schnell reagieren, innerhalb von 5 ms spürbar sein und wenig Strom verbrauchen.
Die Vivitouch-Aktuatoren sollen sehr präzise sein und die Touchscreen-Oberfläche selbst bewegen und so den Fingern ein feines taktiles Feedback geben können. "Der Sprung von traditionellem Rütteln zu Vivitouch ist wie der Sprung vom Schwarz-Weiß- zum Farbfernsehen", wirbt Artificial Muscle in einer Pressemitteilung.
Eines der ersten Geräte mit Vivitouch wird Mophies Pulse-Gehäuse für den iPod touch. Es soll die Hände des Spielers kräftig durchschütteln können und Spielen durch die zusätzlichen Lautsprecher auch zu satterem Stereosound verhelfen. Bei nicht angepassten Spielen oder Anwendungen wird der Sound dazu verwendet, Bewegungen auszulösen. Ein Pulse-Prototyp wurde bereits im Januar 2011 auf der CES in Las Vegas präsentiert, das fertige Produkt lässt aber weiter auf sich warten.
... mehr


Theseus-Teilprojekt Alexandria soll Ende des Jahres online gehen
12.07.2011, heise online
Der IT-Dienstleister Neofonie hat nach eigenen Angaben die Entwicklung der Wissensplattform Alexandria abgeschlossen, die Teil des semantischen Suchprojekts Theseus ist. Das Besondere an Alexandria ist das dahinterstehende Metamodell, das an die Semantik der menschlichen Sprache angelehnt ist. Damit kann nicht nur nach Schlagwörtern gesucht werden, es ist auch möglich, sich komplette Fragen wie "Welche Künstler wurden 1970 in Berlin geboren" beantworten zu lassen, erläuterte der Projektmanager Florian Kuhlmann.
Die Wissensbasis, aus der das Projekt schöpft, werde aus drei Quellen gefüttert. Dabei handle es sich um bereits strukturierte und mit "Tags" versehene Informationen aus dem Internet. Dazu kämen Daten, die per semi-automatischer Textanalyse erstellt würden und komplexe Beziehungen abbilden könnten sowie Einträge aus der derzeit noch auf Beta-Tester begrenzten Nutzergemeinde.
Alexandria ist Kuhlmann zufolge modular angelegt und besteht aus der eigentlichen Wissensbasis, dem Frage-Antworten-System sowie Komponenten für Textanalyse, Empfehlungen und Community.
... mehr


myAudi mobile assistant hilft weiter
08.07.2011, elektroniknet.de
Der neue myAudi mobile assistant macht die aktuelle Verkehrslage immer und überall verfügbar. Dank neuester Technik meldet die App Staus und Behinderungen in Echtzeit auf dem Smartphone und hilft so, die günstigste Abfahrtszeit zu wählen. Mit dem integrierten Fahrten- und Tankbuch kann der Nutzer seine Fahrleistungen und Ausgaben für Kraftstoff jederzeit erfassen und auswerten – ganz komfortabel auch direkt an der Zapfsäule. Weitere praktische Funktionen der neuen App sind die kartenbasierte Händlersuche, die die nächstgelegenen Audi-Partner im Umkreis anzeigt und der Parkplatzfinder: Er speichert auf Wunsch den aktuellen Standort des eigenen Fahrzeugs und markiert ihn in der Kartenansicht.
Die umfassende Vernetzung mit den mobilen Endgeräten des Kunden ist eine Säule der Audi-connect-Strategie. Das System nutzt unter anderem anonymisierte Bewegungsprofile, die hunderttausende Handys in anderen Fahrzeugen erzeugen. So arbeitet es schneller und gleichzeitig exakter als bisher bekannte Verkehrsinformationsdienste.
Der myAudi mobile assistant ist für das iPhone, iPod touch und iPad erhältlich und kann kostenlos im Apple App-Store heruntergeladen werden.
... mehr


Bing-Suchmaschine - Ohne Tippen suchen
07.07.2011, golem.de
Eine Suchfunktion, die auf die Besonderheiten von Tablets Rücksicht nimmt, soll die App von Microsofts Suchmaschine Bing sein, die auf Apples iPad läuft. Mangels Hardwaretastatur fällt das Tippen schwerer als bei Notebooks und so hat Bing eine neue Suchmöglichkeit erhalten, die auf das berührempfindliche Display zurückgreift.
Der Anwender markiert das Suchwort mit dem Finger, indem er eine Ellipse darum zeichnet. Diese Funktion nennt Microsoft Lasso. Sie ersetzt das Tippen und auch das etwas umständliche Markieren von Textstellen mit den iOS-Funktionen.
Derzeit ist die iPad-Anwendung von Bing nur im US-App-Store von Apple erhältlich. Wann die deutschsprachige Lokalisierung folgt, ist nicht bekannt.
... mehr


iPad-App für Gebäudeautomation
07.07.2011, Elektronik Praxis
Die ELV/eQ-3-Gruppe nutzt das iPad als mobile Kommandozentrale zur Steuerung für die Hausautomation. Für eine schnelle Übersicht ist das Programm an die spezifische iPad-Anzeige angepasst und bietet die Möglichkeit, individuelle Oberflächen zur Steuerung einzelner Home-Control-Geräte oder ganzer Szenarien einzurichten.
Mittels der neuen Funktion zur Einbindung von Webcams kann der Haus- oder Wohnungsbesitzer seine vier Wände immer und überall im Blick behalten. So kann er z.B. seine IP-Überwachungskameras in die pocket Home-App integrieren und deren Aufnahmen direkt und live aus der Applikation heraus abrufen.
Via iPad lassen sich einzelne Räume komfortabel überwachen. Der Anwender kann die zu steuernden Aktoren, etwa Heizungsthermostate in verschiedenen Räumen, frei definieren bzw. festlegen. Darüber hinaus ermöglicht pocket Home HD mittels Listen- oder Bildansichten die Einrichtung eines individuellen Steuerungs-Interfaces.
... mehr


MyVoice App gibt Sprachbeeinträchtigten eine Stimme
13.04.2011, macnews.de
Per Klick lassen sich Vokabeln und Phrasen miteinander kombinieren und vom Smartphone vorlesen. Die Wort- und Phrasenbausteine sind nach Themen geordnet und lassen sich als Wörterbücher herunterladen. Über die zusätzliche Lokalisierungsfunktion macht die App automatisch passende Vorschläge, abhängig davon, wo man sich gerade befindet. Im Menüpunkt "Places" kann der Nutzer Orte speichern und dafür passende Vokabeln festlegen. Befindet er sich dann beispielsweise im Café, in einem Geschäft oder in der Bank, kann die Anwendung das erkennen und automatisch passende Phrasen wie "Kaffee mit Zucker und Milch bitte", "Ich zahle mit Karte" oder "Ich möchte Geld abheben" ausgeben.
Die Anwendung kann also in gewissen Maße einen Sprachcomputer ersetzen, wie ihn zum Beispiel Stephen Hawking nutzt - mit dem Vorteil weniger klobig und eher unfauffällig und günstiger zu sein.
Die App ist in englischer Sprache verfügbar. Gesprochen werden die Phrasen von "Dave", einer männlichen, US-amerikanischen Stimme. Für 4,99 Euro können weitere Stimmen erworben werden.
... mehr


Apps für alle Endgeräte – erste Forschungsergebnisse veröffentlicht
07.04.2011, Informationsdienst Wissenschaft
Applikationen, kurz „Apps“ genannt, dominieren derzeit den Smartphone-Markt. In Zukunft sollen Apps nicht nur auf Smartphones, sondern auch plattformübergreifend eingesetzt werden: auf internetfähigen Fernsehern, Tablet- und Desktop-PCs, Spielkonsolen und sogar in Autos. Dafür entwickeln derzeit 20 Partner aus Industrie und Forschung in dem Projekt "webinos" eine Open-Source-Plattform sowie Software-Komponenten.
"Mit der von uns angestrebten Technologie wollen wir die Programmierung und Entwicklung von Apps ermöglichen, die sich benutzerfreundlich, sicher und nahtlos auf einem breiten Spektrum an Endgeräten einsetzen lassen", erläutert Projektleiter Dr. Stephan Steglich, Fraunhofer FOKUS.
Ende März 2011 hat das Projekt-Konsortium die ersten Forschungsergebnisse veröffentlicht. Berichte zu den Themen Anwendungsfälle, Sicherheit, technische Anforderungen und Branchenumfeld stehen zum Download bereit. Das von der Europäischen Union mit zehn Millionen Euro geförderte Projekt startete im September 2010 und läuft bis 2013. Ein erster Protoyp der Technologie wird für Ende 2011 erwartet.
... mehr


Kaffeevollautomat Jura IMPRESSA Z7 One Touch mit Spracherkennung
30.03.2011, Essen & Trinken
Ab Juli 2011 liefert die IMPRESSA Z7 One Touch Voice von JURA Kaffeespezialitäten per Spracheingabe, die sich einfach über die so genannte Rotary Switch-Taste einschalten lässt. Sobald das blaue Lämpchen leuchtet, nimmt der neue Kaffeevollautomat innerhalb einer Minute Bestellungen für Ristretto, Espresso, Kaffee, Cappuccino, Latte macchiato, Heißwasser oder Milch auf - nur noch Glas oder Tasse unter den höhenverstellbaren Kaffeeauslauf stellen und fertig ist der Lieblingskaffee. Möglich machen das integrierte Lautsprecher, Mikrofon und eine ausgeklügelte Technik.
Die Sprachausgabe lässt sich abstellen, die Lautstärke ist regulierbar. Und neben dem freundlichen "Wie bitte?" hat die IMPRESSA Z7 One Touch Voice sprachlich noch einiges mehr zu bieten: Die sanfte Stimme erinnert daran, den Wassertank oder Milchbehälter oder die Bohnen aufzufüllen, den Kaffeesatzbehälter oder die Restwasserschale zu leeren und den Aromaschutzdeckel aufzusetzen.
... mehr


Itenos präsentiert den Dienst "Voice-Ident"
29.03.2011, Funkschau
Erhebungen des Statistischen Bundesamtes zufolge muss sich jeder Bundesbürger im Schnitt rund sechs PIN-Nummern merken. Datenschutzexperten sehen die Grenzen der Merkfähigkeit bereits erreicht. Im Extremfall wird die Geheimzahl sogar schon auf die EC-Karte geschrieben, damit man sie beim Abheben am Geldautomaten gleich zur Hand hat. Mit dem Einsatz von so genannten "Voice-Prints" könnte dieses Sicherheitsrisiko sehr schnell beseitigt werden.
Der Bonner Sicherheitsspezialist Itenos bietet mit "Voice-Ident" ein Verfahren an, mit dem sich Nutzer anhand der eigenen Stimme authentifizieren können. Das Programm erlaubt den Zugriff auf verschiedene Funktionen. Die Stimme wird als Datensatz erfasst und dient als Schlüssel beispielsweise für Online-Banking oder Bestellungen.
Das Bundesamt für Sicherheit in der Informationstechnik (BSI) hat die Zuverlässigkeit von "Voice-Ident" bestätigt und für den Authentifizierungsdienst ein Sicherheitszertifikat ausgestellt.
... mehr


MIA- ein Cloudbasierter Marktplatz für Informationen und Analysen
16.03.2011, Pressebox
Die Analyse von frei verfügbaren Daten ist ein wachsendes Marktsegment. Mithilfe von Sprachtechnologien und statistischen Verfahren können Milliarden von Webseiten ausgewertet werden. Das Forschungsprojekt MIA hat das Ziel die Verarbeitung dieser Daten auch kleinen und mittelständischen Unternehmen mittels Cloud Computing zu ermöglichen.
MIA wird einen Marktplatz entwickeln, der den nachhaltigen Betrieb einer zuverlässigen und vertrauenswürdigen Plattform zur Gewinnung, Vorhaltung und Nutzung des Datenbestands des deutschsprachigen Webs und anderer freier Informationsquellen sichert.
Das BMWi fördert durch "Trusted Cloud" die Entwicklung und Erprobung von innovativen, sicheren und rechtskonformen Cloud Computing-Diensten mit insgesamt rund 50 Mio. Euro. Hinzu kommen Eigenmittel der Projektbeteiligten in etwa gleicher Höhe, so dass insgesamt rund 100 Mio. Euro zur Verfügung stehen. Das BMWi-Technologieprogramm "Trusted Cloud" ist Teil des Aktionsprogramms Cloud Computing, das das BMWi im Oktober 2010 gemeinsam mit Partnern aus Wirtschaft und Wissenschaft gestartet hat.
... mehr


Java Speech API 0.3 macht sich für Windows 7 und Mac OSX bereit
29.11.2010, JAXenter
Das Open Source verfügbare Projekt Java Speech API (JSAPI) ist in Version 0.3 erschienen. Das Projekt bietet eine Basisbibliothek für den JSR-113 und soll das Entwickeln von Spracherkenner und -synthesizern erleichtern, die mit dem JSR-113 kompatibel sind. Die neue Version lässt Spracherkenner nun auch von den Betriebssystemen Windows Vista und 7 nutzen, außerdem gibt es erste Gehversuche in Richtung Mac OSX. Mehr Informationen gibt es auf der Projektseite. Mehr zum Thema finden sich auch im ausführlichen JAXenter-Artikel.
... mehr


Clipsuche nutzt Spracherkennung
25.11.2010, heise online
Durch Filme lässt sich bislang nur verhältnismäßig mühsam navigieren: Dem Zuseher bleibt nichts anderes übrig, als den gewünschten Abschnitt über die Vor- und Rückspulfunktion anzusteuern oder darauf zu hoffen, dass der Videoproduzent passende Kapitelmarkierungen an den interessantesten Stellen gesetzt hat.
Forscher am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS) in Sankt Augustin wollen das Problem nun über das sogenannte Audio-Mining lösen. Dabei wird die Tonspur eines Videos über ein Spracherkennungssystem automatisch in Text umgewandelt. Gleichzeitig wird in einer Datenbank abgelegt, wann genau welches Wort im Film gefallen ist.
Die IAIS-Forscher haben ihre Technik mittlerweile auch praktisch umgesetzt - bei einem Projekt in Zusammenarbeit mit der Pro Sieben-Sendung "Galileo". Aus dem Bildberichts-Bestand von über 12 Jahren wurden insgesamt 5000 Werke indexiert. Diese sind nun im Internet verfüg- und durchsuchbar.
... mehr


Multi-Channel-Voice of the Customer Textanalyse jetzt auch in Deutsch erhältlich
23.11.2010, Attensity Pressestelle
Attensity veröffentlichte die deutschsprachige Variante seiner Textanalyse-Applikation Attensity Analyze. Mit Attensity Analyze for German können wertvolle Informationen nun auch aus deutschsprachigen Kundenkonversationen aus den unterschiedlichsten Quellen wie Social Media, Callcenter-Aufzeichnungen, E-Mails oder Kundenumfragen in Real-Time extrahiert und zusammengeführt werden.
Dies versetzt deutsche Unternehmen in die Lage, tiefgreifende Einblicke in die Kundenstimmung und in die Ursachen von Meinungen, Empfehlungen oder Problemen zu gewinnen. Sogar Gründe für Kundenabwanderungen und Betrugsfälle lassen sich so aufdecken und wichtige Informationen hinsichtlich Kundenzufriedenheit, -loyalität oder Stimmungslage gewinnen.
Die Basis von Attensity Analyze bilden semantische Technologien im Bereich des Natural Language Processing (NLP), die eine tiefgreifende Analyse ermöglichen. Attensity Analyze wandelt Texte in verwertbare Informationen um und ermöglicht damit Einblicke in aggregierte Kundendaten.
... mehr


Swype für Symbian: Deutsche Sprachversion der Texteingabe verfügbar
23.11.2010, golem.de
Auf Bildschirmtastaturen tippt der Anwender normalerweise jeden Buchstaben einzeln. Bei Swype erfolgt die Eingabe, indem die einzelnen Buchstaben eines Wortes quasi auf dem Bildschirm gezeichnet werden. Damit soll Swype die Eingabegeschwindigkeit erhöhen.
Das in Swype enthaltene Wörterbuch hilft außerdem bei der Eingabe. Vor allem, wenn eine Eingabe nicht eindeutig erkennbar ist, zeigt die Software eine passende Auswahl an. Zudem sollen mit dem Wörterbuch gepaart mit der Swype-Eingabetechnik Tippfehler vermieden werden. Die Leertaste ist bei Swype oft überflüssig, weil die Wörter in einer Bewegung eingegeben werden und das Absetzen als Wortende erkannt wird.
Nokia bietet die Betaversion von Swype für eine Reihe von Touchscreen-Smartphones mit der Symbian S60 5th Edition im Bereich Nokia Beta Labs an.
... mehr


Preise vergleichen mit dem iPhone
23.11.2010, SpeechTechMag
Amazon.com bietet eine neue iPhone-App zum direkten Preisvergleich im lokalen Einzelhandel. US-Kunden sollen damit noch am Regal entscheiden können, ob sie lieber bei Amazon oder anderswo online bestellen.
Mit der iOS-App "Price Check by Amazon" kann das zu vergleichende Produkt automatisch über den Barcode oder ein Bild der ganzen Verpackung erkannt werden. Alternativ kann der Produktname auch mittels Spracherkennung oder Eintippen übermittelt werden.
Amazon.com versucht darauf hin das Produkt in seiner eigenen Datenbank und bei anderen Onlinehändlern zu finden. Bei Interesse kann dann bei auf Amazon angebotenen Produkten direkt über die App bestellt werden.
Eine deutsche Version der Anwendung wurde noch nicht angekündigt.
... mehr


Facebook verschmilzt E-Mail, SMS, Chat und Instant Messaging
15.11.2010, golem.de
Facebook Messages ist kein Google-Mail-Killer, betont Facebook-Gründer Mark Zuckerberg anlässlich der Vorstellung des Dienstes. Dabei können Nutzer die Kommunikationskanäle selbst bestimmen, ganz gleich ob SMS, Chat, E-Mail oder Facebook-Messages. Die Nachrichten erreichen den Empfänger auf dem Weg, den er gewählt hat, so dass sich der Absender keine Gedanken darüber machen muss, welchen Kommunikationskanal der Empfänger bevorzugt. Dennoch soll gewährleistet sein, dass alle Kommunikation in Echtzeit abläuft.
Im Rahmen des neuen Dienstes stellt Facebook seinen Nutzern auch eine E-Mail-Adresse zur Verfügung, die dem Schema Benutzername@facebook.com entspricht. Klassische E-Mails bietet Facebook aber bewusst nicht an: Die Nachrichten haben keinen Betreff und sie können auch nicht per CC oder BCC an mehrere Empfänger gesendet werden. Sie werden zudem mit Drücken der Enter-Taste abgeschickt.
... mehr


Dichtung und Wahrheit - Google will Poesie übersetzen
10.11.2010, Der Westen
Gott der falschen Fährten, erlöse uns von den Namensvettern.” Ein Gedanke aus dem Gedicht „Goooogle“ des englischen Autors Adam O’Riordan. Er beschreibt die Suchmanöver einsamer Männer, die nachts im fahlen Bildschirmlicht nach früheren Bekannten forschen. Übersetzung: von Menschenhirn und -hand. Das bereits bestehende, reguläre Übersetzungsangebot "Google Transite" macht aus demselben Satz: "Gott falsche Fährten, erlöse uns aus dem Namensvetter." Nah dran, und komplett daneben. Aber genau das soll sich ja ändern.
In einer wissenschaftlichen Analyse haben drei von Googles Experten deshalb aufgedröselt, worauf es bei Dichtung alles ankommt: Zunächst einmal Reim, Versmaß, Silbenzahl. Wie sorgt man dafür, dass maschinelle Übersetzungen auch nur diesen Anfangskriterien genügen? Google setzt auf Masse. "Weil es sehr viele mögliche Übersetzungen gibt, darf man erwarten, dass einige von ihnen den vorgegebenen Regeln entsprechen", schreiben die drei Fachleute. Aber auch sie haben sich schon zusammengereimt, dass das eine schwierige Aufgabe wird, "vielleicht die schwerste der Computerlinguistik."
... mehr


Roboter lernt lesen wie der Mensch
08.11.2010, Informationsdienst Wissenschaft
Im Fachbereich Informatik der Fachhochschule Gelsenkirchen hat ein Roboter lesen gelernt, damit er sich in Gebäuden anhand von Türschildern orientieren kann. "Die Aufgabe war durchaus innovativ", so Prof. Dr. Hartmut Surmann, "bisher orientierten sich Roboter nämlich durchweg über Koordinatensysteme und nicht, indem sie dieselben Systeme nutzen wie wir Menschen.“
Dabei durchläuft der Roboter die gleichen Lernschritte wie der Mensch, wenn er durch Schule und Leben die Orientierung in Gebäuden lernt. Als erstes musste der Roboter speichern, woran er ein Türschild erkennt. Dann brauchte er eine Routine, mit der er beim Abfahren eines Flures die Türschilder findet. Im dritten Schritt zoomt er mit seiner Kamera auf das Türschild in Großaufnahme und fotografiert es. Als letztes kommt das eigentliche Lesen, wobei auf Standard-OCR-Programme zurückgegriffen wurde, die aus dem Bild eines Buchstabens das Verstehen eines Buchstabens und damit das Verstehen ganzer Wörter ableiten. "Anders liest auch der Mensch nicht", vergleicht Surmann, "Buchstaben sehen, Buchstaben verstehen, Buchstaben zu Wörtern zusammensetzen, Sinn ableiten, Inhalt anwenden."
... mehr


AT&T lauscht auf das Twitter-Volk
05.11.2010, heise online
Viele Firmen gehen inzwischen dazu über, die Tweets der weltweit rund 175 Millionen Nutzer systematischer auszuwerten. Meist geht es ihnen aber nur darum, wie Verbraucher über Produktmarken denken. AT&T hingegen will mit seiner selbstentwickelten Software die Stimmung in der "Tweetosphäre" möglichst exakt vermessen.
Zwar überwacht AT&T softwaregesteuert die Verbindungsqualität in seinem Netzwerk, und Kunden können Probleme einer Hotline melden. Mit dem neuen Ansatz bekomme man aber in Echtzeit wichtige Zusatzinformationen, anhand derer Wartungsarbeiten besser priorisiert werden könnten, sagt Jia Wang vom Internet and Systems Networking Research Center von AT&T. "Wir versuchen drei Dinge herauszufinden: Wo treten Probleme auf, welcher Art sind sie, und wann sind sie passiert?" sagt Wang.
... mehr


Das Netz bezahlt Rechnungen und reserviert im Restaurant
04.11.2010, golem.de
Ein Forscherteam unter Leitung von IBM hat untersucht, wie das Web in Zukunft das alltägliche Leben erleichtern kann. Ihre Ergebnisse haben die Forscher unter dem Titel "The Smart Internet" veröffentlicht.
In einer zunehmend vernetzten Welt, die durch Cloud-Dienste geprägt ist, ergeben sich neue Möglichkeiten, wie das Internet den Alltag vereinfachen kann, indem Informationen automatisch zusammengeführt und im Kontext ausgewertet werden. Die Forscher beschreiben, wie das konkret aussehen könnte. Angeführt wird beispielsweise das Bezahlen von Rechnungen oder das Filtern von Nachrichten.
Im nächsten Schritt wollen die Forscher prüfen, wie sich die Technologien kommerzialisieren lassen.
... mehr


Microsoft verstärkt sich bei Bewegungssteuerung
30.10.2010, heise online
Microsoft hat das US-Unternehmen Canesta, das sich auf die Herstellung von Chips für bewegungsempfindliche Steuerungen spezialisiert hat, gekauft. Canesta-Chef Jim Spare zeigte sich überzeugt, dass die Technologie künftig in vielen Geräten Einsatz finden werde.
Microsoft bringt gerade für seine Spielekonsole Xbox die Steuerung Kinect auf den Markt, bei der man den Spielverlauf nur mit Körperbewegungen bestimmt. Der Windows-Konzern will das Konzept in Zukunft breiter einsetzen, beispielsweise zur Steuerung von Unterhaltungsgeräten im Wohnzimmer.
Nicht nur Microsoft sieht das Potenzial der Bewegungssteuerung. Schon vor Jahren hatte Canesta die Technologie für Sonys Playstation-Kamerazusatz EyeToy geliefert. Eine Referenz für die Vision lieferte 2002 Steven Spielbergs Zukunfts-Film "Minority Report", in dem Computer mit Gesten der Hand gesteuert wurden. Der Entwickler John Underkoffler, der damals das Konzept für den Film mitentworfen hatte, versucht nun, die Technologie mit einer Firma Namens Oblong praxisfähig zu machen.
... mehr


Texterkennung - iPhone liest Texte
29.10.2010, golem.de
Mit dem OCRKit Mobile hat das Berliner Unternehmen Exactcode eine Texterkennung vorgestellt, mit der Apples iPhone zu einem Textscanner wird. Die Texterkennungs-App ist nach Angaben der Entwickler am iPhone 4 mit seiner 5-Megapixel-Kamera besser einzusetzen als bei den älteren Geräten. Aber auch am iPhone 3GS soll sie funktionieren.
Die Fotos werden direkt auf dem iPhone der Texterkennung zugeführt und nicht etwa auf den Server des Anbieters geschoben. Das sorgt dafür, dass volumenbasierte Datentarife nicht überstrapaziert werden und die Privatsphäre gewahrt bleibt. Die Texterkennung ist an Wörterbücher gekoppelt, um die Genauigkeit zu verbessern.
Die App funktioniert in angepasster Auflösung auch auf dem iPad, das mangels Kamera nur Bilder behandeln kann, die zuvor via iTunes auf das Gerät gespielt wurden.
OCRKit Mobile kann ab sofort im iTunes-App-Store für 3,99 Euro erworben werden.
... mehr


Volkswagen und SVOX entwickeln In-Car-Voice-System mit NLU
27.10.2010, SpeechTechMag
SVOX und Volkswagen wollen im gemeinsamen Forschungsprojekt "Voile Control" natürlichsprachliche Interfaces im Auto wahr werden lassen. Ziel des ambitionierten Projektes ist es, klassische Sprachbefehle und strenge Menüführungen für die Steuerung der In-Car-Funktionen durch NLU-Systeme zu ersetzen.
"Ziel unserer Bemühungen ist es, Sprachdialogsysteme einfacher und nutzerfreundlicher zu machen. Der Nutzer soll in Zukunft keine speziellen Sprachbefehle mehr erlernen müssen," erklärt Peter Oel von VW. Stattdessen sollen freie Eingaben, wie: "Ähm, ich möchte jetzt Clara Schumann anrufen" möglich sein.
Gordon Seitz, "Voice Control"-Projektleiter bei der VW, erklärt: "Natural Language Understanding wird durch eine wissensbasierte Auswertung der Benutzereingaben ermöglicht." Das System filtert die relevanten Informationen aus einer Äußerung, unabhängig vom exakten Wortlaut und der Wortstellung. Und ein Frame-basiertes Dialogsystem unterstützt den Anwender optimal, indem es nur nachfragt, wenn Informationen fehlen und zusätzliche Informationen gibt. wem das erforderlich sein sollte. Nutzer sollen damit ihre Eingaben auch frei korrigieren bzw. ändern können: "Ich möchte Clara Schumann im Büro anrufen - äh nein, ich schicke ihr lieber eine Mail."
... mehr


Neue App verbindet Social Media und Voicemail-Platform
26.10.2010, SpeechTechMag
Anana und Alcatel-Lucent haben eine Anwendung entwickelt, die traditionelle Voicemail-Plattformen mit Web 2.0 und Social Media kombiniert, so dass Anrufer nicht mehr den üblichen Voicemail-Spruch, sondern aktuelle Statusmeldungen des Angerufenen von Twitter oder Facebook zu hören bekommen. Statt: "Max Meier ist im Moment nicht erreichbar. Bitte hinterlassen Sie eine Nachricht nach dem Ton." hört der Anrufer etwas wie: "Willkommen bei Its4u. Sie können gleich eine Nachricht hinterlassen, lassen Sie uns nur kurz Twitter und Facebook checken. Twitter: 'Hallo, ich bin bis 15:30 bei einem Meeting in der Stadt' und Facebook: 'Entspannen mit der Familie am Strand' ..."
Der Angerufene muss sich somit nicht mehr um die Aktualisierung seiner Voicemail-Ansage kümmern. Per TTS können einfach Status-Updates von Facebook, MySpace, Twitter, LinkedIn und anderen Social-Networking-Seiten als Teil der Voicemail-Ansage ausgegeben werden.
Its4u nutzt die Genesys Voice Platform und das Converged Messaging System (CMS) von Alcatel-Lucent. Es unterstützt alle Kombinationen von Spracherkennungs- und TTS-Systemen führender Hersteller wie Nuance, Loquendo, AT & T oder IBM.
... mehr


Übersetzungsprogramm und mehr Transparenz für Wikipedia
22.10.2010, golem.de + Informationsdienst Wissenschaft
Microsoft hat ein browsergestütztes Übersetzungsprogramm entwickelt, das Google Translate ähnelt. Das Übersetzungswerkzeug heißt WikiBhasha und ist dafür gedacht, Artikel aus der Onlineenzyklopädie Wikipedia in andere Sprachen zu übersetzen. Das soll es ermöglichen, kleinere Ausgaben mit Inhalten zu füllen. Um einen Wikipedia-Artikel zu übersetzen, öffnet der Nutzer die Wikipedia und das Übersetzungswerkzeug. Es öffnet sich ein doppeltes Fenster - der englische Artikel und eine Übersetzung. Die kann der Nutzer nun bearbeiten: Er kann Inhalte, die in den Artikel aufgenommen werden sollen, markieren sowie die maschinell angefertigte Übersetzung sprachlich bearbeiten. Außerdem hilft WikiBhasha ihm dabei, den Artikel nach Wikipedia-Art zu gestalten.
Mit "Wiki-Watch.de" ging am 22. Oktober ein Portal für mehr Transparenz in Wikipedia online. Die von Medienrechtlern der Europa-Universität Viadrina Frankfurt (Oder) entwickelte Plattform bietet jedermann die Möglichkeit, die Verlässlichkeit von einzelnen Artikeln in Wikipedia zu überprüfen. Für eine Prüfung etwa auf Änderungen, Löschungen und Quellenbasis genügt die Eingabe des Stichwortes auf Wiki-Watch.de. Zusätzlich macht Wiki-Watch transparent, welche Artikel am meisten nachgefragt, am stärksten umkämpft oder gerade von Löschung bedroht sind. "Wikipedia ist mit mehr als 1,1 Millionen deutschsprachigen Artikeln die wichtigste Wissensressource. Zwischen 25 und 35 Millionen Mal wird sie täglich allein im deutschen Sprachraum benutzt. Da ist es für jeden Nutzer, aber auch für die Gesellschaft wichtig zu wissen, welcher der Artikel nicht der Qualität entspricht, die wir insgesamt von Wikipedia gewohnt sind, sagen die Medienrechtler Prof. Dr. Wolfgang Stock und Prof. Dr. Johannes Weberling von der Europa-Universität Viadrina, Initiatoren von „Wiki-Watch”.
... mehr


Peugeot-Fahrzeuge erhalten mobiles Internet
20.10.2010, sueddeutsche.de
Viele Peugeot-Fahrer können demnächst in ihrem Wagen mobil im Internet surfen. Der französische Autohersteller stattet zahlreiche Modelle mit einer optionalen Wifi-Box aus, die den Zugriff aufs Web ermöglicht. Damit können vier Geräte gleichzeitig online gehen. Der mobile Hotspot funktioniert sowohl im Stand und während der Fahrt. Beifahrer können so zum Beispiel auf Reisen mit einem Laptop oder Smartphone im Netz surfen.
Die Wifi-Box wird dabei je nach Modell im Gepäck- oder Innenraum montiert. Dazu gehört ein USB-Stick, den der Fahrer mit der SIM-Karte seines Internetanbieters ausstattet und über den er online geht. Wird der Internetzugang außerhalb des Wagens gebraucht, kann der Fahrer die Karte dann einfach mitnehmen.
... mehr


IBM will Social-Media-Wildwuchs lichten
19.10.2010, heise online
RSS-Reader sollten dabei helfen, einen Überblick über all das zu behalten, was täglich im Netz veröffentlicht wird. Schon bald jedoch stapelten sich tausende ungelesener Einträge. Twitter versprach dieses Problem zu lösen, indem man sich auf die Empfehlungen anderer verlassen sollte, welche Inhalte wirklich wichtig sind – doch schon bald explodierte auch die Zahl der interessanten Tweets. Nun unternimmt IBM einen neuen Anlauf, den Informationswust zu lichten: mit der Software "Sozial Lenz".
Dabei handelt es sich zunächst um ein Plug-in für das firmeninterne Netzwerk des IT-Konzerns. Es filtert aus aktuellen Einträgen die individuell wichtigen Neuigkeiten heraus. Dazu muss ein Nutzer zunächst eine "Linse" anlegen: Er listet Themen, Menschen oder Links auf, die als Filterkriterium dienen sollen. Dabei kann er auch beliebig viele solcher Filterlinsen anlegen. Social Lens listet dann die Ergebnisse auf und berücksichtigt dabei, in welcher Beziehung Inhalte und Quellen zu den Kriterien stehen.
Die Software umgehe dabei bekannte Schwächen von anderen Filtern, sagt Elisabeth Daly, die an der Entwicklung von Social Lens beteiligt war. Sie orientiere sich ganz bewusst an den vorgegebenen Themen und nicht an den Dokumenten, die ein Nutzer im Laufe der Zeit tatsächlich lese. Denn eine solche fortschreitende Personalisierung führe häufig dazu, dass sich der Filter zu stark auf einen Aspekt verenge.
... mehr


Verint bietet Tool zur Beobachtung von Social Media
18.10.2010, acquisa
Mit einem neuen Tool des Softwareanbieters Verint Systems können Unternehmen verfolgen, was im Internet über sie geschrieben wird. Impact 360 analysiert Web-Inhalte aus E-Mails, Chats und Blogs.
Die Ergebnisse des Analyse-Tools liefern Hinweise über Trends, das Verhalten der Kunden und erfasst Meinungen und Kritik zu eigenen Produkten. Damit kann es Unternehmen als eine Art Frühwarnsystem dienen, wenn es darum geht, Produkte und Dienstleistungen zu verbessern. Das Tool funktioniert proaktiv, klassifiziert die Inhalte und archiviert sie.
... mehr


Coupons auf das Smartphone
18.10.2010, Handelsblatt
Wenn es ums Sparen geht, sind die Deutschen Weltmeister. Seit 2001 das Rabattgesetz gefallen ist, ist Couponing das am schnellsten wachsende Marketinginstrument. Ob McDonalds oder Kaufhof - vor allem große Anbieter locken mit den Papierschnipseln die Kunden in ihre Läden. "Wir haben uns gedacht, von einem mobilen System, das die Coupons unterwegs auf die Handys bringt, könnten neben großen Händlern auch die kleinen Anbieter um die Ecke profitieren", sagt Frank Schleimer, Geschäftsführer von Coupies. Sie können Menschen in Nähe mit Preisnachlässen auf sich aufmerksam machen.
"Im Gegensatz zu Papier-Gutscheinen sparen die Firmen beim Einsatz unserer elektronischen Coupons nicht nur die Druck- und Vertriebskosten, sondern sie können ihre Zielgruppen wesentlich genauer ansprechen", sagt Schleimer, der sich bei Coupies um den Vertrieb kümmert.
Ein Stadtplan auf dem Display zeigt alle Rabattaktionen in der unmittelbaren Nähe. Alternativ kann der Nutzer aber auch gezielt nach Angeboten suchen. Um einen Rabatt einzulösen, zeigt man den Coupon auf dem Smartphone an der Kasse des beteiligten Händlers oder Restaurants vor und erhält anschließend den vergünstigten Preis.
... mehr


Lernsystem Babbel: Aussprachetraining jetzt auch auf dem iPhone
12.10.2010, ptext.de
Das Online-Lernsystem Babbel bringt die Spracherkennung jetzt auch für die eigenen Sprach-Apps für iPhone, iPod touch und iPad. Mit dem Babbel Mobile - Vokabeltrainer können die Nutzer ihre Aussprache nun bequem überall testen und trainieren. Technologisch steckt hinter dem neuen Audio-Tool eine Echtzeit-Analyse der Aussprache. Alle Facetten des Sprechens werden ausgewertet und der Nutzer erhält sofort eine Rückmeldung, wie gut seine Aussprache ist. Die sieben Babbel Sprach-Apps sowie ab sofort auch der gesamte Grund- und Aufbauwortschatz von 3.000 Vokabeln mit Bildern und Beispielsätzen stehen kostenlos zum Download im App Store zur Verfügung.
Und so funktioniert die Spracherkennung: Der Sprachlerner spricht einzelne Wörter oder ganze Sätze nach. Der von Babbel entwickelte Algorithmus gleicht die Aussprache des Benutzers mit der Vorlage des Muttersprachlers ab. Der Nutzer erhält sofort eine Bewertung.
"Die Spracherkennung als mobile Anwendung ist ein weiterer technologischer Meilenstein für unser Lernsystem", so Markus Witte, Geschäftsführer von Babbel. "Wir achten nicht nur inhaltlich auf höchste Qualität, sondern auch technisch. Bei aller Raffinesse bleibt die Nutzung aber immer einfach - schließlich soll man möglichst schnell und einfach eine Sprache lernen."
... mehr


Fußgängernavigation mit LEDs
04.10.2010, heise online
Forscher der University of Electro-Communications in Tokio haben ein neuartiges Navigationsgerät entwickelt, das der Nutzer aufsetzen kann. Das sogenannte Wearable Personal Navigation System (WSNS) soll Fußgängern den Weg weisen und steckt komplett in einer regulären Brille.
Das System beinhaltet einen GPS-Empfänger zur Positionsbestimmung, einen kleinen Richtungssensor mit Kompass, einen Miniaturcomputer und eine Batterie. Auf einen vollwertigen Bildschirm verzichtete die Forschergruppe allerdings, stattdessen sind um die Gläser herum ringförmig einfache LED-Lichter angebracht.
Um das WSNS zu nutzen, gibt der Träger zunächst sein Ziel ein. Dazu nutzt er beispielsweise ein Smartphone, das drahtlos mit der Brille in Verbindung steht. Das System bestimmt dann nicht nur den aktuellen Ort des Benutzers, sondern auch die Richtung, in die er seinen Kopf hält. Geführt wird er anschließend allein über rote und grüne LEDs, die er über sein peripheres Sehen wahrnimmt.
... mehr


Tablet-Rückseite als Eingabefläche
30.09.2010, heise online
So schön neue elektronische Lesegeräte wie Apples iPad oder Samsungs Galaxy Tab zum Medienkonsum auch sein mögen – wenn es darum geht, Texte einzugeben, wird es im Vergleich zu regulären Laptops mit der Tastatur schnell schwierig. Kann man sich bei Smartphones mit Touchscreen aufgrund der geringen Größe noch ans Tippen "ins Nichts" gewöhnen, sind Tablet-Rechner schlicht zu groß, um nur mit den Daumen ein virtuelles Keyboard zu bedienen. Forscher bei Microsoft Research arbeiten an einer neuen Methode zur Texteingabe bei Tablet-Computern. "Reartype" genannt, nutzt die Technik jenen Bereich der Hardware, der bislang noch brachliegt: Die Rückseite des Displays. Die umklammert der Nutzer sowieso ständig, um den Bildschirm-Rechner zu halten. Die dort platzierten Finger bringt Reartype nun in Aktion.
Das Prototyp-Modell ist technisch eher einfach gehalten: Auf der Rückseite des Tablets befindet sich eine zweigeteilte Hardware-Tastatur, deren Bedienung an das Spielen eines Akkordeons erinnert. Auf der Vorderseite sind weitere Tasten angebracht, die zur Navigation dienen, beispielsweise Cursor- und Leertasten.
... mehr


Werkstätten finden mit der Kfz-mobile-App
26.09.2010, Computerbild.de
Die Berliner Agentur die_schnittsteller hat eine iPhone-App für Autofahrer entwickelt: "Kfz mobile" hilft ihnen bei der Suche nach einer geeigneten Autowerkstatt. Aktuell gibt es die kostenlose App nur für das iPhone. Eine Android-Version ist aber bereits in Vorbereitung. Die Anwendung liefert eine Übersicht an Meisterbetrieben der Kfz-Innung. Mit Filterfunktionen sortieren Sie die Einträge nach Kategorien wie Automarken oder Serviceleistungen. Werkstätten für Motorräder und Nutzfahrzeuge sind ebenfalls im Verzeichnis der App enthalten. Auf www.kfzgewerbe.de/app steht die Applikation zum Download bereit. Werkstattbesitzer können die Seite auch nutzen, um sich in die App eintragen zu lassen.
... mehr


o2 startet mobilen Schriftdolmetschdienst Verbavoice für Hörgeschädigte
25.09.2010, heise online
Im Rahmen einer konzernweiten "e-Accessibility-Initiative" hat o2 einen Online-Shop für Hörgeschädigte gestartet. Dieser bietet neben geeigneten Mobiltelefonen und Informationen zu Mobilverträgen in Gebärdensprache einen für den Alltag hilfreichen Schriftdolmetsch-Dienst namens Verbavoice an. Der Service für Hörgeschädigte wurde in Zusammenarbeit mit dem Deutschen Gehörlosen-Bund und der Stiftung Pfennigparade entwickelt.
Die von Verbavoice entwickelte mobile Plattform funktioniert nach dem Prinzip, dass registrierte Hörgeschädigte einen Termin für einen Schriftdolmetscher anmelden und dabei mitteilen, wie lang der Termin dauert und welche Fachrichtung oder Fachtexte zur Vorbereitung auf den Termin wichtig sind. Nach einer Prüfung, welcher Kostenträger den Termin übernimmt, wird der Auftrag auf der Plattform ausgeschrieben und der erste sich meldende Schriftdolmetscher erhält den Zuschlag.
Der Schriftdolmetscher arbeitet mit einer Mischung aus Speech to Text-Software, Tastaturkürzeln und Diktatsoftware und liefert ein verschriftlichtes Ergebnis in Echtzeit zurück, das über eine Web-Anwendung auf dem Mobiltelefon oder aber auf einem Netbook gelesen werden kann, welches wiederum via UMTS oder WLAN einen Internet-Zugang hat.
... mehr


Arcplan und Infospeed entwickeln Data-Mining-Tool
23.09.2010, acquisa
Der Anbieter von Business-Intelligence-Lösungen, Arcplan und Infospeed, Entwickler von Social-Media-Monitoring-Tools, arbeiten künftig bei der Entwicklung von BI- und Webmonitoring-Lösungen zusammen. Mit den dadurch gewonnenen Informationen können Unternehmen Inhalte aus Web-Netzwerken mit Kennzahlen verbinden und diese analysieren.
Die von Infospeed entwickelte Suchtechnologie W2m ist in der Lage, sämtliche Daten aus Social-Media-Quellen wie Blogs und Foren zu generieren. Mit dem Tool Arcplan Enterprise können diese Informationen mit den Unternehmensdaten verknüpft werden und in die Unternehmenssteuerung mit einfließen.
... mehr


Freie Sprachsoftware für Rechner und Roboter
21.09.2010, Futurezone
Ein Roboter, der auf Befehle hört, das Mittagessen serviert und auch für einen Smalltalk zu haben ist: Das ist das Ziel des EU-Projekts Astromobile. Für die Kommunikation stellt der steirische Verein für Forschung und Lehre, "simon listens", die freie Spracherkennungssoftware "Simon" zur Verfügung. Sie ist zwar nicht so gut für Diktate geeignet wie ihre kommerziellen Pendants, dafür kann sie sich sehr gut an die Bedürfnisse von Menschen mit Sprachproblemen anpassen.
"'Simon' ist nichts anderes als ein Maus- und Tastaturersatz", erklärt Franz Stieger, Projektverantwortlicher von "simon listens". Ursprüngliche Idee war, spastisch gelähmten Kindern die PC-Nutzung zu ermöglichen. Mit Unterstützung durch das Framework "Simon" können sie allein durch Spracheingabe E-Mails schreiben, im Internet surfen und via Skype telefonieren.
"Wenn die Spracherkennungssoftware sehr generell ist, ist die Fehlerquote noch zu hoch", erklärt Stieger. So funktioniere etwa "Naturally Speaking" von Dragon zwar für "normal Sprechende gut", doch für Spastiker sei sie nicht anwendbar, da diese oft eine zu undeutliche Aussprache hätten. Die Konkurrenzprodukte zur Spracherkennung seien zudem auf Zielgruppen wie Ärzte, Rechtsanwälte und Notare abgestimmt. Nachdem sich die Formulierungen in diesen Berufsgruppen häufig wiederholen würden, funktioniere das Diktationsmodell hier relativ gut.
... mehr


Heimautomatisierung - iPad-Überzieher mit Zusatzbuttons
17.09.2010, golem.de
Der Grundgedanke ist: Wenn mit dem iPad ein berührungsempfindliches Gerät mit WLAN im Haushalt ist, benötigt der Kunde keine zweite Fernsteuerung mit Display, über das die Heimautomatisierungstechnik gesteuert wird. Schließlich sind diese Geräte recht teuer, vor allem wenn sie mit Farbdisplays ausgerüstet sind. Das Multitouch-Display des iPad hat bei der Heimautomatisierung aber den Nachteil, dass virtuelle Bedienelemente nicht erfühlt werden können. So muss der Anwender stets einen Blick auf das Interface werfen, um die richtige Stelle zu treffen.
Bei Crestrons iPanel sollen deshalb zusätzliche Knöpfe den Bedienkomfort erhöhen. Neben Lautstärkereglern sind links drei Knöpfe unter anderem für die Tonabschaltung und das Licht vorhanden, während rechts ein Steuerkreuz sowie drei weitere Knöpfe eingelassen sind.
Das Crestron iPanel soll rund 500 US-Dollar kosten. Wann es auf den Markt kommt, ist noch nicht bekannt.
... mehr


Telenet: Das User Help Desk lernt sprechen
16.09.2010, Telenet
"Telenet Issue Tracking" eignet sich sowohl für den Einsatz im internen User Help Desk als auch im Kundenservice und Produkt-Support. Anrufer können in einem geführten Sprachdialog ihr Ticket direkt anlegen und sparen sich somit den Umweg über den Agenten. Durch die Integration in ein vorhandenes Issue Tracking System wird das Ticket direkt in der zentralen Datenbank angelegt, von wo aus es vom verantwortlichen Sachbearbeiter abgerufen werden kann. Der Anrufer wird auf Wunsch telefonisch, per E-Mail oder SMS über den Bearbeitungsstatus seines Tickets auf dem Laufenden gehalten.
Die Anwendung ist mehrmandantenfähig und lässt sich aufgrund des verwendeten Frameworks Voice4J in jede ITK-Umgebung integrieren. Optional lässt sich die Anwendung um weitere Features wie z.B. Passwort-Reset per sprachbiometrischem Verfahren oder Volltextverschriftung der Freitextaufnahmen erweitern, wodurch Ticketing-Prozesse fallabschließend automatisiert werden können.
... mehr


Kontextbezogenes Computing - Die Maschine denkt mit und sagt, was zu tun ist
15.09.2010, golem.de
In Zukunft sollen Smartphones mitdenken. Dabei geht es darum, Daten, die ohnehin schon verfügbar sind, zu verknüpfen und zueinander in Beziehung zu setzen. Dieses "context aware computing" will Intel verstärkt erforschen. Neben den harten Daten, die mobile Geräte unterwegs erfassen, sollen dabei auch die weichen Daten einbezogen werden, also zum Beispiel die aus sozialen Netzwerken. Intel stellt sich das so vor: Wenn sich Freunde mit bestimmter Musik wohlfühlen - das sollen die Geräte anhand von Körperdaten erkennen - , schlägt das System diese Songs auch anderen vor.
Die Erfassung von Daten des menschlichen Körpers soll auch Unfälle vermeiden. Gedacht ist es für Senioren, bei denen ein Sturz im eigenen Heim die Unfallursache Nummer eins ist. Einem Stolpern gehen aber meist schon einige unsichere Schritte voraus, so dass der Computer dann sagen kann: Bleib stehen, dir geht es nicht gut, setz dich lieber hin.
Noch persönlichere Daten als den Gesundheitszustand gibt es kaum noch - daher müssen sie besonders gut geschützt werden. Daher sollen Daten, die kontextbezogene Rechner erfassen, von den Anwendern selbst kategorisiert und gezielt freigegeben werden können.
... mehr


Roboter unterstützt ältere Menschen bei Kommunikation
14.09.2010, Informationsdienst Wissenschaft
Wissenschaftler der Technischen Universität München (TUM) wollen den Helfer ALIAS (Adaptable Ambient Living ASsistant) so ausrüsten, dass er selbst komplexe Medien einfach nutzbar macht. Das Ziel: Auch wenn sie ans Haus gebunden sind, sollen ältere Menschen ihre sozialen Kontakte aufrechterhalten und so Isolation verhindern sowie kognitive Fähigkeiten trainieren können.
"Ruf meine Tochter an!" Vielleicht hat der ältere Mann die Nummer vergessen oder das Telefon verlegt, vielleicht ist er aber auch gestürzt und kann sich nicht selbst helfen. ALIAS wird das egal sein – er hilft in jedem Fall. Denn der Roboter versteht den Senior und stellt die Verbindung zur gewünschten Kontaktperson her. Heute ist ALIAS eine Figur mit Kopf, Rädern und PC. Damit er tatsächlich zur häuslichen Hilfskraft wird, werden ihn die TUM-Forscher in den nächsten Jahren mit Software und Bedienelementen ausrüsten.
ALIAS soll nicht nur Telefonanrufe ermöglichen. Auch in Chats und sozialen Netzwerken sollen sich die Nutzer bewegen können. Eine E-Card zu verschicken oder sich in einem Online-Spiel zu messen, wird ebenfalls kinderleicht sein. Und auf Zuruf liest ALIAS aus der Zeitung vor oder übersetzt aus anderen Sprachen. Möglich machen soll die einfache Bedienbarkeit unter anderem ein Spracherkennungssystem und ein Touch Screen mit großen Feldern.
... mehr


Kein weißer Fleck mehr - Internet im Auto für jedermann geplant
08.09.2010, LVZ online
Im Büro, daheim und sogar beim Spaziergang sind immer mehr Menschen online. Nur im Auto fehlt bislang der mobile Zugang zum Internet. Der Automobilzulieferer Continental und die Deutsche Telekom wollen diese Lücke nun mit dem Kommunikationsnetzwerk "AutoLinQ" schließen. Somit können Fahrzeuge über eine Mobilfunkverbindung überall mit dem Handy, dem heimischen Computer, Online-Datenbanken und Mehrwertdiensten im Stil der Apps vernetzt werden. Dabei sollen nicht nur Standard-Prozesse wie das E-Mailen während der Fahrt möglich sein. Wer die neusten Schlagzeilen hören möchte, hat dazu per Sprachsteuerung ebenfalls Gelegenheit. Somit könne die Fahrt zum Büro optimal genutzt werden, indem man zum Beispiel aktuelle Brancheninformationen abrufe, sagt Sten-Olaf Wilkening von Continental. Weiter ist die Online-Suche nach bestimmten Themen oder Begriffen ebenso das Ziel wie die Musikerkennung.
... mehr


Das Handy als Infopoint und Navigator
06.09.2010, Informationsdienst Wissenschaft
Im Rahmen des Forschungsprojektes "MIP – Mobile Information Point", das von der Technischen Universität Wien gemeinsam mit den großen österreichischen Verkehrsunternehmen, Mobilfunkunternehmen und anderen Partnern aus der Wirtschaft durchgeführt wird, wird daran geforscht, wie Fahrgäste in öffentlichen Verkehrsmitteln künftig Informationen neuartig, rasch und barrierefrei abrufen können. In den Bahnhöfen Krems und Baden bei Wien sind bereits intelligente, interaktive Poster (Vorstufen zu interaktiven Anzeigetafeln), sogenannte Mobile Information Points, angebracht. Ein MIP belädt bei aktiver Berührung mit dem Fahrgasthandy das Mobiltelefon mit den aktuellen lokalen Reiseinformationen. Derartige Informationen, etwa über die nächsten ankommenden und abfahrenden Züge und Busse, Echtzeitauskunft und die barrierefreie Abfrage, sind für Fahrgäste des Öffentlichen Verkehrs von hohem Wert.
... mehr


Neuer CRM-Navigator bildet Prozesse im Bereich Kundenmanagement ab
30.08.2010, Informationsdienst Wissenschaft
Wer im Dschungel von Kundeninteressen, Vorlieben und spezifischen Bedürfnissen die Orientierung bewahren will, braucht einen zuverlässigen Navigator, der bei der Optimierung der Beziehungen zwischen Unternehmen und Kunden hilft. "In zahlreichen Praxisprojekten und Unternehmenseinsätzen haben wir wiederholt festgestellt, dass Unternehmen daran scheitern, langfristig profitable Kundenbeziehungen herzustellen", berichtet Prof. Christian Gündling von der Jade Hochschule in Wilhelmshaven. Prof. Christian Gündling und sein wissenschaftlicher Mitarbeiter Rico Meiner vom Fachbereich Management, Information und Technologie arbeiten an der Software "CRM-Navigator". Dieser hilft kleinen und mittelständischen Unternehmen, Prozesse im Bereich Kundenmanagement abzubilden. Zudem gibt es Tools, um das eigene Unternehmen beispielsweise auf Schwächen und Stärken zu durchleuchten.
... mehr


Wie Mensch und Roboter kooperieren können: Ein neuer Ansatz zur Intentionserkennung
30.08.2010, golem.de
In vielen Lebensbereichen, von der industriellen Produktion bis zur Chirurgie, leisten Roboter unentbehrliche Dienste. Die Zahl der Einsatzmöglichkeiten steigt ständig. Wie kann die Zusammenarbeit von Menschen und Robotern weiter optimiert werden? Weltweit arbeiten Forschungsteams an Systemen, die Roboter in die Lage versetzen, die Absichten von Menschen möglichst frühzeitig und möglichst zuverlässig zu erkennen. Denn sobald Roboter zu einer solchen Intentionserkennung fähig sind, müssen sie nicht auf per Knopfdruck erteilte Befehle warten, um den Menschen zuarbeiten zu können. Sie sind dann imstande, gleichsam aus eigener Initiative dazu beizutragen, dass die Menschen die angestrebten Ziele erreichen.
... mehr


Start-up analysiert Netzwerktrends
27.08.2010, heise online
Immer mehr Firmen nutzen mittlerweile Social-Media-Angebote, um das Potenzial neuer Produkte oder Dienstleistungen abzuschätzen. Die Firma Viralheat bietet nun Echtzeitdaten an, die die Haltung der Nutzer zu bestimmten Themen oder Produkten darstellen. Einer der ersten Kunden des "Social Trends" genannten Dienstes ist der US-Sportsender ESPN: Er will die Technik nutzen, live zu ermitteln, wie die Nutzer gerade zu bestimmten Football-Teams stehen. Viralheats Algorithmen stammen aus dem Bereich des maschinellen Lernens und können natürliche Sprache analysieren. Für Social Trends durchsucht werden aktuell Twitter, Facebook-Fan-Seiten, Videoangebote, die sich auf virale Clips spezialisiert haben, sowie Googles Kurznachrichtendienst Buzz.
... mehr


Spracherkennungs-Apps für iPhone und iPad
27.07.2010, heise online
Mit Dragon Dictation von Nuance lassen sich Texte auf dem iPhone, iPod Touch und iPad diktieren. Der Anwender kann die Texte anschließend per Mail verschicken oder in die Zwischenablage einfügen, um sie in beliebigen Anwendungen weiter zu verwenden. Ebenso kann er den Inhalt direkt auf Facebook oder Twitter veröffentlichen.
Die App dient lediglich der Datenübermittlung. Die eigentliche Spracherkennung findet – wie bei Android-Telefonen – auf einem Server statt. Bei der Umsetzung der Audio-Daten auf dem Nuance-Server werden keine individuellen Sprecherprofile angelegt. Wie bei vergleichbaren Desktop-Anwendungen müssen Satzzeichen und Anweisungen wie "Neuer Absatz" beim Diktieren mitgesprochen werden, falls man auf ein grammatisch korrektes, gut lesbares Ergebnis Wert legt.
Dragon Search für iPhone und iPod Touch schickt diktierte Suchanfragen an diverse Suchmaschinen. Derzeit nutzt die Lösung Google, Yahoo!, Wikipedia, iTunes, YouTube und Twitter.
Laut Nuance werden beide Anwendungen vorübergehend kostenlos im deutschen App Store verfügbar sein. Wie lange es die Diktier-Apps gratis geben wird, steht nicht fest: Nuance nennt keinen konkreten Termin für eine kostenpflichtige Version, behält sich aber je nach Entwicklung des Geschäftsmodells Änderungen vor. Bereits heruntergeladene Apps sollen auf jeden Fall kostenfrei bleiben. Im Laufe des Jahres soll laut Hersteller eine achtsprachige Lösung von Dragon Dictation herauskommen.
... mehr


Windows Phone 7 mit Spracherkennung von TellMe
26.07.2010, winfuture
Microsofts neues Smartphone-Betriebssystem Windows Phone 7 wird mit einer weiteren Funktion daher kommen: Spracherkennung. Laut Microsoft-Spezialist Paul Thurrott basiert die Spracherkennung auf der Technologie von TellMe, die Microsoft im Jahr 2007 gekauft hatte. Sie unterstützt neben der reinen Spracherkennung auch bestimmte Kommandos, mit denen Anrufe gestartet, Musikstücke gewählt und lokale Suchanfragen durchgeführt werden können. Dem Vernehmen nach kann die Spracherkennung von jedem Punkt im Menü aus genutzt werden, wobei sie abgesehen von den Telefonfunktionen noch recht einfach umsetzt wurde. So lässt sich in den meisten Fällen nur jeweils eine Aktion per Sprache ausführen, bevor dann nach dem Start der gewünschten Anwendung wieder per Touch gearbeitet werden muss.
Um die Spracherkennung zu starten, muss der Anwender den Start-Button ungefähr zwei Sekunden lange gedrückt halten. Die Sprachsteuerung funktioniert auch bei der in Windows Phone 7 enthaltenen Bing-Suchanwendung. Bei ersten Tests funktionierte das Ganze laut Thurrott bereits sehr gut.
... mehr


The Label Finder: Der mobile Shoppingbegleiter
25.07.2010, Mobile Highlights
"The Label Finder" erkennt den Standort des Nutzers und zeigt ihm alle Shops in der Umgebung. Zudem bekommt er Informationen über die Labels, die in den jeweiligen Geschäften angeboten werden. Es kann auch direkt nach einer beliebigen Marke gesucht und eine Übersicht aller Läden, die Klamotten dieses Labels vertreiben, erstellt werden. Bei einem Klick auf den Standort bekommt man weitere Infos über Öffnungszeiten und eine kurze Beschreibung des Shops. Über die App kann direkt ein Kontakt mit dem jeweiligen Laden aufgebaut werden. Wer neue Labels entdecken möchte, bekommt über den Shuffle-Modus der Anwendung immer neue Marken mit ihrer Kurzbeschreibung angezeigt und kann dann nach Shops in der Nähe suchen. Die Anwendung der Alazar GmbH & Co. KG für iPhone, iPod Touch und iPad ist allerdings für das neue Betriebssystem iOS 4.0 konzipiert und steht in Apples App Store kostenlos zur Verfügung.
... mehr


Der Kugelschreiber mit Kamera und Mikrofon
22.07.2010, golem.de
Livescribes Echo Smartpen ist ein etwas füllig wirkender digitaler Kugelschreiber. Hauptzweck des Geräts ist es, Notizen zu machen - und zwar mit einer gewöhnlichen Kugelschreibermine. Das Besondere sind die vorn angebrachte Kamera, die das Geschriebene aufzeichnet, und das Mikrofon, das gleichzeitig den Ton aufzeichnet. Für Aufzeichnungen hat der getestete Stift 8 GByte Flash-Speicher. Mit dem Speicher sollen bis zu 800 Stunden Aufnahme möglich sein - mehr als genug für ein paar Wochen Vorlesungen an der Uni.
Der Clou ist die Möglichkeit, im Text zu navigieren. Schreibt der Nutzer etwa während einer Vorlesung mit, kann auch der Ton aufgezeichnet werden. Wer will, tippt dann kurz an die Stelle der Notizen, und der kleine Stift spielt den Ton ab, der genau zum Zeitpunkt des Schreibens aufgezeichnet wurde. Das ist vor allem bei schnell geschriebenen Notizen praktisch, die der Schreiber anschließend eventuell nicht mehr entziffern kann. Die unklare Stelle wird einfach angetippt, und schon hört der Nutzer, was der Vortragende zu dem Zeitpunkt gesagt hat, als er möglicherweise zu sehr mit dem Notieren beschäftigt war.
Die gesammelten Informationen, also der geschriebene Text und die Tonaufnahmen, können später mit dem Computer synchronisiert werden - als zusätzliches Backup der Zettelwirtschaft sozusagen. Auch auf dem Desktop lassen sich die Notizen samt Tonaufzeichnungen gut verfolgen.
... mehr


Ford zeigt erstes Twitter-Auto der Welt
21.07.2010, NeueNachricht
Ein innovatives Projekt des US-Autokonzerns Ford, der kürzlich das erste twitternde Auto der Welt vorgestellt hat, zeigt, dass sich die enorme Nachfrage nach Social-Media-Diensten wie Facebook oder Twitter auf die unterschiedlichsten Branchen auswirkt und die Hersteller in diesem Bereich bereits mit Hochdruck daran arbeiten, ihre Produkte für die moderne Internetgesellschaft interessanter zu gestalten.
"Es wird langsam dunkel, Zeit die Frontscheinwerfer einzuschalten", lautet eine typische Twitter-Meldung, die der von Ford präsentierte Prototyp an seine 588 Follower auf dem Community-Portal verschickt. Der Ford Fiesta, der vom US-Unternehmen liebevoll "AJ" getauft worden ist, soll den hauseigenen Ingenieuren als Testplattform dienen, um das Potenzial der Integration von Internettechnologien bei der Autokonstruktion auszuloten. Die Implementierung von Twitter ist dabei nur der erste Schritt, in Zukunft sollen weitere Services wie etwa Geolocation-Dienste folgen, die den jeweiligen Fahrer beispielsweise automatisch zu Online-Kontakten lotsen können.
... mehr


System gehorcht auf Fingerzeig – Softwaresteuerung durch Gesten
13.07.2010, Informationsdienst Wissenschaft
Fraunhofer FIT hat ein System zur berührungslosen Bedienung durch Gestenerkennung realisiert, das Hand- und Fingerstellungen des Benutzers in Echtzeit erkennt und in entsprechende Befehle übersetzt. Das System kommt ohne Spezialhandschuhe und Marker aus und ist obendrein Multi-Touch und Multi-User tauglich. Unter Multi-Touch versteht man in diesem Zusammenhang, dass mehrere Finger beider Hände gleichzeitig das Objekt "berühren" und durch Bewegungen oder Gesten manipulieren können. In unserem Falle Hand- und Fingergesten in der Luft, die das System erkennt und entsprechend interpretiert.
Im FIT-Prototyp werden in Echtzeit Hände und Finger der Benutzter in den Bilddaten einer 3D-Kamera erkannt und die Bewegungen mitverfolgt. Die 3D-Kamera arbeitet nach dem Laufzeitverfahren (TOF-Prinzip). Sie misst für jeden Bildpunkt, wie lange das Licht bis zum gefilmten Objekt und zurück benötigt, und ermittelt so die Distanz.
... mehr


Google will Parkplatzsuche in Großstädten vereinfachen
12.07.2010, golem.de
Mit einer speziellen Android-Software will Google die Suche nach freien Parkplätzen vor allem in Großstädten vereinfachen. Die Idee hinter Open Spot ist, dass sich Anwender gegenseitig informieren, wo es freie Parkplätze gibt. Autofahrer können mit einem Knopfdruck mitteilen, wenn sie einen Parkplatz freigeben. Aber sie können auch einen freien Parkplatz melden, den sie beim Vorbeilaufen bemerken. Die freien Parkplätze erscheinen dann bei anderen Open-Spot-Nutzern auf einer Karte im Umkreis von rund 1,5 km.
Der ehrgeizige Ansatz setzt voraus, dass möglichst viele Anwender den Dienst nutzen. Allerdings bleibt generell das Problem, dass der Parkplatz schon weg sein kann. Denn gerade in Gegenden mit nur wenigen Parkplätzen bleiben sie oftmals nur wenige Sekunden frei. Zur Größe der Parklücke macht die Software keine Angaben. Mit speziellen Mechanismen soll Open Spot falsch gemeldete Parkplätze erkennen und nicht anzeigen. Google machte allerdings keine Angaben dazu, wie solche Falschmeldungen erkannt werden können.
Open Spot ist vorerst nur für Smartphones verfügbar, auf denen mindestens Android 2.0 läuft. Die Software ist Bestandteil von Google Labs und befindet sich noch im Experimentierstadium. Der Dienst ist derzeit nur in den USA, in Kanada und den Niederlanden nutzbar. Ob die Software später für Deutschland angeboten wird, ist nicht bekannt.
... mehr


VoiceFlash-Premiere: Erste sprachgesteuerte Webanwendung in der Hotellerie
12.07.2010, Pressemitteilung WebService
Das MAVIDA Balance Hotel & Spa präsentiert sich künftig online mit einem interaktiven Video-Interface. Zum ersten Mal in der Hotellerie kommt darin VoiceFlash zum Einsatz. Mit der von .dotkomm rich media solutions und MATERNA Communications entwickelten Technologie steuert der Nutzer das gesamte Interface interaktiv mit seiner Stimme. Die Maus hat ausgedient, die Spracheingabe erfolgt über ein handelsübliches Headset oder das Notebook-Mikrofon. Auf der Startseite von www.mavida.at begrüßt Hotelinhaberin Ilona Hagleitner persönlich ihre Gäste. Sie tritt in direkten Dialog mit dem Besucher und führt ihn gezielt durch das Angebot des Hotels, das der Kunde per Spracheingabe ansteuern kann.
"In der Hotellerie ist es entscheidend, den Kunden emotional anzusprechen, um ihn vom Angebot zu überzeugen. Mittels VoiceFlash entsteht ein persönlicher und individueller Dialog, Grundvoraussetzung für eine sehr gute Conversion im Online-Kanal", so .dotkomm-Geschäftsführer Ralf Pispers.
... mehr


MIT-Forscher erfinden unsichtbare Maus
09.07.2010, heise online
Wenn es nach Wissenschaftlern am Media Lab der US-Hochschule MIT geht, kommt bald ein neues Eingabesystem für PCs auf den Markt: die unsichtbare Maus. Dabei handelt es sich um eine Kombination aus einem Infrarot-Laser und einer dafür passenden Kamera, die die Bewegungen der Hand des Nutzers aufzeichnet. Dabei bewegt man sein Greiforgan genauso, wie man das von gewöhnlichen Hardware-Nagern gewohnt wäre – nur dass dieser eben nicht mehr vorhanden ist. Schiebt man die Hand nach links, wandert der Mauszeiger nach links, schiebt man sie nach rechts, oben oder unten, folgt er auch diesen Bewegungen. Auch für das Klicken gibt es Gesten: Dazu muss man nur seinen sonst auf dem Tisch ruhenden Zeigefinger kurz heben und wieder absenken.
Noch ist das "Mouseless" genannte Projekt in einer frühen Phase. Projektleiter Pranav Mistry, Forschungsassistent und Doktorand am Media Lab, der vor seinem Gang ans MIT bei Microsoft an neuen Nutzerschnittstellen arbeitete, glaubt aber an eine schnelle praktische Umsetzung. Beim aktuellen Prototyp sitzt der Laser neben der Tastatur eines Laptops, die Kamera ist wiederum am Deckel montiert. Beides ist nicht besonders elegant, ließe sich aber sehr einfach miniaturisieren.
... mehr


Smartphone-Apps einfach selbst erstellen
09.07.2010, Informationsdienst Wissenschaft
Mit dem E-Composer von Fraunhofer ESK lassen sich mobile Applikationen erstellen ohne zu programmieren. Text, Audio und Video werden mit einem Baukastensystem individuell zu einer Anwendung zusammen gestellt. Dabei können die vom Handy erfassten Sensordaten, z.B. der jeweilige Standort, in die App einbezogen werden. Der E-Composer generiert die eigene Applikation wahlweise in Flash oder HTML 5 und macht sie damit automatisch für alle gängigen Smartphones kompatibel.
Smartphone-Apps sind keine Spielerei, sondern ein großes Potenzial für das mobile Marketing. Deshalb nutzen immer mehr Unternehmen die kleinen Helfer, sei es um die Kundenbindung zu stärken oder neue Kunden zu gewinnen. Die passende Applikation ist jedoch nicht immer verfügbar und die Anstellung eines Programmierers ist kostspielig. Mit dem E-Composer kann jeder seine eigene Applikation erstellen. Der Nutzer muss lediglich wissen, welche Inhalte die Apps enthalten und wie sie vermittelt werden sollen.
... mehr


Twitter-Nachrichten offline durchsuchen
29.06.2010, Futurezone
"Wir haben beobachtet, dass der Output von Twitter nur dann sinnvoll erscheint, wenn er später wieder nutzbar wird", so Martin Ebner, Abteilungsleiter für Vernetztes Lernen am Zentralen Informatikdienst der TU Graz. Als Beispiel hierfür nennt Ebner etwa Kurznachrichten, die auf Konferenzen verschickt werden. Diese würden nur dann einen Mehrwert erhalten, wenn man die Links, die man im Zuge dessen gesammelt hat, oder die Statements, die man sich notiert hat, erhalten bleiben. Mit Grabeeter wurde daher auf der TU Graz ein Dienst entwickelt, mit dem sich eigene Tweets und Nachrichten von einzelnen, bei Grabeeter registrierten Nutzern lokal speichern und offline durchsuchen lassen. Mittels Hashtags können zudem Ereignisse, Themen und Veranstaltungen gesucht, wiedergefunden und sortiert werden.
Grabeeter hat dazu auch einen speziellen Client in JavaFX implementiert, der plattformunabhängig läuft und im Hintergrund aktualisiert werden kann. Im Client lassen sich Nachrichten auch für einen bestimmten, begrenzten Zeitraum durchsuchen. Neben dem Client gibt es zudem ein Web-Interface, das für die Suche verwendet werden kann. Die Nachrichten können in XML und JSON exportiert werden.
... mehr


Automatisierte PC-Hilfe
28.06.2010, heise online
"Antifrustrations-Software" nennt Soluto das System, das Konflikte zwischen Computer-Hardware, Anwendungsprogrammen und Betriebssystem erkennt und dem User Problem-Lösungen bereitstellt. Hat der Benutzer beispielsweise Schwierigkeiten mit einer nur noch träge reagierenden Tabellenkalkulation, kann das System des Start-ups direkte Hilfestellungen geben. Es empfiehlt z.B., die leistungshungrige Aktualisierung der Virenschutzdatenbank, die ausgerechnet am arbeitsreichen Nachmittag abläuft, in den Abend zu verschieben.
Lösungen liefert das System dabei nicht nur über einen eigens entwickelten Entstör-Algorithmus, sondern schöpft auch aus einer Datenbank früherer Erfahrungen. Diese wurden auf den Rechnern anderer Nutzer gewonnen und gesammelt. Die Software kann dabei beispielsweise erkennen, welche Einstellung ein User vorgenommen hat, um ein bestimmtes Problem zu beheben und dann Empfehlungen auf den Rechnern anderer Nutzer mit ähnlichen "Krankheitsbildern" anzeigen. "Millionen PCs bei Millionen Nutzern leiden zwangsläufig unter ähnlichen Problemen. Wenn nur 10.000 Personen den gleichen Stress haben, finden wir Methoden, diese zu beheben", erläutert Gründer Tomer Dvir.
... mehr


Online-Lernsystem Babbel führt Spracherkennung ein
23.06.2010, ZDNet
Der Fremdsprachenlerndienst Babbel hat sein System um ein Spracherkennungs-Tool erweitert. Mit der Audio-Analyse können Nutzer ihre Aussprache testen. Das System erkennt Akzent, Betonung und Wortmelodie. Babbel-Nutzer können so ihre Aussprache trainieren, um sich auf Konversationen im Alltag vorzubereiten. Das Audio-Tool erkennt einzeln gesprochene Wörter und ganze Sätze. Der Nutzer erhält eine Bewertung auf einer Skala von 0 bis 100. Ab 50 Punkten ist die Aussprache "international gut verständlich". Mit dem Tool hebt sich Babbel nach eigenen Angaben von Konkurrenten wie Rosetta Stone und Tell Me More ab.
Babbel ist über den Internet-Browser, aber auch über mobile Applikationen und über PC-Software nutzbar. Die Spracherkennung funktioniert derzeit nur auf der Website. Für Neukunden gibt es einen kostenlosen Testzugang.
... mehr


Mensch gegen Maschine
18.06.2010, taz online
Das Fernsehquiz "Jeopardy" kann verflixt schwer sein: Die vom Moderator gestellten Fragen – eigentlich sind es Antworten, aus denen die Mitspieler Fragen machen müssen – enthalten nicht selten Wortspiele und kommen aus den unterschiedlichsten Wissensgebieten. Wer also bei der Sendung, die seit Jahrzehnten im US-Fernsehen läuft, bis zur letzten Runde bestehen will, braucht Intelligenz und Sprachverständnis.
Forscher beim IT-Konzern IBM hoffen nun, dass sie diese Eigenschaften auch einem Computersystem beibringen können. Der Großrechner namens "Watson" kombiniert eine riesige Wissensdatenbank mit Suchmaschinentechnik und Spracherkennung. Die Idee: Das System soll direkt gegen menschliche Gegner antreten und diese wenn möglich überflügeln. Die dabei gewonnenen Einblicke und Techniken aus dem Gebiet der künstlichen Intelligenz (KI) sollen dann wiederum eines Tages in ganz normale Produkte einfließen, um beispielsweise die Analyse großer Datenbestände zu erleichtern.
... mehr


Smartphone-App verbindet Fahrgäste und Taxifahrer
17.06.2010, heise online
Franz von Brandenstein will zum Retter aller Menschen werden, die vergeblich in den Straßen deutscher Großstädte nach einem Taxi Auschau halten. Der Geschäftsführer der Hamburger Talex GmbH hat eine Smartphone-Anwendung entwickeln lassen, die auf Knopfdruck alle freien in der Nähe verfügbaren Fahrzeuge kontaktieren kann. Bei der Anwendung "Taxibutton" haben sowohl die Fahrgäste als auch die Fahrer ein passendes Programm auf dem Handy. Untereinander verbunden werden sie mittels mobilem Internet, die Positionsangaben des Fahrgastes kommen per GPS.
Mittlerweile läuft die Technik im Regelbetrieb. Trotzdem kostet Taxibutton in der aktuellen Aufbauphase weder die Fahrgäste noch die Fahrer etwas. Mittelfristig sollen aber zumindest letztere zahlen: Geplant sind 33 Cent pro Bestellung, die sich entweder per Premium-SMS oder In-App-Payment, also direkt in der Applikation per Kreditkarte, begleichen lassen.
... mehr


Mobile Barcodes sollen das Einkaufsverhalten verändern
15.05.2010, derStandard.at
Mobile Barcodes sollen Produkte und andere Objekte wie Sehenswürdigkeiten via Handy mit Informationen ausstatten. Dem normalen Konsumenten bisher nur durch das "Biep" an der Kasse geläufig, sollen Barcodes nun Dank neuer mobiler Technologien, nämlich mit Hilfe der im Code enthaltenen Identifikationsnummer Informationen aufs Smartphone zaubern. Das können etwa bei einer Autoreklame technische Daten, aber auch das direkte Buchen einer Probefahrt sein. Bei Lebensmitteln beispielsweise können Herkunft und exakte Inhaltsstoffe abgerufen werden.
Derartige Anwendungen hat es schon gegeben - allerdings bemüht sich das Unternehmen GS1 Austria all dies zu standardisieren und miteinander zu verknüpfen: Einerseits sind das Smartphones mit Kamera und Internetzugang, dann die entsprechende Software, die auf diesen vielen verschiedenen Geräten laufen soll, sowie die Mobilen Anbieter, von denen die vier größten in Österreich für dieses Projekt bereits mit an Bord sind.
Nicht zuletzt sollen die Informationen nicht wie in sozialen Netzwerken von irgendwoher stammen, sondern "vertrauenswürdige Quellen" angezapft werden. Gregor Herzog von GS1: "Wir glauben, dass sich die Markenhersteller sehr rasch daran beteiligen werden."
... mehr


Bahn bietet Online-Ticket per MMS an
15.06.2010, heise online
Bei der Deutschen Bahn muss das Onlineticket künftig nicht mehr ausgedruckt werden, denn bei der Kontrolle werden ab sofort auch MMS auf dem Handydisplay als Fahrkarte akzeptiert. "Jetzt ist es möglich, sich die Fahrkarte bei einer Buchung im Internet auf bahn.de als MMS direkt auf das Mobiltelefon schicken zu lassen", gab die Bahn bekannt. "Statt des ausgedruckten Onlinetickets zeigt der Reisende dem Zugbegleiter die MMS auf seinem Handydisplay." Für diesen Service müssen die Kunden im Online-Angebot der Bahn registriert sein und sich mit ihren Zugangsdaten auf bahn.de anmelden. Fahrkarten können nun bis zu 10 Minuten vor Abfahrt des Zuges gekauft werden, bisher ging das nur beim Kauf via Handy.
Bahn-Sprecher Andreas Fuhrmann: "Wir arbeiten mit einem 2D-Barcode. Dieser befindet sich sowohl auf dem ausgedruckten Bahnticket, als auch in digitaler Version auf dem Handy als MMS. Erst vor kurzem haben wir das erweitert. Wir verwenden jetzt auch einen größeren Code bei Mobiltelefonen. Zuvor konnten wir dort nur sehr eingeschränkt Informationen unterbringen, weil die Handydisplays der limitierende Faktor waren." In den vergangenen Jahren habe sich die Technik weiterentwickelt. Displays hätten eine höhere Auflösung und könnten mehr darstellen, so Fuhrmann. "Entsprechend konnten wir den Code weiterentwickeln und mehr Informationen hineinpacken", sagte er.
Das Ticket wird parallel weiter als PDF per E-Mail versandt. Nutzer des MMS-Tickets können sich eine Testnachricht zusenden lassen, um zu prüfen, ob ihr Mobiltelefon multimediale Nachrichten darstellen kann. Das Onlineticket auf dem Notebookdisplay vorzuzeigen, ist für Reisende weiterhin nicht möglich. "Es muss immer die MMS oder der Ausdruck sein", sagte Fuhrmann.
... mehr


Google stellt Navigation und Sprachsuche vor
09.06.2010, golem.de
Google hat zwei neue Produkte zur mobilen Nutzung vorgestellt: Eine vollwertige Navigation mit Google Maps und die Voice Search.
Maps Navigation ist eine Offboard-Navigation, bei der die Karten nicht lokal gespeichert, sondern bei jeder Routenkalkulation heruntergeladen werden. Ziele kann der Anwender per Sprache oder Tastatur eingeben. Maps Navigation greift dabei auf die lokale Suche von Google zu: Gibt man beispielsweise "Arzt" ein, sucht Maps nach Ärzten in der Nähe und bietet sie als Ziel an. Es lassen sich aber auch Adressen aus der Kontakte-Liste oder aus Google Latitude als Ziel verwenden. Auf den Karten blendet Maps Navigation optional Verkehrsinformationen und interessante Punkte wie Parkhäuser oder Tankstellen ein. Die Verkehrsdaten stammen von kommerziellen Anbietern oder von Google-Maps-Nutzern. Google Maps Navigation Beta ist für Smartphones mit Android 1.6 verfügbar. Für andere mobile Betriebssysteme wird es die Google-Navigation vorerst nicht geben.
Nutzer von Smartphones sollen ihre Suchanfragen künftig nicht mehr umständlich eintippen, sondern einfach ins Telefon sprechen - die Voile Search ist jetzt auch für Deutsch erhältlich. Dank Cloud Computing will Google die notwendige Rechenleistung aufbringen, um Hintergrundgeräusche zu filtern und selbst Eingaben zu erkennen, die Begriffe in verschiedenen Sprachen enthalten. Die Google-Sprachsuche ist noch nicht auf Dialekte optimiert. Erkannte Suchanfragen werden an die Suchmaschine weitergeleitet. Falls der Nutzer die Ergebnisse nicht anklickt, erhält die Sprachsuche eine Rückmeldung, so dass sie aus den Fehlern lernen kann. Google speichert gesprochene Suchanfragen außerdem anonymisiert ab und wertet sie aus, um das System zu optimieren. Android-Systeme ab Version 1.6 erhalten die neue Funktion als Update, iPhone-Nutzer können die kostenlose Mobile App aus dem Appstore laden. Für Blackberry und Symbian stellt Google sie zum Download bereit.
... mehr


Intelligente Jacken helfen beim Stressabbau
06.06.2010, futurezone
Intelligente Kleidung könnte dem Träger in Zukunft emotionalen Beistand im Alltag leisten. Melden die Sensoren schlechte Laune, sollen Musik und Bilder den Gestressten aufmuntern. Ausgestattet mit Sensoren zur Überwachung des Gesundheitszustandes wie Körpertemperatur und Herz- und Atemfrequenz soll moderne Kleidung Rückschlüsse auf die emotionale Verfassung des Trägers ziehen können. Wird eine erhöhte emotionale Belastung festgestellt, wird der Gestresste mit ausgewählter Musik und Bildern sowie aufmunternden Worten, die über in der Kleidung eingebaute LE-Displays und Lautsprecher in der Kapuze ausgegeben werden, beruhigt. Die über die Sensoren gesammelten Daten werden mit einer Web-basierten Datenbank abgeglichen, die vorher mit allen relevanten Informationen des Trägers gespeist wurde. Die Internet-Verbindung erfolgt über ein mitgeführtes Smartphone. Entwickelt wurde die Kleidung von britischen Forschern im Rahmen des "Wearable Absence" Projekts. Bisher sind die Kleidungsstücke nur als Prototypen verfügbar.
... mehr


IBM SPSS Predictive Analytics stellt neues Social Media Mining Tool vor
01.06.2010, acquisa
Um die vielfältigen Informationen aus Social Media zu sammeln und analysieren zu können, hat IBM SPSS eine neue Software entwickelt. Die Lösung arbeitet mit sozialen Netzwerken und Blogs, funktioniert aber auch im Zusammenspiel mit großen unternehmensinternen Datenquellen.
Das Konzept: Durch den Einsatz des Tools lassen sich Textinhalte aus Dokumenten, E-Mails, Call-Center-Einträgen und vor allem Social Media wie Blogs, Twitter oder Facebook sammeln und miteinander verbinden. Unternehmen können auf Basis der gesammelten Informationen fundierte unternehmerische Entscheidungen treffen. Vor allem die Meinung und Wünsche der Kunden über Produkte und Unternehmen sind aufgrund der Vielzahl der Social Media-Kanäle nur schwer überschaubar. Mit dem neuen Tool sollen Unternehmen einen umfassenden Einblick in das Denken ihrer Kunden erhalten können, um strategische Entscheidungen in Marketing oder Vertrieb auf Basis der gewonnen Erkenntnisse zu entwickeln.
Die Data-Mining- und Textanalysesoftware soll es ermöglichen, Veränderungen in den Einstellungen und Meinungen von Konsumenten und Angestellten zu erkennen und aussagekräftige Daten zu erhalten. Darauf aufbauend können passende Aktionen zum Beispiel zur Kundengewinnung und -bindung erarbeitet werden.
... mehr


Ablenkungsfreies Schreiben auf dem iPad
01.06.2010, golem.de
Der Mac-Texteditor myTexts von moApps ermöglicht dem Autor durch ein ausgeblendetes Benutzerinterface die volle Konzentration auf den Text. Die Anwendung besitzt zwei verschiedene Modi. Einer davon zeigt ein Interface mit einem simulierten Papierstück und einer Schreibunterlage. Der andere Modus zeigt in einer Vollbildansicht lediglich den eingetippten Text. Zu den Texten können separate Notizen angelegt werden. Die Mac-OS-X-Variante von myTexts kann die vom iPad exportierten Texte lesen und bearbeiten. Damit die Texte auch unter Windows weiterverarbeitet werden können, steht auch eine Text-Exportfunktion zur Verfügung. Die iPad-Version von myTexts kostet 2,39 Euro und enthält derzeit die Lizenz für die Desktopvariante, die normalerweise einzeln 14 Euro kostet.
... mehr


Roboter teilen Wissen
31.05.2010, heise online
Roboter sollen den Menschen schon in wenigen Jahren im Haushalt zur Hand gehen, Pflege- und Serviceautomaten in Krankenhäusern oder Altenheimen aushelfen. Das Problem: Die meisten dieser personenkompatiblen Systeme müssen trotz ausgeklügelter Algorithmen zur Situations- und Umgebungserkennung für viele Aufgaben stets neu programmiert werden. Hinzu kommt, dass selbst Orte, die sich nur leicht unterscheiden, jedes Mal neu erfasst werden müssen. Das Projekt "Robo Earth", an dem Philips Applied Technologies, die ETH Zürich, die TUs München und Eindhoven sowie die Universitäten Stuttgart und Zaragoza beteiligt sind, will die Adaption von Haushalts- und Pflegerobotern nun mit einer speziellen Informationsbibliothek beschleunigen. Als eine Art "Wikipedia für Roboter" soll die neue Datenbank Prozesse erfassen, Umgebungen speichern und Abläufe vorhalten, die eines der am Projekt beteiligten Robotersysteme bereits perfekt beherrscht. Der Datenaustausch erfolgt über das Internet und allgemeingültige Schnittstellen.
... mehr


Optische Sensoren erkennen Sonnenstand und Fahrergesten im Auto
29.05.2010, heise online
Die optischen Sensoren von Elmos erkennen den Sonnenstand an der Windschutzscheibe und die Gesten des Fahrers beim Bedienen von Radio oder Navi. Beides kann die Sicherheit im Auto erhöhen.
Die fortlaufenden Informationen über den Sonnenstand beziehungsweise den Lichteinfall an der Frontscheibe würden dazu genutzt, die Darstellung auf den Instrumententafeln im Auto so anzupassen, dass sie jederzeit gut ablesbar sind, erklärte Stefan Lenz von Elmos. Die Firma entwickelt die Sensorik und Auswertung für solche Licht- und Winkelmessung.
Ähnliches gilt auch für die Halios-Sensoren zur Erfassung von Gesten. Über einer Art Touchpad ohne Touch wird hier ein IR-Feld aufgebaut, in dem etwaige Störungen aus Entfernungen von wenigen Millimetern bis etwa drei Metern erkannt und zur Auswertung an einen Controller geleitet werden. Wischt der Fahrer mit einer Hand durch dieses unsichtbare Feld, könnte beispielsweise der Radiosender wechseln. Eine Sichtbeziehung zum Gerät sei dabei überflüssig, erläuterte Lenz. Dies erhöhe die Fahrsicherheit erheblich. Laut Lenz wird die Sensorik im kommenden Jahr bereits in Fahrzeugen zum Einsatz kommen – welche Autos dies sein werden, verriet der General Manager nicht.
... mehr


Einkaufen mit Avataren
25.05.2010, Deutschlandradio Kultur
Kundeninformationen und Dienstleistungen werden zunehmend von elektronischen Systemen übernommen. Doch wir sind es gewohnt, einen persönlichen Ansprechpartner zu haben. Das könnten in Zukunft intelligente Avatare - virtuelle Gesprächspartner - übernehmen, die mit Mimik und künstlicher Sprachtechnologie die Kommunikation zwischen dem Kunden und Verkäufer verbessern sollen.
"Guten Tag und willkommen! Lassen Sie mich zeigen, was wir alles erledigen können!", so grüßt eine junge Frau von einem Bildschirm, der in den Kühlschrank einer Modellküche eingelassen ist. Die virtuelle Gesprächspartnerin ist Teil eines Forschungsprojektes des Deutschen Forschungszentrums für Künstliche Intelligenz in Saarbrücken mit dem Kölner Unternehmen Charamel. Alexander Reinike koordiniert dieses Projekt "Interaktive Avatar Kommunikations-Technologie", kurz INTAKT: "Viele Menschen haben ein Problem, mit der Maschine zu sprechen. Sobald man einen visuellen Ansprechpartner gegenüberstellt, fällt diese Kommunikation viel einfacher, die Hemmschwelle sinkt."
Anders als ihre Sprache ist ihre Gestik und Mimik schon recht flüssig. Ob die noch etwas hölzern wirkenden Avatare schon mehr sind als technisch mögliche Spielerei und wirklich schon Berührungsängste zwischen Menschen und Maschinen abbauen können, darf noch bezweifelt werden.
... mehr


Software erkennt Sarkasmus
20.05.2010, golem.de
Rhetorische Stilformen wie Ironie oder Sarkasmus bleiben oft unerkannt - in geschriebener Sprache noch mehr als in gesprochener. Dennoch greifen viele Autoren, gerade im Internet, gern zum Sarkasmus. Damit dieses Stilmittel künftig nicht mehr verborgen bleibt, haben die Informatiker Oren Tsur, Dmitry Davidov und Ari Rappoport von der Hebräischen Universität in Jerusalem einen Sarkasmus-Detektor entwickelt. Semi-supervised Algorithm for Sarcasm Identification, kurz Sasi, sei in der Lage sarkastische Sätze mit einer Treffergenauigkeit von 77 Prozent zu erkennen. Nach einer Lernphase analysierte Sasi 66.000 Amazon-Rezensionen auf sarkastische Äußerungen. Ein Team aus 15 Menschen mit unterschiedlichem kulturellem Hintergrund beurteilte dann die Ergebnisse. Danach lag Sasi in 77 Prozent der Fälle richtig.
Die Sarkasmuserkennung könne zur Verbesserung von Besprechungen und Bewertungssystemen beitragen, schreiben Tsur, Dmitry und Rappoport. Sie wollen ihre Erkenntnisse auf einer Konferenz über Blogs und soziale Medien vorstellen.
... mehr


Hybridauto Volt bekommt Google Maps
18.05.2010, Chromoid
GM arbeitet mit Google zusammen, um das kommende Range-Extender-Fahrzeug mit Elektroantrieb, das weitgehend baugleich in Deutschland als Opel Ampera vorfahren wird, mit Android-Features und Google-Diensten zu erweitern. Besitzer von Chevrolet Volt werden unter anderem den Standort ihres Fahrzeugs über ihr Android-Smartphone verfolgen können. Die Spracherkennung ihrer Mobiltelefone soll ihnen außerdem erlauben, Navigation über Google Maps abzurufen, die das bordeigene OnStar-System mit gesprochenen Richtungsanweisungen ausgibt. Der Autohersteller sieht darüber hinaus mit Anwendungen auch für iPhone und Blackberry vor, dass Volt-Fahrer per Mobiltelefon den Ladezustand überwachen und das Nachladen veranlassen können.
... mehr


iConji - Piktogramme für barrierefreie Kommunikation
15.05.2010, golem.de
Mit iConji sollen künftig Benutzer in aller Welt auch ohne Übersetzer kommunizieren können. Mit Piktogrammen aus der neuen Bildersprache können Anwender Sätze bilden, die über Sprachbarrieren hinaus verständlich sein sollen. Die Bildersprache ist offen und kann durch Anwender mit neuen Symbolen erweitert werden. Die Piktogramme erhöhen auch die Eingabegeschwindigkeit gegenüber traditionellen Textnachrichten, denn mit der Bildersprache reduziert sich unter Umständen auch der Inhalt eines Satzes. Zusätzlich können einzelne Symbole noch mit Texten und Zahlen ergänzt werden, etwa um bei einer Einladung zum Tee auch den Treffpunkt angeben zu können.
... mehr


Stumme telefonieren mit Gesichtsbewegungen per Computer
14.05.2010, Teletarif
Das Gesicht des Probanden ist in Bewegung. Er spricht, aber kein Laut dringt aus seinem Mund. Verstanden und übersetzt wird seine Botschaft dennoch. Und zwar von einem Computer. Mit einer neuen Technologie wollen Forscher am Karlsruher Institut für Technologie (KIT) das Telefonieren ohne den Einsatz der Stimme ermöglichen. Die neue Technik könnte insbesondere von Menschen mit Sprachbehinderungen genutzt werden.
Bei dem Verfahren werden die Gesichtsbewegungen während der stummen Konversation vom Computer erfasst, interpretiert und übersetzt. "Wenn wir sprechen, ziehen sich sämtliche Gesichtsmuskeln auseinander und wieder zusammen", erklärt die leitende Wissenschaftlerin Tanja Schultz das Prinzip der Technik. Je nachdem wie sich Zunge, Lippe und die Kiefer bewegten, ließen sich einzelne Worte mit Hilfe des Computers analysieren. Tatsächlich übersetzt die Maschine während des Praxistests die Lippenbewegungen und erkennt das "Hallo", das der Proband lautlos von sich gegeben hat.
... mehr


Spezialsuchmaschine hilft bei Übersetzungen
11.05.2010, golem.de
Linguee sucht nach Texten im Internet, die von Menschen übersetzt wurden. Dadurch liefert die Suchmaschine bessere Ergebnisse als herkömmliche Übersetzungsdienste. Der Dienst findet einzelne Wörter, Wortkombinationen oder Satzteile. Wie bei der Betaversion vor einem Jahr wird allerdings weiterhin nur die Sprachrichtung Englisch-Deutsch und Deutsch-Englisch unterstützt, allerdings wurde die Übersetzung weiter optimiert. Im Juli 2010 sollen die Sprachversionen Englisch-Spanisch, Englisch-Französisch und Englisch-Portugiesisch integriert werden. Mit der finalen Version allerdings erscheinen die Suchergebnisse übersichtlicher als bisher. So versucht die Suchmaschine gute Übersetzungen zu erkennen und nach oben in der Trefferliste zu setzen. Das Ergebnis zeigt das Suchwort innerhalb einer übersetzten Textpassage. Damit sollen sich unbekannte Wörter besser im richtigen Zusammenhang übersetzen lassen.
... mehr


Echtzeitübertragung: Sportics.net verbindet Sport und Internet
10.05.2010, Online-Artikel.de
Die Sportplattform Sportics.net verbindet die Möglichkeiten moderner Netzwerke und Technologien mit der realen Sportwelt. Sportics erlaubt Sportbegeisterten nicht nur die Übertragung von Leistungsdaten beliebiger Geräte nach dem Sport. Vielmehr können Mitglieder seit Mai 2009 auf sportics.net ihre Leistungsdaten sowohl nach dem Sport als auch in Echtzeit - während des Sports - direkt aus dem Sportcomputer, Ergometer, Fitnessstudio, vom Handy aus oder auch manuell auf die Plattform übertragen, sich live per Web oder mobil auf dem Handy verfolgen, motivieren und Leistungen kontrollieren lassen. Ergo stehen Sportlern, Freunden, Trainern oder auch Gegnern die Sportdaten jederzeit und überall zur Verfügung. Aus diesen können nun, je nach Bedarf, Leistungs-Rankings oder eigene Sport- und Fitnesstagebücher mit persönlichen Trainingsergebnissen erstellt, ausgetauscht und ausgewertet werden.
... mehr


i-You Chinesisch - App des DFKI Spin-off Yocoy
29.04.2010, Informationsdienst Wissenschaft
Als Ausgründung aus dem DFKI-Forschungsbereich Sprachtechnologie unterstützt Yocoy mit seiner neuen App "i-You Chinesisch" die deutschen Besucher und die chinesischen Gastgeber der EXPO 2010 in Shanghai. i-You ist ein multilinguales Kommunikationswerkzeug und hilft in nahezu allen Dialogsituationen: am Flughafen, im Hotel, im Taxi, beim Smalltalk, selbst beim Feilschen im Geschäft, aber auch in Notfallsituationen. Ein gewählter Satz oder ein um nutzerspezifische Informationen ergänzter Lückentext wird übersetzt und synthetisiertes Chinesisch über den Lautsprecher des iPhones oder des iPodTouch ausgegeben. Im Anschluss kann der chinesische Gesprächspartner seine Antwort aus einer Fülle von situationsangepassten Alternativen auswählen, die dann für den deutschen Gast ins Deutsche übersetzt werden. Ist die Benennung bestimmter Waren, Gerichte, Gebäude oder Schriftzeichen unbekannt, können auch Fotos als Anschauungsmaterial in eine Frage eingebunden werden.
Die Anwendung belegt den funktionierenden Transfer von Forschungsergebnissen, ist verwendbar mit iPhone oder iPodTouch und voll funktionsfähig auch ohne Internetanbindung.
... mehr


Flughafen Frankfurt mit neuem Service fürs mobile Internet
28.04.2010, dsl Magazin
Einen neuen Service bietet Flughafenbetreiber Fraport seinen Kunden: Wer mobiles Internet nutzt - vom einfachen internetfähigen Handy bis hin zum Smartphone - kann nun verschiedene Flugdaten abrufen. Für die Nutzung des neuen Serviceangebots ist keine Installation eines Anwendungsprogramms erforderlich. Die Darstellung ist der geringen Monitorgröße angepasst und verzichtet daher auf überflüssige grafische Elemente. Der mobile Service bietet die Suche nach Zielflughafen, Flugnummer oder Uhrzeit. Auch über die normale Homepage frankfurt-airport.de wird man automatisch zur mobilen Flugdatensuche weitergeleitet. Eine Detailansicht mit allen Informationen zum gesuchten Flug komplettiert das neue Angebot.
... mehr


Alterian bietet seine Social Media Monitoring-Services jetzt auch auf arabisch an
26.04.2010, Wort+Welt
Mit SM2 steht weltweit erstmalig eine SMM-Technologie zur Verfügung, mit der sich die bisher nicht übergreifend analysierbare arabische Social Web-Welt endlich umfassend monitoren lässt - dank richtungsweisender Sprachtechnologie gleichzeitig für über 30 arabische Nationen. In Zusammenarbeit mit SocialEyez, den Social Web-Spezialisten des führenden Media-Monitoring-Anbieters im Mittleren Osten, Media Watch Middle East, ist es gelungen, die an Varianten so reiche arabische Sprache sowie alle relevanten arabischen Social Media in das Wirkspektrum von Alterians Social Media Monitoring-Dienstes SM2 zu integrieren. Damit können nun endlich übergreifende Analysen und Reportings aus der online-Kommunikation im aufgrund der hohen Versatilität der Sprache für Software-Lösungen bisher weitestgehend unzugänglichen Arabischen Raum generiert werden. 
... mehr


Bei Anruf Job
24.04.2010, Welt online
Auf dem Weg ins Büro einen neuen Job finden - das ist ab sofort möglich: Konzerne wie Daimler, Bayer oder Deutsche Bank informieren nämlich seit Kurzem auch drahtlos über offene Stellen: Sie haben über ihre gemeinsame Plattform Jobstairs eine eigene App für das iPhone herausgebracht, die aktuelle Vakanzen anzeigt. Auf Wunsch blendet das kostenlose Miniprogramm sogar eine Landkarte ein, auf der die potenziellen Arbeitsorte markiert sind. Nur eine technische Spielerei? Nein, sagen Experten. Per Handy zum neuen Arbeitgeber - das wird in wenigen Jahren auf dem ganzen Arbeitsmarkt an der Tagesordnung sein. "Das Interesse am so genannten Mobile Recruiting ist riesig", bestätigt Wolfang Jäger, Professor an der Hochschule RheinMain, Wiesbaden. Er hat in einer Umfrage ermittelt, dass 89 Prozent aller Unternehmen künftig mit dem Bewerber über mobile Geräte in Kontakt treten wollen.
... mehr


Spracherkennung bei Google Maps
22.04.2010, SpeechTechMag
Google hat eine neue Version von Google Maps veröffentlicht, die Windows Mobile- und Symbian S60-Handy-Nutzern die Suche via Spracherkennung ermöglicht. Für BlackBerry und Android-Smartphones gibt es diese Möglichkeit schon länger, für Apple's iPhone allerdings steht sie noch immer nicht zur Verfügung. "We understand that typing on phones isn’t as easy or fast as talking into them," schreiben die Entwickler Yuliang Wang und Yifei Zhang vom Google Mobile Team in einem Blog Post auf der Google Website. "As a result, we're big fans of letting you search in Google Maps for Mobile in the most natural way possible - with your voice."
... mehr


Plantronics und WorkSnug präsentieren iPhone-Applikation für Nomadic Worker
13.04.2010, offenes Presseportal
Geschäftsreisende kennen das Problem: Wer in einer fremden Stadt ankommt, verbringt zunächst einmal kostbare Zeit mit der Suche nach einem geeigneten Ort, an dem sich der Laptop aufschlagen und in Ruhe arbeiten lässt. Wo gibt es Strom, kostenloses W-Lan, eine erträgliche Geräuschkulisse und nach Möglichkeit noch einen leckeren Kaffee? Um den „Nomadic Worker“ des 21. Jahrhunderts bei der Suche nach geeigneten Arbeitsorten im urbanen Umfeld zu unterstützen, hat das Londoner Mobile-Startup WorkSnug mit Unterstützung von Plantronics eine kostenlose iPhone-Applikation entwickelt. „WorkSnug“ spielt nach dem Prinzip der Augmented Reality Informationen direkt in das Echtzeit-Kamerabild des iPhone und leitet mobile Anwender so zum nächsten geeigneten Workspace.
... mehr


Siemens: Auf dem Weg zum „speech-enabled“ KIS
13.04.2010, Healthtechwire
Eine tiefe Integration der Spracherkennung ins Krankenhausinformationssystem (KIS) ist unverzichtbar, wenn sich Sprache als Eingabemedium für die klinische Dokumentation durchsetzen soll. Für Christoph Nahrstedt von der Siemens AG Healthcare Sector ist diese Integration keine Einbahnstraße, sondern ein wechselseitiger Prozess. Eine sinnvolle „Integration 2.0“ der Spracherkennung ins KIS müsse den heterogenen Anwendern möglichst viel Funktionalität bieten, damit diese ihre individuellen Dokumentationsstile nicht aufgeben müssen. In Nahrstedts Vision einer „Integration 2.0“ stehen der gesamte Inhalt sowie auch die Strukturinformation klinischer Dokumente für die Spracherkennung zur Verfügung. Damit würde es dann problemlos möglich, Teile eines Dokuments zu unterschiedlichen Zeitpunkten zu diktieren, schon eingefügte Informationen zu übersprechen oder Dokumente an beliebiger Stelle zu ergänzen. Erst das sei dann eine tiefe Integration, die diesen Namen auch verdient.
... mehr


Chordiant optimiert Outbound-Kundeninteraktion für seine Customer Experience-Lösungen
12.04.2010, Pressebox
Chordiant, Anbieter für Customer Experience Software und Services, bietet ab sofort seine neue Software Chordiant Cx Outbound an. Die neue Lösung erweitert die bereits bestehende Inbound-Kommunikation um die Outbound-Komponente. Das Produkt bietet den Unternehmen eine Reihe von Kundenstrategien, in denen der jeweils nächste geeignete Schritt für die Kundeninteraktion systematisch ermittelt wird, unabhängig vom Kommunikationskanal. Dadurch können Unternehmen ihren Kunden eine konsistente Ansprache und Interaktion bieten, die den Customer Lifetime Value deutlich steigert. Somit bietet es personalisierte Interaktionsstrategien, mit denen Unternehmen auf jedes individuelle Kundenbedürfnis eingehen können.
... mehr


Schweizer Sprachtechnologie im Google-Handy
12.04.2010, Basler Zeitung digital
Mensch und Maschine kommunizieren auf unterschiedlichen Wegen. Svox setzt ganz auf die Sprache. Im Jahr 2000 als Spin-off der ETH gegründet, entwickelten die Sprachforscher anfänglich Systeme zur Sprachausgabe. Heute gehört auch die Spracherkennung und -steuerung zum Repertoire. Auch Google setzt auf Technologie von Svox. Sie stellt auf Mobiltelefonen mit dem Android-Betriebssystem eine Sprachsteuerung bereit. Handys mit der Android 2.1, namentlich das Nexus One (siehe TA vom 8. März), gehorchen aufs Wort. Per Sprache lässt sich erfragen, wann der nächste Termin ansteht und wie viele neue Mails eingetroffen sind. Auch die Antwort erfolgt selbstverständlich sprechenderweise.
... mehr


Amazon startet Benachrichtigungsdienst SNS
07.04.2010, golem.de
Der neue Cloud-Dienst Amazon Simple Notification erlaubt es, Benachrichtigungen zu versenden. Dazu stellt Amazon eine flexible und skalierbare Plattform bereit, die wie gewohnt nutzungsabhängig bezahlt wird. Neue Nachrichten werden dem Dienst per API übergeben und dann per HTTP oder E-Mail verteilt. Anwendungen für den Dienst sieht Amazon beispielsweise im Bereich Monitoring/Überwachung, bei Workflowsystemen, zeitkritischen Informationen und mobilen Anwendungen.
... mehr


Tübinger Informatiker entwickeln bequemes und sicheres Einloggverfahren
29.03.2010, Informationsdienst Wissenschaft
Viele Internetnutzer kennen das Problem, dass man die vielen Passwörter und Benutzernamen für seine Online-Accounts vergisst oder verwechselt. Dr. Bernd Borchert vom Wilhelm-Schickard-Institut für Informatik der Universität Tübingen hat zusammen mit Studierenden ein neues Verfahren entwickelt, das dem Benutzer nicht nur das Merken dieser Daten erspart, sondern auch das Eintippen. Mit dem neuen Verfahren wird zugleich ein Problem gelöst, das viele Internetnutzer verdrängen: Ihre Dauer-Passwörter für Online-Accounts können durch Trojaner auf dem Eingaberechner abgehört und für kriminelle Zwecke missbraucht werden. Alles was der Benutzer braucht ist ein internetfähiges Fotohandy. Für jeden Online-Account ist zunächst ein Initialisierungsschritt nötig. Wenn sich der Benutzer dann in seinen Account einloggen will, geht er auf die Webseite des Account-Anbieters. Dort wird ein zweidimensionaler Code angezeigt, eine Art schwarz-weißes Strukturbild, das mit dem Fotohandy abfotografiert wird. Das Handy verarbeitet die gelesenen Daten und kontaktiert anschließend den Account-Server. Nach Prüfung der Daten setzt sich der Server mit dem Browserfenster auf dem Bildschirm des Benutzers in Verbindung und schaltet dort den Account frei.
... mehr


Voxeo veröffentlicht Cloud Communications API mit Twitter Support
25.03.2010, TMC
Voxeo hat den weltweiten Start seiner Cloud Kommunikationsschnittstelle Tropo bekannt gegeben. Tropo unterstützt nun die Kommunikation über Twitter, SMS, IM/Chat und Sprache von überall mit allen Anwendungen. Tropo bietet Cloud-basierte Telefoniedienste, die es Entwicklern ermöglichen, Sprachanwendungen in bekannten Programmiersprachen wie Groovy, JavaScript, PHP, Python und Ruby zu schreiben. Dieser Ansatz erweitert die bis dato verfügbaren XML-zentrierten Optionen, die in der Vergangenheit die einzige Möglichkeit für cloud-basierte Telefondienste waren. Tropo-Anwendungen können einfach und schnell in den unterstützten Sprachen erstellt werden - ohne dabei in XML-Formate übersetzt werden zu müssen. Anwendungen, die auf Tropo entwickelt werden, können Anrufe über traditionelle Festnetzanschlüsse, Mobiltelefone, Nebenstellenanlagen und neuere IP-basierte Lösungen wie SIP und Skype beantworten und initiieren. Tropo ist nicht nur Open Source, sondern basiert auch vollständig auf offenen Standards wie SIP, Java SIP Servelets und dem IETF Media Resource Control Protocol (MRCP).
... mehr


Neue Apple-Patente: iGroups und Text-to-Speech
23.03.2010, Online PC
Bereits im November 2009 hat Apple ein Patent beantragt, dass eine Möglichkeit beschreibt, kurze Textnachrichten von einem iPhone zum anderen zu senden, ohne dass der Datenkanal von SMS oder ein Backend-Server benötigt würde, der eine Sendung bis zum Abruf zwischenspeichert. Dabei werden kurze Textschnipsel (etwa eine Telefonnummer) in gesprochene Sprache umgewandelt und über die normale Audio-Verbindung des Telefons verschickt. Beim Empfänger kommt die Nachricht dann als normaler Anruf an, der bei Nichterreichbarkeit auf der Sprachbox landet. Ein weiterer Patentantrag beschreibt eine "Social App" namens "iGroups". Dabei soll es sich um ein Soziales Netzwerk wie etwa Twitter oder Facebook handeln, das die GPS-Funktionalität des iPhones ausnutzt, um zum Beispiel Freunde und Bekannte in der Nähe des eigenen Standorts zu zeigen.
... mehr


HP bringt neue Services für Unified Communication and Collaboration
23.03.2010, marketing Börse
HP hat sein Service-Portfolio im Bereich Unified Communications & Collaboration (UCC) um Angebote erweitert, die Kunden dabei helfen, ihre Kommunikationssysteme zu vereinfachen und zu integrieren. Darüber hinaus hat HP sein UCC-Portfolio durch Kooperationen mit Polycom und NET (Network Equipment Technologies) erweitert. Die HP Polycom Services für Sprach- und Bildkommunikationslösungen vereinfachen Kommunikationssysteme und beschleunigen die Zusammenarbeit mit Kunden und Partnern. Dazu gehören Polycoms integrierte Sprach- und Videolösungen für UC-Umgebungen von Avaya und Microsoft sowie ein erweitertes Portfolio an VoIP-Telefonen für den Microsoft Office Communications Server "Wave 14". HP integriert die Schnittstelle NET VX Series UC in die UCC-Lösungen von HP und Microsoft. Das vereinfacht das Management und optimiert die Kommunikationssysteme für Messaging, Video- und Sprachübertragung. "Nur ein ganzheitlicher Ansatz, ausgerichtet an Geschäftsanforderungen und bereits vorhandenen Technologien, kann die Produktivitätsversprechen von UCC einlösen", sagt Ralf Kiwitzki, Leiter der Network Solutions Group bei HP Deutschland. "Durch unsere umfassenden Beratungsdienstleistungen kann HP den Kunden dabei helfen, aus der unüberschaubaren Menge an Angeboten diejenige Lösung herauszufiltern und zu konfigurieren, die ihnen den bestmöglichen Geschäftsnutzen bietet."
... mehr


Neuer Audi A8 mit Sprachsteuerung von Nuance
19.03.2010, SpeechTechMag
Das Multimedia Interface (MMI) im neuen Audi A8 bietet neben der Einbindung von Google Earth in die Navigation auch eine ausgefeilte Sprachsteuerung von Nuance. Drei Features hebt Nuance dabei heraus: One-Shot Destination Entry heißt, man kann die vollständige Adresse des Ziels ansagen, etwa "Berlin, Winsstraße 62". Auch im Adressbuch hinterlegte Adressen lassen sich ganz einfach aufrufen: "Navigiere zur Privatadresse von Volker Müller" sucht die passende Adresse und das Navi berechnet die Route. Die Musiksuche soll ebenso intuitiv funktionieren. Man kann die Audioquelle (CD-, MP3-, DVD-Player oder Radio) steuern und einfach Titel, Interpret und/oder Album angeben, etwa: "Spiele Titel Chasing Cars" - wobei das System ohne Probleme deutsche oder englische Titel erkennt. Und auch Adressbuch und Telefon lassen sich bequem und einfach steuern. Rufnummern kann man ohne Unterbrechung ansagen und das System erkennt diese fehlerfrei. 2000 Kontakte lassen sich speichern, 50 Namensfavoriten kann man festlegen, bei denen man dann allein mit dem Namen ein Telefonat starten kann. Die Sprachsteuerung trägt einen großen Teil zur Fahrsicherheit bei. Die Hände können am Steuer bleiben. Die wichtigsten Funktionen aktiviert man per Sprache.
... mehr


Wissenschaftler wollen das Sprachenlernen vereinfachen
15.03.2010, Informationsdienst Wissenschaft
Das zwei Millionen Euro teure Projekt mit dem Titel Allegro (Adaptive Language Learning technology for the Greater Region) wird mit einer Million Euro aus EU-Mitteln bezuschusst. Neben der Saar-Uni sind das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI), die Supélec Metz sowie das Inria Nancy beteiligt. Koordinator ist Manfred Pinkal, Professor für Computerlinguistik an der Saar-Uni.
Im Projekt Allegro entwickeln die Wissenschaftler über drei Jahre interaktive Sprachlern-Werkzeuge für Deutsch und Französisch. So soll es Sprachschülern möglich sein, mit dem Computer natürliche Dialoge zu Übungszwecken wie mit einem menschlichen Partner zu führen. Die Sprachschüler sollen aus verschiedenen Alltagsszenarien wählen können, die in einem Gastland relevant sind, zum Beipiel ein Telefonat führen, ein Gespräch an der Hotelrezeption und die Frage nach dem Weg.
... mehr


Das Spielzeug von morgen und übermorgen
13.03.2010, heise online
Auf der Game Developers Conference in San Francisco präsentierte Sony Computer Entertainment seine im Herbst auf den Markt kommende Bewegungssteuerung. Um eine genaue Ortung im Raum zu ermöglichen, hat Sony in die Move-Fernbedienung einen mit einem Gyroskop kombinierten Beschleunigungssensor eingebaut, der Bewegungen in alle Richtungen und Drehungen um alle Achsen erfasst. Die PS3-Eye-Kamera filmt die Fernbedienung, und eine Software errechnet anhand der Größe und der Position der Leuchtkugel ihre Lage und Entfernung im Raum.
Darüber hinaus experimentieren Hersteller schon lange mit der Gehirnwellensteuerung. Die scheinbare Gedankenkontrolle beruht auf dem Konzept der Elektroenzephalographie (EEG), bei der Gehirnwellen auf verschiedenen Frequenzbändern aufgezeichnet werden. Für 200 Dollar bekommt man z.B. bei Neurosky einen Kopfhörer mit vier Elektrosensoren, die Gehirnwellen im Alpha- und Gamma-Band sowie Augenzwinkern registrieren. Ziel in der mitgelieferten Steuerungssoftware ist es, einen Zustand höchster Entspannung bei gleichzeitiger Konzentration zu erreichen. Je besser dies klappt, desto höher sollen im mitgelieferten Spiel Feuerwerksraketen fliegen, die man mit einem Augenzwinkern explodieren lassen kann.
... mehr


Spracherkennung zur Authentifizierung
11.03.2010, ChannelPartner
Ein internationales Forscherteam hat einen deutlich schnelleren Ansatz zur Sprach-Authentifizierung entwickelt. "Mit dieser Methode erreichen wir ohne nennenswerte Genauigkeitsverluste eine Beschleunigung um einen Faktor zehn bis 20 gegenüber dem zugrunde liegenden Goldstandard", sagt Tomi Kinnunen, Informatiker an der University of Eastern Finland. Der Weg zum Massenmarkt ist aber noch weit. Für aktuelle Forensik-Anwendungen beispielsweise zum Vergleich aufgenommener Stimmproben mag es genügen, wenn Sprechererkennung einige Minuten oder sogar Stunden dauert. Damit sie aber im Massenmarkt Akzeptanz gewinnen kann, sind nicht nur geringe Fehlerraten, sondern auch eine schnelle Reaktionszeit nötig, so Robert Rodman, Informatikprofessor an der North Carolina State University.
Kinnunen zufolge ist die Geschwindigkeit der Sprechererkennung aber nur ein Teilproblem. "Die Methoden beständig gegenüber Umweltfaktoren zu machen ist eine größere Hürde dafür, die Technologie für ein breites Publikum nützlich zu machen", erklärt er. Derzeit seien Systeme zu ungenau, wenn ein User sich erst in einem leisen Büro anmeldet und dann beispielsweise im Auto wieder authentifizieren will. Ferner sei der Effekt menschlicher Faktoren wie Trunkenheit oder Wut noch nicht ausreichend erforscht.
... mehr


Google testet TV-Suche
09.03.2010, heise online
Seit 2007 bietet der Internetkonzern bereits die Vermittlung von TV-Werbung an. Nach Informationen des Wall Street Journal möchte Google darüber hinaus auch eine engere Verbindung von Web und TV schaffen. Dafür testet Google intern durch eigene Mitarbeiter Fernseh-Suchfunktionen über Google-Software. Für den Dienst kooperiert Google mit Dish, einem US-Provider für Satelliten-TV.
Der Google-Dienst für TV-Suche benötigt keine gesonderte Hardware oder einen PC, um Fernsehsendungen aufzufinden. Er arbeitet mit Settop-Boxen des Dish-Netzwerks, auf denen Google-Software installiert wird. Mit der TV-Suche lassen sich nicht nur Fernsehsendungen finden, sondern auch passende Web-Videos von YouTube. Die Software ermöglicht auch eine personalisierte Liste von Sendungen und Videos, um ein individuelles TV-Programm zusammenzustellen.
... mehr


Computer lernen Gefühle
04.03.2010, Die Zeit online
Marc Schröder findet Maschinen nicht dumm, nicht faul, nicht laut, er findet sie vor allem – unhöflich. "Stellen Sie sich vor, Sie reden mit jemanden, und der antwortet einfach nicht. Nie! Er guckt Sie nicht mal an, und erklärt Ihnen auch nicht, dass er mit etwas anderem beschäftigt ist", sagt Schröder. Es klingt, als verwechsele der Experte für Künstliche Intelligenz da Mensch und Maschine. Dabei ist das gar nicht so weit hergeholt: Schließlich schimpfen wir tatsächlich ständig mit unseren Rechnern. "Je komplexer ein Gerät, desto eher nehmen Menschen es als soziale Einheit wahr", sagt Schröder.
Einsatzgebiete für fühlende Computer gibt es einige: automatische Sprachdialogsysteme bei Telefon-Hotlines wären vermutlich eine geringere Qual, wenn sie den Ärger eines Anrufers bemerken und darauf reagieren könnten, statt in ihrem monotonen Singsang fortzufahren. Oder Computerspiele: Sie könnten sich auf das Befinden eines Spielers einstellen und ein Spiel individuell weniger ängstigend oder sogar noch blutrünstiger machen, je nachdem, wie dem Menschen am anderen Ende der Grafikkarte gerade zumute ist.
... mehr


Mit Software-Ergonomie zu besserem Kundenservice
22.02.2010, Informationsdienst Wissenschaft
Kunden möchten zügig und individuell betreut werden - das stellt hohe Anforderungen an die Service Management Systeme, die zur Bearbeitung der Kundenanfragen eingesetzt werden. Doch häufig leiden diese Systeme an überladenen Bedienoberflächen und unstimmiger Nutzerführung - und dies erschwert eine zielgerichtete Kundenbetreuung. Die Firma c.a.p.e. IT entwickelt Systemlösungen, die durch ausgereifte Usability auch technikfremden Service-Mitarbeitern erlaubt, Kundenanfragen schnell und gezielt zu bearbeiten. Die Software entstand in Zusammenarbeit mit Arbeitspsychologen der TU Chemnitz: "Wir haben die c.a.p.e. IT auf der CeBIT 2009 kennen gelernt und die Aufgabe angenommen, diese Fachsoftware aus ergonomischer Sicht zu prüfen und Hinweise zur bedienerfreundlichen Gestaltung zu geben", resümiert Nina Bär, Projektmitarbeiterin der "Kompetenzinitiative Usability" (KiU) an der TU Chemnitz. Das Resultat lässt sich auf der CeBIT begutachten.
... mehr


Banking: Biometrie statt PIN
21.02.2010, Tagesspiegel
So ziemlich jeder Mensch benötigt im Alltag mehrere Passwörter. Das Interesse an Biometrieverfahren ist daher groß: Biometrie ist nicht nur sicherer, der Kunde muss sich auch weniger Passwörter merken. Deshalb testet die Deutsche Bank in ihrer Filliale Q110 in Berlin, der „Filliale der Zukunft“, nun einen Venenscanner: Nachdem der Kunde seine Karte in das Gerät eingeführt hat, fordert ihn der Automat auf, seine Hand für ein paar Sekunden über einen Sensor zu halten. Berühren muss er das Gerät dabei nicht. Der Sensor beleuchtet die feine Musterung der Venen unter der Haut mit Infrarotstrahlen und vergleicht dieses Bild mit den hinterlegten Daten des Kunden. Der Feldversuch läuft bereits seit November 2008. Bisher habe der Automat jede der 200 Testpersonen erkannt, sagt Filialleiterin Ira Holl. Und anscheinend kommt die Idee auch bei den Kunden gut an: „Die meisten sagen: Das wäre toll, wenn die Geheimzahl wegfallen würde.“
... mehr


Twitter veröffentlicht OpenSource-Produkte
19.02.2010, Golem.de
Der Microblogging-Dienst Twitter ist nicht nur „hippes“ Medium, sondern wird auch von Unternehmen in der Kundenkommunikation eingesetzt. Nun hat Twitter zahlreiche OpenSource-Produkte veröffentlicht - was den individuellen Einsatz der Technologie erheblich fördern dürfte. Unter dem Motto "Twitter loves open source" gibt Twitter sowohl eigne Projekte als auch solche frei, an denen sich Twitter bei der Entwicklung beteiligte und für seine Dienste nutzt. Dazu gehören etliche Ruby-Gems , etwa ein Gem zur einfachen Generierung von UUIDs, das Kerstel-Client-Gem für Message-Queuing sowie das Zookeeper-Gem, das eine Schnittstelle zu einem Distributed-Lock-Server bereitstellt.
... mehr


MobileWorld Congress: IVVR-Anwendungen auf dem Vormarsch
18.02.2010, TMC
Deutsche Unternehmen wie telenet oder Crealog bieten IVVR-Lösungen bereits seit Längerem an. Auf dem MobileWorld Congress präsentierte nun auch Speechstorm seine Video-IVR. Bei einer IVVR werden gängige IVR-Lösungen mit Video kombiniert. Durch das zusätzliche visuelle Feedback wird der Dialog für den Nutzer vereinfacht und lange Auswahlmenüs fallen weniger zur Last. Einzige Anforderung auf Seiten des mobilen Endgeräts ist, dass es über Mobilfunkstandards der dritten Generation, in erster Linie UTMS, verfügt. Damian Kelly, VP of Strategic Development, sieht großes Potential in der IVVR-Technologie: “We see an increasing demand from organisations and service providers who want the ability to quickly and easily build their own video applications, not just for 3G video phones, but for a whole range of mobile and IP devices.“
... mehr


Intelligente Spracherzeugung
18.02.2010, Informationsdienst Wissenschaft
Computerlinguisten der Universität des Saarlandes forschen daran, wie ein System aus einem bestimmten Zusammenhang heraus selbst sprachliche Anweisungen erzeugen kann. Anwendungsfeld ist eine 3D-Spiele-Welt, in welcher der Computer dem Spieler Tipps zur Navigation gibt. Alexander Koller, der im Informatik-Exzellenzcluster der Universität des Saarlandes eine Forschergruppe leitet, erklärt die Herausforderung folgendermaßen: "In verschiedenen Computerspielen gibt es schon heute eine Erzählstimme, die zum Beispiel Tipps bei der Schatzsuche gibt. Dies sind jedoch statische Anweisungen, die vorher als komplette Sätze einprogrammiert werden". Eine Situation genau analog zu heutigen IVRs. Die auf der CeBIT vorgestellte Technologie könnte eines Tages also auch zu einem radikalen Umbruch in der Kundeninteraktion führen.
... mehr


Google will Facebook und Twitter Konkurrenz machen und arbeitet an mobilem Babelfisch
08./09.02.2010, heise online
Google will seinen E-Mail-Dienst um Funktionen erweitern, die Online-Netzwerke wie Facebook und Twitter populär gemacht haben. Die Nutzer von GMail und Google Mail sollen demnächst auch kleine Botschaften und Statusmeldungen in Echtzeit an ihre Kontakte verschicken und deren Nachrichten beobachten können. Dabei wolle Google auch seine Video-Plattform YouTube sowie die Foto-Site Picasa in den neuen Dienst einbinden. Laut New York Times soll die Funktion über Add-ons für GMail realisiert werden. Ob auch Social-Network-Dienste der Konkurrenz unterstützt werden, ist derzeit noch unklar.

Was in der Science Fiction von Star Trek bis zu "Per Anhalter durch die Galaxis" zur Standardausstattung gehört, will Google "in einigen Jahren" auf der Erde anbieten. Die Übersetzung gesprochener Texte in Echtzeit soll das Mobiltelefon übernehmen. Ein Standbein der Technik könnten die bereits vorhandenen Werkzeuge zum Übersetzen von Webseiten sein, die zurzeit zwischen 52 Sprachen vermitteln. Außerdem verfügt Google über Verfahren zur Spracherkennung, die das Unternehmen bereits im Android-Betriebssystem einsetzt.


Vom Gehirn lernen: Informatiker entwickeln neue Generation von Neurocomputern
01.02.2010, Informationsdienst Wissenschaft
Intelligente Maschinen, die nicht nur mitdenken, sondern auch aktiv dazulernen, sind die Vision von Forschern des Instituts für Grundlagen der Informationsverarbeitung der TU Graz. Sie koordinieren nun drei Jahre lang das Forschungsprojekt "Brain-i-Nets" der Europäischen Union. Die Wissenschafter wollen eine neue Generation von Neurocomputern entwerfen, die auf Rechenprinzipien und Lernmechanismen im Gehirn beruht und gleichzeitig neue Erkenntnisse über Lernmechanismen im Gehirn gewinnen. Speziell die Plastizität der Verbindungen zwischen Nervenzellen hat es den Forschern angetan. Mit neuen Methoden wollen die Wissenschaftler nun herausfinden, wie das Gehirn sich lernend seiner Umgebung anpasst.
... mehr


Markteinführung der mobilen Plattform Nuance Voice Control Automotive
01.02.2010, Xdial
Nuance gibt die Markteinführung der mobilen Plattform Nuance Voice Control Automotive bekannt, eine integrierte Sprachschnittstelle für die Automobilindustrie. Diese Plattform basiert auf der Spracherkennungstechnologie von Dragon NaturallySpeaking und unterstützt die Bedienung von Connected Services während der Autofahrt, wie dem SMS-Versand oder die Abfrage von Verkehrsnachrichten, durch einfache Sprachbefehle. Nuance Voice Control Automotive bietet über eine einzige, einheitliche Sprachschnittstelle einen nahtlosen Zugang zu allen On-Board- und Connected Services. Die Lösung versteht den natürlichen Sprachfluss und erweitert sinnvoll mobile Sprachanwendungen.
... mehr


School of Design Thinking: Ideen für Supermarkt der Zukunft
01.02.2010, Märkische Allgemeine online
Geht es nach den jüngsten Entwürfen von Studenten der HPI School of Design Thinking, dann sieht ein Einkauf im Supermarkt in Zukunft so aus: Der Kunde bekommt einen Scanner in die Hand gedrückt. Er schlendert damit durch die recht eng ausfallenden Regalreihen, in denen nur noch Modelle von Produkten stehen. Was er haben möchte, scannt er an. Lediglich in der Mitte des Marktes werden einige Frischeprodukte noch auf herkömmliche Weise angeboten. Die gewünschte Ware wird erst an der Kasse automatisch aus dem Keller geliefert. Ein Vorteil: Enorme Einsparung an Energiekosten. Da nicht mehr ein riesiger Markt mit sämtlichen Produkten beleuchtet und beheizt werden muss und auch energiefressende offene Kühlregale wegfallen, könnte ein solcher „nachhaltiger Supermarkt“ rund 68 Prozent der Energiekosten einsparen.
... mehr


Voice Studio: Ihre Stimme im Garmin-Navi
28.01.2010, Computerbild
Mit Hilfe von Voice Studio können Besitzer von Navigationsgeräten ihr Gerät so personalisieren, dass die Ansagen von ihnen bekannten Stimmen erfolgen. „Sie können nun sich selbst oder die Stimme ihrer Freunde, Partner und Kinder aufzeichnen, sich so von diesen zum Ziel führen lassen und sogar diese Stimmen mit anderen nüvi-Nutzern teilen”, sagt Olaf Meng, Produktmanager Automotive bei Garmin Deutschland. Die kostenlose Anwendung Voice Studio kann unter www.garmin.de/voicestudio heruntergeladen werden. Nach der Installation können die Anwender Ansagen aufzeichnen, in Voice Studio bearbeiten und auf das Navigationsgerät laden.
... mehr


Voice-Erweiterung für Chrome und neue Google-Voice-Version fürs iPhone
26.01.2010, Futurezone + Internetworld
Google hat eine neue, mobile Version des Google-Voice-Dienstes vorgestellt, die den Zugang zum Dienst per Browser ermöglicht. Im Sommer 2009 hatte Google seinen neuen Telefoniedienst vorgestellt, der es möglich macht, eine Telefonnummer einzurichten, unter der man überall erreichbar ist. Für BlackBerry- und Android-Telefone gibt es seit einem halben Jahr eine Anwendung, die den neuen Dienst unterstützt, von Apples App Store aber wurde Google Voice entfernt. Mit der neuen Version kann der Dienst nun direkt im Browser aufgerufen und betrieben werden und muss nicht auf das Mobiltelefon heruntergeladen werden.

Und auch dem hauseigenen Browser Chrome spendierte Google eine Voice-Erweiterung. Werden auf einer Webseite Telefonnummern erwähnt, erscheinen diese als Hyperlink, sind klickbar und damit direkt als Telefonanruf wählbar. Ein Klick auf den Hyperlink aktiviert ein neues Pop-up-Fenster, in dem der Nutzer aussuchen kann, mit welchem Telefon er gegebenenfalls den Anruf durchführen möchte. Eine direkte Verbindung kann danach hergestellt werden. Auch Kurznachrichten können mittels der Voice-Erweiterung verschickt beziehungsweise gelesen werden. Für die Zukunft sei geplant, Voicemail-Playback direkt vom Pop-up-Fenster aus zugänglich zu machen.


Visual Sound: neues Handy-Konzept für Schwerhörige und Gehörlose
26.01.2010, LG Blog
Die New Yorker Studentin des Pratt Institute, Suhyun Kim, entwickelte mit "Visual Sound" ein Konzept für ein ungewöhnliches optisches Mobiltelefon, das Hörbehinderten das moderne Leben etwas erleichtern soll. Der Entwurf sieht nicht nur gut aus, sondern hat auch technisch einiges zu bieten: Per Spracherkennung und -synthese wird Sprache in Text und Text in Sprache umgewandelt. Während eines Telefonats wird die Stimme des sprechenden Anrufers simultan in Text übertragen, der über den vergrößerten ausziehbaren Touchscreen rollt. Andersherum kann ein Text eingegeben werden, der dann in Sprache umgesetzt und dem anderen Teilnehmer übermittelt wird. Das UMTS-Modell soll auch in der Lage sein, ein Videogespräch zu führen, bei dem dann auf die Gebärdensprache zurückgegriffen werden kann. Jetzt fehlt es nur noch an einem Hersteller, der das Design in Serie gehen lässt.
... mehr


ProMobile macht BlackBerry Smartphones zu professionellen Diktiergeräten
20.01.2010, OPI
Mit der Brainworks Diktiersoftware ProMobile wird das BlackBerry Smartphone zum professionellen Diktiergerät. „Mit dem BlackBerry diktieren, ungewöhnliche Mobilität erzielen und jedem Anwender die Arbeit wesentlich erleichtern, das waren unsere primären Ziele bei der Anpassung der Diktiersoftware ProMobile.“, erklärt Eduard Meiler, Geschäftsführer der Brainworks GmbH. Durch die schnelle Installation und die einfache Konfiguration können große Unternehmen die Software in kürzester Zeit allen Mitarbeitern zur Verfügung stellen. Diktate lassen sich dann innerhalb von wenigen Minuten erstellen, bearbeiten und versenden. Dabei unterstützt ProMobile den Versand der Diktate über den BlackBerry Enterprise Server, Direct TCP oder über das WLAN. Durch die Anbindung an das Unternehmensnetzwerk kann ProMobile auch auf die Unternehmensdatenbank zugreifen.
... mehr


Ein Besuch im Hotelzimmer von morgen
17.01.2010, FAZ.net
Im 5200 Quadratmeter großen Duisburger Zukunftslabor „Intelligente Raum- und Gebäudesysteme“, in dem 40 Wissenschaftler zusammen mit Industriepartnern technische Innovationen für Hotels, Büros, Wohnungen und sonstige Gebäudesysteme erproben, werden Nutzungskonzepte für das Hotel von morgen entworfen. Und das hält für den Gast allerhand Überraschungen bereit. Das fängt schon bei der Buchung an: In ein paar Jahren könnte es sein, dass der Hotelgast kein Zimmer mehr bucht, sondern eine „Raumkonstellation“. Und der Weg zum Zimmer gleicht einem Abenteuer aus der Fernsehserie „Raumschiff Enterprise“. Kein Hotelpage, sondern die „intelligente Flurbeleuchtung“ leitet den Gast zum richtigen Zimmer. Im Zimmer selbst lässt sich vieles über Spracherkennung des zimmereigenen „Bordcomputers“ steuern. Und ein Service-Roboter mit eingebauter Mini-Bar ist als fahrender Zimmerkellner unterwegs. Ein wenig unpersönlich wirkt das schon. Aber Klaus Scherer, Leiter des Fraunhofer In-Haus-Zentrums, meint, dass viele Gäste anonyme Bestellvorgänge - vor allem für Getränke - durchaus begrüßen.
... mehr


Shortcuts per Fingerzeig
13.01.2010, heise online
Ein neues Werkzeug namens Scrybe erweitert den Funktionsumfang von Touchpads und steht seit Kurzem als limitierte Betaversion bereit. Es stammt vom US-Interface-Spezialisten Synaptics aus Santa Clara. Mit Scrybe können Nutzer beispielsweise im Web suchen, in dem sie den Buchstaben "G" für Google auf das Touchpad zeichnen. Und auch eigene Gesten sind definierbar. Scrybe-Projektleiter und Synaptics-Manager Ted Theocheung sieht mit der neuen Lösung einen Paradigmenwechsel aufkommen - weg von Tastatur und Maus, hin zu einem "Gesten-Workflow", mit dem sich auch kompliziertere Jobs wie Online-Shopping oder Multimedia-Konsum direkt vom Touchpad aus erledigen lassen. Dadurch müsse man weniger tippen und die Anzahl der notwendigen Schritte verringere sich.
... mehr


Nuance präsentiert SpeechMagic 7
11.01.2010, Nuance Communications, Inc.
Nuance stellt Version 7 von SpeechMagic vor. Die Spracherkennungsplattform wurde mit besonderen Funktionalitäten für den Einsatz in Großinstallationen ausgestattet. Die Spracherkennung liefert vom Start weg hohe Erkennungsraten und fügt sich optimal in den Arbeitsalltag von Ärzten ein. Neue, einfache Integrationstools begünstigen die Einbindung in medizinische IT Systeme und gewährleisten eine schnelle Projektabwicklung, auch in standortübergreifenden Installationen. "SpeechMagic 7 wurde auf Basis der Anforderungen und des Feedbacks von über 100 Integrationspartnern entwickelt. Wir können somit auf die Erfordernisse von Krankenhäusern in ganz Europa und anderen Teilen der Welt optimal reagieren. Wir bieten diesen eine zukunftssichere Spracherkennungsplattform, die den zu erwartenden Veränderungen im Gesundheitswesen Rechnung trägt – dazu gehören virtuelle Umgebungen, Windows 7 und die Bereitstellung in großen Installationen und allen gängigen IT-Gesundheitssystemen", sagt Gernot Puck, Produktmanager SpeechMagic bei Nuance Healthcare.
... mehr


GoYellow startet anonymisierten Anrufdienst
11.01.2010, golem.de
Wer bei der neuen Servicehotline von GoYellow seine Festnetz- oder Handynummer hinterlegt, wird anonym erreichbar. Die Nummer des Angerufenen bleibt bei der Vermittlung geheim, verspricht der Betreiber. Anrufer werden dabei über ein Callcenter an den gewünschten Gesprächspartner vermittelt, ohne dessen persönliche Kontaktinformationen zu erhalten. Mit GoYellow 118000 sind Menschen auf Wunsch telefonisch erreichbar, ohne sich in ein öffentliches Verzeichnis eintragen zu müssen und ohne dass der Anrufende die Telefonnummer seines Gesprächspartners erfährt. "Mit 118000 kann jeder selbst entscheiden, wer ihn sprechen kann und wer nicht. Lästige Werbeanrufe können von vornherein abgeblockt werden", sagt GoYellow-Chef Klaus Harisch. Unternehmenssprecherin Anja Meyer sagte Golem.de: "Die Menschen sollen sagen können: Ich bin erreichbar über die 118000, und der Rest geht keinen etwas an." Die Kosten für den Dienst trage immer der Anrufer. In der Betaphase ist der 118000-Dienst noch gratis, später kosten die ersten beiden Minuten jeweils 1,59 Euro. Jede weitere Minute wird mit 29 Cent berechnet, sagte Meyer weiter. Sie hofft, dass bis Ende Februar 2010 der Bestand der Datenbank soweit angewachsen ist, dass auch 118000-Dienste für Internet-Communitys angeboten werden können.
... mehr


Google Phone mit Android-Betriebssystem: Erste Eindrücke vom Nexus One
11.01.2010, Basis Thinking Blog
Googles Smartphone, das brandneue Nexus One, ist erst seit ein paar Tagen per Internet bestellbar, doch schon jetzt wird Unmut aus den Reihen der Kunden laut: UMTS sei nicht gerade seine Stärke und 3G werde an Orten nicht erkannt, an denen andere Geräte problemlos das Signal aufnehmen. Noch schleppender aber sei der Kunden-Support, den Google für das Handy (ausschließlich via E-Mail) anbietet. Die Beantwortung von Anfragen dauere so lange, dass einige Kunden ihr Gerät bereits frustriert zurückgeschickt hätten. Dem Suchmaschinengiganten ist das Problem mit dem mangelnden Support übrigens bekannt. In einem Interview mit Walt Mossberg von AllThingsDigital sagte Google-Entwickler Andy Rubin, der das Nexus kürzlich vorgestellt hatte: "Wir müssen im Kundensupport besser werden."

Google selbst nennt sein Smartphone eine "einzigartige Kombination aus Design und Innovation". Und tatsächlich gibt es wenig, was das Nexus One nicht kann. Superschneller Prozessor, Vierband-Telefon, WLAN, Bluetooth, großer Touchscreen, Fünf-Megapixel-Kamera, GPS, digitaler Kompass, und eine Spracherkennung, mit der man sogar Webanwendungen wie Google Maps steuern kann. Die Kooperation mit dem taiwanesischen Technikhersteller HTC hat sich ausgezahlt – gerade in den Details. Das Nexus One verfügt über zwei Mikrofone, eines davon, um die Hintergrundgeräusche herauszufiltern. Und um die von vielen als störend empfundenen Fingerabdrücke auf der Rückseite zu vermeiden, wurde eine spezielle Teflonschicht aufgebracht.

Über google.com/phone kann das Gerät entweder frei für 529 US-Dollar oder zusammen mit einem Mobilfunk-Vertrag bestellt werden. Derzeit ist der Shop allerdings nur für Kunden aus den USA und in Kürze für Testmärkte in Großbritannien, Hong Kong und Singapur geöffnet. In den USA kann das "Superphone" vorerst nur mit einem Vertrag von T-Mobile gekauft werden, da es sich bei dem Gerät um die GSM-Version handelt und andere Provider wie Verizon und Spring einen anderen Mobilfunkstandard unterstützen. Natürlich steht es Kunden auch frei, ihre AT&T-SIM-Karte in das Gerät einzulegen, dann steht ihnen allerdings kein flottes 3G-Netz zur Verfügung.


ShoutOUT: Spracherkennung für iPhone kommt nach Deutschland
10.01.2010, Teletarif
Das amerikanisch-australisische Software-Unternehmen promptu.com zeigte zur Consumer Electronics Show (CES 2010) in Las Vegas eine Spracherkennungssoftware für Smartphones: ShoutOUT, das seit kurzem im US-amerikanischen AppStore für das Apple iPhone verfügbar ist. Das Programm zeichnet den vom Nutzer gesprochenen Text auf, komprimiert die Sprachdaten und überträgt diese über das Internet an einen Server von promptu.com. Dieser analyisiert die erhaltenen Sprachdaten und sendet den Text an die App zurück. Dort wird der Text dann wiederum an die passende Stelle in der SMS-Anwendung eingetragen. Aktuell ist ShoutOUT auf die Anwendung Speech-to-SMS reduziert, man kann damit also nur Kurzmitteilungen versenden. Parallel zur iPhone-App arbeitet promptu.com auch an ähnlichen Softwarelösungen für andere Handy-Betriebssysteme. Auch hier soll zu Beginn SMS mit Spracherkennung unterstützt werden, danach folgen die beliebten Social-Media-Dienste Twitter und Facebook und dann E-Mail.
... mehr


Spredfast misst Social-Media-Wirkung
04.01.2010, heise online
2009 könnte als das Jahr in die Technikgeschichte eingehen, in dem das soziale Web erwachsen wurde. Die Anzahl der Facebook-Nutzer schnellte auf 350 Millionen hoch, Twitter wurde zum normalen Kommunikationskanal und LinkedIn startete einen Dienst, mit dem Headhunter das Netzwerk nach neuen Mitarbeitern durchsuchen können. Und auch etliche Unternehmen sprangen mit Firmenblogs, Twitter-Mitteilung oder User Generated Content auf den Web-2.0-Zug auf. In manchen Chefetagen würde man allerdings gerne wissen, ob sich diese Aktivitäten wirklich rechnen. Die Antwort könnte vielleicht das Start-up Social Agency aus dem texanischen Austin geben. Im Dezember startete es den Webdienst Spredfast. Dieser soll Unternehmen nicht nur helfen, ihre Social-Media-Aktivitäten besser zu managen, sondern auch deren Erfolg zu messen. Spredfast zählt, wie viele Nutzer Firmenmitteilungen auf Twitter, Facebook, LinkedIn, YouTube oder Flickr wirklich aufrufen. Ebenso wird die Wirkung von Blogeinträgen auf Plattformen wie Moveable Type, WordPress, Blogger, Lotus Live oder Drupal verfolgt. Dabei liefert Spredfast nicht nur simple Klickraten, sondern untersucht auch, wie Nutzer auf die Inhalte reagieren, etwa ob Blogeinträge kommentiert oder Twitter-Mitteilungen weitergeschickt werden. Ziel sei, Unternehmen verlässliche Daten zu liefern, ob das Spiel mit dem Web 2.0 Produkte und Marken auch wirklich bekannter mache.
... mehr


RoboBraille und Loquendo bieten Service für Seh- und Lesebeeinträchtigte
15.12.2009, Loquendo
RoboBraille präsentiert einen E-Mail-Service, der auf der Sprachsynthese von Loquendo basiert. Das Produkt wandelt Textdokumente in eine Vielzahl alternativer Formate für seh- bzw. lesebeeinträchtige Menschen um: Braille, Audiodateien oder DAISY. Derzeit unterstützt der Service sieben Sprachen. Die Gründe für die Wahl der Loquendo TTS für den RoboBraille-Service waren die lebendigen und ausdrucksvollen synthetischen Stimmen und das breite Spektrum an verfügbaren Sprachen. "The RoboBraille team decided that Loquendo was the speech engine of choice because our visually impaired and reading impaired users found the speech engines from Loquendo fluent and intelligible" so Lars Ballieu Christensen, Koordinator von RoboBraille.
... mehr


Nuance Dragon Dictation jetzt im App Store
08.12.2009, Nuance Communications, Inc.
Die Dragon Dictation App von Nuance ist im US-AppStore angekommen. Mit Dragon Dictation können iPhone-Besitzer Emails und Textnachrichten einfach diktieren statt sie zu tippen. Darüber hinaus lassen sich mit der App auch Nachrichten in anderen Apps - wie Facebook oder Twitter - hinterlassen. Derzeit steht die Diktiersoftware kostenlos zur Verfügung - allerdings nur für begrenzte Zeit.
“Dragon Dictation takes the messaging experience on the revolutionary iPhone to a whole new level,” said Michael Thompson, senior vice president and general manager, Nuance Mobile. “Dragon Dictation is also incredibly natural and intuitive. Users will soon find they’re speaking more than typing using the power of speech to communicate even faster, whatever they’re doing and wherever they are."
Ob und wann die App auch hierzulande den Sprung in den AppStore schafft ist noch ungewiss.
... mehr


Künstliche Intelligenz - neu überdacht
08.12.2009, heise online
Im Mind Machine Project arbeiten rund zwei Dutzend Professoren zusammen, darunter so illustre Geister wie die KI-Legende Marvin Minsky oder der Leiter des Center for Bits and Atoms, Neil Gershenfeld. „Es gibt noch immer kein Programm, das nach einem Blick in ein Zimmer sagen kann, da sitzt ein Mensch, da steht ein Glas Wasser auf dem Tisch. Kein Computer kann auch nur einfache Geschichten verstehen“, hatte Minsky bereits 2006 - anlässlich des 50jährigen Jubiläums der KI-Forung kritisiert - und seinen Forscherkollegen mangelnde geistige Beweglichkeit vorgeworfen. Nun wollen Gershenfeld und seine Kollegen "noch einmal zurück gehen, und das reparieren, was kaputt gegangen ist". In drei Themenfeldern sei die KI-Forschung stecken geblieben - diese sollen mit Hilfe von Teilprojekten neu angegangen werden: Das erste Teilgebiet betreffe "die Modellierung des Denkens".  Hier müsse es darum gehen, die Vielzahl der bereits existierenden Modell zu einem funktionierenden Ganzen zu verbinden. Das zweite Projekt betreffe die Erforschung des Gedächtnisses - insbesondere die Einbeziehung von zweideutigen, unscharfen Erinnerungen und Assoziationen. Und schließlich wollen sich die Projektteilnehmer mit der Wechselwirkung zwischen physischem Körper und Intelligenz beschäftigen.
... mehr


VoiceCash Prepaid Karte löst Kreditkartenmissbrauchs-Risiko
23.11.2009, Pressrelations
Für Kreditkarteninhaber waren die letzten Wochen äußerst unerfreulich. Mehr als 100.000 Kreditkarten wurden deutschlandweit eingezogen und sollen schnellstmöglich ausgetauscht werden. Vorangegangen war ein mutmaßlicher Diebstahl von Nutzerdaten. Wegen der öffentlich gewordenen Sicherheitslücken bekommen Kreditkarten ein Imageproblem. Doch welche anderen Möglichkeiten gibt es für Verbraucher? Eine Lösung bietet die VoiceCash Gruppe mit ihrer Prepaid MasterCard. Das Missbrauchsrisiko ist äußerst begrenzt, da es zum einen eine rein guthabengeführte Karte ist, auf die jeweils nur der Betrag geladen wird, über den man auch verfügen möchte. Und zum anderen bietet die Karte ein zusätzliches Sicherheitsmerkmal: Die patentierte Stimmerkennungs-Technologie von VoiceTrust. Damit können Bezahlvorgänge mit der eigenen Stimme autorisiert werden.
... mehr


Live-Untertitelung von Parlamentsdebatten
23.11.2009, derStandard.at
Das österreichische Parlament will die im Fernsehen übertragenen Parlaments-Sitzungen mehr Menschen zugänglich machen: Im konkreten Fall speziell den Gehörlosen oder stark Hörbehinderten. Im Rahmen eines gemeinsamen Pilotprojekts von ORF und Parlament wird ein Spracherkennungssystem entwickelt, das die Live-Untertitelung der Parlamentsdebatten ermöglicht. Das System soll erstmals bei den kommenden Plenarsitzungen am 10. und 11. Dezember zeigen, was es zu leisten im Stande ist. "Wir müssen das jetzt erstmals in der Praxis ausprobieren", so der Leiter der Öffentlichkeitsarbeit des Parlaments zu derStandard.at. "Ich bin aber zuversichtlich, dass eventuell lediglich kleinere Anpassung nötig sein werden."
... mehr


Youtube untertitelt Videos per Spracherkennung automatisch
20.11.2009, Golem.de
Videos bei Youtube zu untertiteln war mühsam - bis jetzt: Durch Spracherkennung können Youtube-Videos künftig auch automatisch untertitelt werden. Die Spracherkennung stammt von Google Voice und wird normalerweise zur Umwandlung von Sprachnachrichten in Text eingesetzt. Ist ein Video untertitelt, lässt es sich auch mit Gogol Suchmaschinen durchsuchen. Wer weiterhin lieber auf manuelle Untertitelungen setzt, profitiert ebenfalls von der Spracherkennung. In der Vergangenheit mussten die Untertitel immer mit genauen Timecodes als Textdatei heraufgeladen werden, damit Youtube die Titel zur richtigen Zeit einblendet. Mit der automatischen Texterkennung synchronisiert Youtube die vom Anwender bereitgestellten Texte automatisch mit dem Video. Die automatische Untertitelung wird zunächst nur in einer Handvoll von Partnerkanälen angeboten und ist nur für englischsprachige Videos verfügbar. Die Funktion zur Synchronisation von Text und Video soll hingegen für alle Videos bereitgestellt werden. Künftig will Google auch andere Sprachen und Kanäle unterstützten, einen Zeitplan nannte das Unternehmen jedoch nicht.
... mehr


Loquendo veröffentlicht ASR 7.8
19.11.2009, Loquendo
Loquendo veröffentlicht Version 7.8 seiner Spracherkennungssoftware Loquendo ASR. Die neueste Version bietet einige Verbesserungen und soll eine noch genauere Erkennung von natürlicher spontaner Sprache ermöglichen. Der Spracherkenner kann in Version 7.8 mit phonetischen Transkriptionen in X-SAMPA umgehen und die automatisch erstellten Lexika beruhen ebenfalls auf X-SAMPA. Das Loquendo Acoustic Model Adaptation Tool wurde optimiert und erlaubt nun die schnellere Entwicklung von an einen Sprecher bzw. an eine bestimmte Umgebung angepassten akustischen Modellen. Die mehrsprachige ASR bietet akustische Modelle für den Einsatz in speziellen Telefonie-Umgebungen (Festnetz, Mobilfunk, VoIP) und für laute Umgebungen, wie beispielsweise das Auto. Das Produkt ist für Windows und Linux erhältlich und unterstützt alle gängigen Embedded-Betriebssysteme.
... mehr


Diktiersoftware ProMobile jetzt auch kompatibel mit dem Apple iPhone
17.11.2009, Firmenpresse
Pünktlich zur MEDICA 2009 präsentiert die Brainworks GmbH eine iPhone-Version der Diktiersoftware ProMobile. Damit lässt sich das iPhone als professionelles Diktiergerät nutzen. "User erhalten eine flexible und mobile Diktierlösung, die einfache Handhabung und Verlässlichkeit bietet. Zudem wird unsere Software aktuellen Sicherheitsanforderungen gerecht und verschlüsselt Diktate nach den heute geltenden Standards. Erstellte und bearbeitete Diktate können jeweils über UMTS, WLAN, GPRS oder E-Mail an bereits vorhandene digitale Diktiersysteme versendet werden und ermöglichen die einfache Anbindung an bestehende Unternehmensnetzwerke", erklärt Eduard Meiler, Geschäftsführer der Brainworks GmbH.
... mehr


Spracherkennung im Großformat: Nuance bringt SpeechMagic Solution Builder 2.0 auf den Markt
11.11.2009, Nuance Communications, Inc.
SpeechMagic Solution Builder 2.0 ermöglicht erstmalig den standortübergreifenden Zugriff auf das Spracherkennungssystem durch bis zu 1.500 Ärzte gleichzeitig. Die weiterentwickelte Spracherkennungsfunktion unterstützt strukturierte Befunde für die Nutzung in der Patientenakte. Zusätzlich zum Effizienzgewinn durch Spracherkennung, beschleunigen neue Funktionalitäten für Autotext und Dokumentvorlagen den Diktiervorgang um weitere 20%. "[Wir haben das Dokumentationsverhalten von Ärzten] bis ins Detail analysiert, um Spracherkennung völlig natürlich in den Arbeitsalltag einzubinden. So können wir jetzt die Struktur von elektronischen Patientenakten direkt im Spracherkennungseditor abbilden. Die Ärzte navigieren dadurch schneller durch die entsprechenden Felder und die Informationen werden EPA-fertig erfasst", erklärt Gerhard Schuberth, Geschäftsführer von Nuance Healthcare, DACH.
... mehr


Horror per Handy: Werbeagentur Jung von Matt konzipiert sprachgesteuerten Kinofilm
10.11.2009, NeueNachricht
Was man mit Sprachsteuerung schon heute mit Handys veranstalten kann, beweist der interaktive Horrorfilm "Last Call" von der Werbeagentur Jung von Matt. Hier können Kinobesucher per Sprache und Handy aktiv ins Geschehen eingreifen. "Wir wollen zwei Grenzen aufheben: Die eine zwischen Film und Game, die andere zwischen Handlung und Zuschauer", erklärt Andreas Henke, Creative Director von Jung von Matt, im Interview mit NeueNachricht. Henke präsentierte den Film beim Nuance-Fachkongress Conversations DACH.
... mehr


iPhone-Programm übersetzt während der Spanienreise
10.11.2009, Handelsblatt
Nie wieder sprachlos im Urlaub: Eine Gruppe von Forschern aus Deutschland und den USA hat ein Dolmetscherprogramm für das iPhone entwickelt: "Jibbigo" beherrscht Spanisch und Englisch. Der Nutzer spricht einzelne Sätze in das Mikrofon des Smartphones und postwendend liefert Jibbigo die Übersetzung als Text- und Sprachversion. 40 000 Wörter umfasst das Vokabular. Die Datenbank ist auf dem iPhone gespeichert. "Jibbigo benötigt daher keinen Zugang zum Internet oder zu einem Server", sagt Alex Waibel, Informatik-Professor am Karlsruhe Institute of Technology sowie an der Carnegie Mellon University in Pittsburgh. Derzeit arbeiten die Forscher daran, das Angebot um weitere Sprachen zu ergänzen. Apple vertreibt die Software für knapp 20 Euro.
... mehr


Sprachanalyse-Algorithmus erkennt Depressionen
05.11.2009, heise online
Der Ton macht die Musik, heißt es im Volksmund. Auch für Alex Pentland vom MIT: Der Leiter des Human Dynamics Lab erforscht, was Tonfall und Stimmlage, Länge und Häufigkeit von Pausen sowie Geschwindigkeit beim Reden über die Stimmungslage einer Person verraten. Seine Gruppe entwickelt Algorithmen zur Sprachanalyse, die ermitteln sollen, ob jemand von Ängsten geplagt, vereinsamt oder depressiv ist. Die MIT-Ausgründung Cogito Health will Pentlands Forschungsergebnisse nun in einer Sprachanalyse-Software vermarkten, die eine solche Diagnose über das Telefon vornehmen kann.
... mehr


Microsoft setzt verstärkt auf Sprachtechnologie
03.11.2009, eweekeurope + Winfuture
Softwarehersteller Microsoft will künftig stärker auf den Einsatz von Sprachtechnologie, speziell von Spracherkennung setzen. Dies kündigte Microsoft in einer Pressemeldung an. Bereits das neue Betriebssystem Windows 7 verfügt laut Hersteller über eine verbesserte Spracherkennung. In Zukunft sollen auch die Microsoft-Suchmaschine Bing vom Mobiltelefon aus per Spracherkennung steuerbar sein und Outlook 2010 mit einer Voice2Text-Komponente ausgestattet werden: Aus Voicemail-Nachrichten wird ein Vorschau-Text extrahiert, der dem Nutzer vor dem Anhören der Voice-Mail dabei hilft, die Nachrichten vorzuklassifizieren und zu priorisieren.


SVOX mit neuer Sprachsoftware-Version
03.11.2009, SpeechTechMag
Die neue Version 9.1 der SVOX-Sprachsoftware ist laut Hersteller unter anderem ausgestattet mit einer verbesserten Text2Phone-Konvertierung und optimierten akustischen Modellen für Deutsch und Englisch. Die Software ist für den Einsatz im Automotive- und im Mobile-Bereich optimiert: "This latest improvement of SVOX core speech recognition technology allows our automotive and mobile customers to achieve even higher recognition rates in even more difficult noise conditions," so SVOX CEO Martin Reber. Weiter sieht Reber in den genannten Verbesserungen einen wichtigen Meilenstein für die weitere Etablierung von Sprachtechnologie im mobilen Sektor, in dem die Sprachtechnologie einen wichtigen Beitrag zur Nutzerfreundlichkeit leiste.
... mehr


Erster Entwurf für Emotion Markup Language (EmotionML) 1.0 veröffentlicht
30.10.2009, W3C
Mit dem Erarbeiten eines Emotion Markup Language Standards schafft die Multimodal Interaction Working Group eine wichtige Basis für Emotionserkennung und Emotionsgenerierung in der Mensch-Maschine Interaktion. Anwendung findet die Markup-Language zum Beispiel bei der Annotation von emotionalen Merkmalen in Texten und Bildern, bei der Emotionserkennung oder bei der Erzeugung von Emotion - z.B. durch Sprachsynthese. Dadurch wird eine bislang eher am Rande existierende sprachtechnologische Dimension vertieft: Lag der Schwerpunkt bislang verstärkt auf den rein linguistischen Merkmalen von Sprache - ergeben sich nun weiterreichende Möglichkeiten im paralinguistischen Bereich der Emotion. Die Etablierung des Standards basiert auf wissenschaftlich fundierten Erkenntnissen, gleichzeitig wurde aber auch auf die praktische Anwendbarkeit Wert gelegt.
... mehr


Google startet kostenloses Navigationssystem
28.10.2009, heise online
Nach Bekanntwerden der Nachricht stürzten die Aktien von Anbietern wie der niederländischen TomTom und von Garmin in den Keller: Google bringt ein vollkommen kosten- und werbefreies Navigationssystem für Android-Smartphones auf den Markt. Ein hochwertiges Produkt, welches nicht nur die Datenbasis von Google Maps mit einschließt, sondern auch über eine ausgereifte Spracherkennung verfügt, wie Google in einem Werbevideo demonstriert. Das System versteht nicht nur Einzelwortkommandos, es lässt auch natürliche Eingaben in ganzen Sätzen oder Phrasen zu. Zudem sind neben Orten und Straßen auch Points of Interest und temporäre Ziele wie z.B. die Namen von Ausstellungen integriert. Mit dieser Applikation, die bislang nur für den US-Markt verfügbar ist, dürfte Google ein wichtiger Schlag gegen Apple's iPhone und das Microsoft-Betriebssystem Windows Mobile gelungen sein.
... mehr


System zur visuellen Emotions-Erkennung verbessert multimodale Dialogsysteme
22.10.2009, University of Surrey
Sprache lässt sich besser verstehen, wenn auch der visuelle Kommunikationskanal zu Verfügung steht. Jetzt haben Forscher an der Universität von Surrey eine automatisierte Methode entwickelt, relevante visuelle Signale für das Verstehen von Sprache auszuwerten. Im Vordergrund steht dabei die Emotionserkennung. Dazu wurden Videoaufnahmen von menschlicher Konversation analysiert und annotiert und als Trainingsmaterial genutzt. Tim Sheerman-Chase, leitender Forscher in diesem Projekt, sieht einen Durchbruch in der visuellen Emotionserkennung: "This is a new direction in emotion recognition. Most previous work focused on actors or artificial social situations. The ability for computers to understand meaning in natural conversation is key to being able to use our innate communication skills to use computers." Neben seiner Relevanz für multimodale Dialogsysteme verdeutlicht dieser Fall auch sehr gut die Notwendigkeit für eine standardisierte Emotion Markup Language.
... mehr


Neue Technologie für E-Book Reader
22.10.2009, heise online + golem.de
Pünktlich zur Frankfurter Buchmesse drängen neue Lesegeräte für E-Books auf den Markt. Bislang ist das Interesse der Käufer aber gering. Seit dem 19. Oktober verkauft Amazon seinen eBook-Reader Kindle auch an Kunden außerhalb der USA. Zum internationalen Verkaufsstart stehen allerdings nur englischsprachige eBooks zum Download bereit. Kunden aus Deutschland können aus über 250.000 englischsprachigen eBooks und diversen Zeitschriften auswählen.
Auch das Berliner Startup txtr hat sein E-Book-Lesegerät txtr Reader auf der Frankfurter Buchmesse vorgestellt. Der Reader soll für 320 Euro ab dem 15. Dezember in Deutschland erhältlich sein. Bis zum Verkaufsstart will Txtr 20.000 E-Books im Format EPUB bereitstellen, es wäre dann das größte Angebot für deutschsprachige EPUBs.
E-Book-Reader gibt es inzwischen eine ganze Reihe auf dem Markt, deshalb setzen die Anbieter auf neue Technologien, um sich von den Konkurrenten zu unterscheiden. LG hat ein E-Book vorgestellt, dessen Akku sich über eine Solarzelle aufladen lässt. Die Dünnschicht-Solarzelle befindet sich im aufklappbaren E-Book und ist dünner als eine Kreditkarte. Die US-Buchhandelskette Barnes & Noble hat ihren E-Book-Reader Nook vorgestellt. Wichtigstes Unterscheidungsmerkmal zu anderen Lesengeräten sind die zwei Bildschirme: ein schwarz-weißer zum Lesen und ein farbiger für das Nutzermenü. Und Anfang Januar 2010 will Plastic Logic seinen großen, vor allem für den geschäftlichen Einsatz konzipierten E-Book-Reader Quer Proreader präsentieren, der auf seinem robusten Display digitale Ausgaben von Magazinen und Zeitschriften in Originalgröße darstellen kann und als Touchscreen die Bedienung vereinfacht, ohne die Darstellung zu beeinträchtigen.


WolframAlpha fürs iPhone
20.10.2009, Connect
Im Mai dieses Jahres hat der Entwickler Steven Wolfram seine Antwortmaschine WolframAlpha an den Start gebracht. Im Gegensatz zu Suchmaschinen wie Google liefert WolframAlpha statt weiterführender Links Inhalte. Jetzt ist die Anwendung auch für das iPhone erhältlich. Im App Store können User WolframAlpha iPhone für knapp 50 Dollar herunterladen. Das Programm wurde für das Apple-Smartphone optimiert und bietet unter anderem ein spezielles Keyboard mit Sonderzeichen, über das beispielsweise komplexe Formeln eingetippt werden können. Die Ergebnisanzeige ist ebenfalls aufs iPhone abgestimmt, außerdem sind in WolframAlpha Funktionen wie Maps und andere Services des Smartphones eingebunden. Mit WolframAlpha ist das iPhone laut Anbieter unter anderem als wissenschaftlicher Taschenrechner nutzbar. Die Anwendung soll deshalb auch für Wirtschafts- und Finanzanalysen geeignet sein.
... mehr


VoiceCorp startet mit einer iPhone-Anwendung zur Sprachwiedergabe von RSS-Feeds
19.10.2009, Pressebox
VoiceCorp hat eine Anwendung für iPhone und iPod Touch entwickelt, die es den Anbietern von Web-Inhalten erlaubt, hochqualitative Podcasts aus ihren RSS-Feeds zur Verfügung zu stellen. Der automatisierte Podcast-Dienst basiert auf dem ReadSpeaker podCaster und ist ein Podcast-Player für das iPhone, der aus einem RSS-Feed eine Audio-Version erstellt und diese vorliest. Neben dem iPhone ist die Anwendung auch für Android-Telefone verfügbar. Versionen für Blackberry und Java sollen folgen. "Mit Hilfe der auf unserem ReadSpeaker podCaster basierenden iPhone-Anwendung werden Web-Inhalte für eine größere Zielgruppe zugänglich gemacht, da man hiermit genau jene Menschen erreicht, die sich Nachrichten und andere Web-Inhalte lieber anhören anstatt sie zu lesen", sagt Niclas Bergstrom, Geschäftsführer von VoiceCorp. "Dies kann von Menschen mit Leseschwäche bis hin zu Geschäftsleuten reichen, die die neuesten Nachrichten hören möchten, während sie mit etwas anderem beschäftigt sind."
... mehr


Neue Speech-to-Text-Funktion für Nortels Unified Messaging Platform
14.10.2009, TMC
Visual Voice ist eine gemeinschaftliche Entwicklung von SpinVox und Mutare Software und ermöglicht eine neue Speech-to-Text-Funktion für Nortels Unified Messaging Platform zur Verwaltung von Voicemail. Visual Voice überträgt gesprochene Inhalte einer Voicemail in geschriebenen Text und schickt diese Nachricht inklusive Anrufer-Name, Telefonnummer, E-Mail-Adresse und möglichem Audio-Inhalt an bis zu fünf E-Mail-Accounts oder jedes Smartphone, PDA oder Handy. "The SpinVox and Mutare Software powered Visual Voice capability for Nortel CallPilot will be a boon to business users, simplifying day-to-day communications and helping workers be more efficient and productive.", so Ben Crown, CEO von Mutare Software.
... mehr


Avaya Aura für den Mittelstand
12.10.2009, Avaya
Avaya stellt eine neue Version ihrer offenen Unified Communications (UC)-Plattform Avaya Aura™ für Unternehmen mittlerer Größe vor. Mit einem einzigen Server können Unternehmen mit 100 bis 2.400 Mitarbeitern künftig UC-Anwendungen zentral für bis zu 250 Standorte zur Verfügung stellen. Die neue Lösung ist eine der ersten Kommunikationslösungen, die mit der Avaya Aura System-Plattform eine standard-basierte Virtualisierungstechnologie nutzt. Avaya Aura für den Mittelstand läuft auf allen gängigen Servern, die von Avaya im Hinblick auf Sicherheit, Skalierbarkeit und Ausfallsicherheit zertifiziert worden sind.
... mehr


Prima Diktieren mit Spracherkennung Dictate
08.10.2009, Macwelt
Macspeech Dictate ist der Nachfolger des deutlich in die Jahre gekommenen iListen von Macspeech. Das neue Diktierprogramm basiert auf der bewährten Sprachengine von Dragon Naturally Speaking. Nun erschien die deutsch-lokalisierte Version. Nach der Installation ist lediglich ein kurzer Text zu diktieren, bevor das Mikrofon auf die eigene Stimme eingestellt ist und es richtig losgehen kann. Nach 15 bis 20 Minuten ist das komplette Eingangsprozedere erledigt. Es schadet aber nicht, möglichst bald vorliegende eigene Texte durch Dictate analysieren zu lassen, was im Unterschied zu früheren iListen-Versionen jetzt zuverlässig funktioniert. Damit wird der Spracherkennung auch selteneres Vokabular umstandslos hinzugefügt.
... mehr


VOICETRUST stellt Business Suites zur Sprecher-Erkennung vor
06.10.2009, Presse Anzeiger
Mit der "Enterprise Suite", der "Callcenter Suite" und der "Banking Suite" können insbesondere Callcenter und Finanzdienstleister nun auf ein Bündel von Modulen zur Sprecher-Erkennung zurückgreifen. "Mit einer breiten Palette an branchenspezifischen Lösungen reagieren wir auf das Bedürfnis vieler Wirtschaftszweige, gleichzeitig Sicherheit, Komfort und Effizienz zu steigern", sagt General Manager Joachim Fischer. Die "Enterprise Suite" basiert auf dem Industriestandard, den VOICETRUST mit seinem Password Reset gesetzt hat. Die "Callcenter Suite" ist auf bessere und sichere Kundenbetreuung spezialisiert. Und die "Banking Suite" gibt vor dem Hintergrund zunehmender Phishing-Attacken und Kartendiebstähle den Kunden von Banken und Kreditkartenfirmen zusätzliche Sicherheit.
... mehr


LG bringt Uhrenhandy auf den deutschen Markt
06.10.2009, heise online
Der koreanische Elektronikkonzern bringt sein zum Mobile World Congress im Februar angekündigtes Uhrenhandy GD910 auf den deutschen Markt. Bei der Bedienung setzt LG nicht nur auf den 1,4 Zoll großen Touchscreen, sondern auch auf Spracheingabe und eine Text-to-Speech-Engine. Viele Handy-übliche Funktionen vermisst man allerdings bei dem winzigen Uhrenhandy. Wer aber vor allem Wert auf eine schicke (und 91 Gramm schwere) Armbanduhr legt, kann aus acht verschiedenen Anzeigeformaten wählen. In Großbritannien war das Handy nur in einer limitierten Auflage erhältlich. In Deutschland soll das Gerät 999 Euro kosten.
... mehr


E-Book-Reader mit Handschrifterkennung
25.09.2009, heise online
Der Hamburger Anbieter für Sprachencomputer Hexaglot bringt einen E-Book-Reader mit Handschrifterkennung auf den deutschen Markt. Zur Bedienung steht außer mechanischen Tasten ein Plastikstift zur Verfügung, der das Zeichnen und Schreiben auf dem Display ermöglicht. Handschriftliche Notizen soll der Reader in Drucktext umwandeln können, Texte lassen sich zudem über eine virtuelle Tastatur schreiben.
... mehr


Informationen schnell organisieren - Intuitives Wissensmanagement mit semantischer Sprachtechnologie
25.09.2009, Informationsdienst Wissenschaft
Der Erfolg der Online-Enzyklopädie Wikipedia zeigt eindrucksvoll, dass Wikis sehr erfolgreich zum Wissensmanagement eingesetzt werden können. Doch in vielen anderen Fällen fehlen die Heerscharen von hoch-motivierten "Wikipedians", die in ihrer Freizeit mit großem Aufwand die Inhalte strukturieren und verbessern. Gerade in Unternehmen entwickeln sich Wikis oft unkontrolliert zu einem zwar reichhaltigen, aber unübersichtlichen Informations-Chaos. Damit gerät das Prinzip "Wiki" an seine Grenzen, denn schnell verliert der Einzelne den Überblick über die Fülle der Informationen. Mitarbeiter der Arbeitsgruppe "Ubiquitous Knowledge Processing" (UKP Lab) der TU Darmstadt erforschen derzeit unter Leitung von Prof. Dr. Iryna Gurevych, wie sich Ordnung in dieses Chaos bringen lässt.
... mehr


Erste sprachgesteuerte Projektplanung
22.09.2009, Pressebox
Als Zusatzprogramm zu Microsoft Project 2007 erlaubt es ProVokale, alle wesentlichen Befehle für die Pflege der Projektdaten per Sprache einzugeben. Insbesondere die komplexen Befehle wurden durch Spracheingabe verfügbar gemacht, sodass der Projektleiter sehr rasch einen vollständigen Termin- und Ressourcenplan erstellen kann, ohne die Maus und die Tastatur benutzen zu müssen. Durch diesen Ansatz muss der Projektleiter nicht wissen, wo sich die Befehle verstecken! Es genügt, dass er weiß, was er tun möchte und anstatt sich mit der Maus durch die verschiedenen Menüs zu klicken, konzentriert er sich auf die Eingabe der Daten.
... mehr


Avaya IP Office 5 bietet kleinen Unternehmen leichteren Zugang zu Unified Communications und besserem Kundenservice
21.09.2009, Avaya
Avaya präsentiert die neue Version von Avaya IP Office speziell für kleine und mittlere Unternehmen (KMU). Mit Release 5 der Anwendung können KMU Unified Communications künftig einfacher in ihre Geschäftskommunikation einbinden und damit ihren Kundenservice verbessern. Gleichzeitig stehen zahlreiche neue Funktionen zur Verfügung, die sowohl die Skalierbarkeit und Ausfallsicherheit der Lösung als auch die Produktivität von Unternehmen steigern. Mit dem neuen Release stehen auch Verbesserungen für den Einsatz im Contact Center an. So steht eine neue Anwendung für die Berichterstellung in Contact Centern zur Verfügung, die auch über das Internet zugänglich ist und einfacher installiert, aktualisiert und verwendet werden kann.
... mehr


Nuance Speak & See Suite für die vereinfachte PC-Nutzung
14.09.2009, Nuance Communications, Inc.
Nuance präsentiert die neue Softwarelösung Speak & See Suite. Mit vier verschiedenen Programmen in einem einzigen Softwarepaket (Spracherkennung, Vorlesefunktionen, Bildschirmlineal, Bildschirmvergrößerung und Farbüberlagerungen) unterstützt das System PC-Anwender, die mit Lese- oder Rechtschreibschwächen zu kämpfen haben, unter Sehschwäche oder –behinderungen leiden, Deutsch nicht als Muttersprache sprechen bzw. Fremdsprachen erlernen möchten. Schülerinnen und Schülern mit unterschiedlichen Voraussetzungen und Bedürfnissen bietet die Software einen einfachen Zugriff auf Texte und Informationen.
... mehr


Im Dialog mit der Maschine
11.09.2009, Funkschau
Die Sikom Software GmbH hat zusammen mit dem Fraunhofer Institut für Produktionstechnik und Automatisierung eine universelle Software-Schnittstelle zwischen Sprachplattformen und industriellen Software-Werkzeugen entwickelt. Damit wird es möglich, industrielle Applikationen in ihrem Softwarekern mit einer Sprachdialog-Eingabe zu versehen und Daten per Sprache direkt in das System einzugeben.
... mehr


Hände frei beim Autofahren
10.09.2009, Telenet
Das Telefonieren ist im Auto nur noch über Freisprechanlage erlaubt, die Bedienung anderer Geräte wie das Navigationsgerät per Hand in den USA bereits heute untersagt. Der Bedarf an Applikationen, die eine Steuerung elektronischer Geräte im Auto auch per Sprache oder Geste erlauben, wird demnach über kurz oder lang steigen – vom Komfort, die solche Anwendungen dem Nutzer bieten können, einmal ganz abgesehen. Mit FlexMedia präsentieren SemVox und Telenet auf der diesjährigen Internationalen Automobil Ausstellung (IAA) ein System, mit dem der Nutzer einfach und schnell, überall und jederzeit auf beliebige Geräte und Inhalte zugreifen kann.
... mehr


Nuance-Technologie für Mercedes-Benz und BMW
09.09.2009, Nuance Communications, Inc.
Die Spracherkennungslösung ’One-Shot Destination Entry’ von Nuance kommt ab sofort in den On-Board-Navigationsgeräten der aktuellen S-Klasse von Mercedes-Benz sowie in den neuen mobilen Traffic-Assistant-Navigationsgeräten Z204 und Z205 von Becker zum Einsatz. Mit der One-Shot-Destination-Entry-Technologie kann der Nutzer die komplette Zieladresse mit einem einzigen Sprachbefehl eingeben, statt wie bisher Schritt für Schritt, zuerst den Orts- und dann den Straßennamen anzugeben.
Auch die neuen BMW-Modelle setzen auf Nuance-Technologie für die sprachbasierte Musikwahl und Adresseingabe. Mit der neuen Systemgeneration haben BMW-Fahrer nun die Möglichkeit, in einem natürlichen Sprachfluss verschiedene Funktionen im Fahrzeug zu bedienen. Sie können per Spracheingabe nach Musiktiteln suchen und Zieladressen mit einem einzigen Sprachbefehl eingeben. Die Ablenkungsgefahr, die eine manuelle Eingabe mit sich bringt, ist dadurch drastisch reduziert.


Twittern und Chatten via Spracherkennung
02.09.2009, maccommunity
Die neue Version 3.4 des iPhone-Instant-Messaging- und Twitter-Clients IM+ bietet nun auch eine Spracherkennungs-Funktion. Damit lassen sich Sprachaufnahme in Text umwandeln. Somit ermöglicht die Anwendung das Twittern und Chatten per Spracheingabe. Bisher steht die Software allerdings nur für Englisch zur Verfügung.
... mehr


Google integriert Übersetzungsfunktion Translate in Office-Applikation
28.08.2009, golem.de
Nach Googles E-Mail-Dienst lernt jetzt auch die Office-Anwendung Google Docs Fremdsprachen. Durch die Integration der Übersetzungsfunktion Translate lassen sich Dokumente in 51 Sprachen übertragen. Die Ergebnisse der maschinellen Übersetzung lassen oft zu wünschen übrig, das gibt auch Google zu. Das Unternehmen arbeite aber "kontinuierlich daran, die Qualität der Übersetzungen mit der Zeit zu verbessern", heißt es.
Zu den 51 Sprachen, die Googles automatischer Übersetzungsdienst meistert, gehören unter anderem alle 23 offiziellen Sprachen der EU. Mittlerweile sind es 2.550 Sprachpaare - also Kombinationen von Urprungs- und Zielsprachen - in die Übersetzungen möglich sind.


Multimodale Eventsuche auf dem Handy
27.08.2009, Telenet
Auf der diesjährigen IFA präsentierten SemVox und Telenet ein gemeinsam entwickeltes System, das die Suche und Buchung von Veranstaltung noch einfacher, flexibler und vor allem mobiler gestalten soll. Der multimodale Eventkalender für das Handy bietet seinen Anwendern vollkommen neue Freiräume: Alle Anfragen können nach Belieben per Sprache, Tastatur, Gesten oder auch in Kombination eingegeben werden. Dank einer flexiblen kontextabhängigen Dialogsteuerung ist der Nutzer nicht an feste Menüvorgaben gebunden, sondern kann komplexe Anfragen wie "Welche Veranstaltungen finden nächstes Wochenende in München statt?" stellen. Das System liegt aktuell für alle Android-basierten Smartphones vor. Die Unterstützung weiterer Endgeräte ist in der Entwicklung.
... mehr


Nuance präsentiert Vocalizer 5.0 für Mobil- und Callcenter-Anwendungen
26.08.2009, Nuance Communications, Inc.
Mit dem Vocalizer 5.0 stellt Nuance eine Text-To-Speech-Lösung für Callcenter- und Mobilanwendungen vor. Die neue TTS zeichnet sich laut Nuance vor allem durch eine hohe Präzision und Zuverlässigkeit aus und zeigt bei der Wiedergabe von Namen und Adressen eine "nahezu fehlerfreie Sprachausgabe". Mit der Basic-Version bietet das Unternehmen darüber hinaus eine kostengünstige Lösung für Mobil- und Unternehmensanwendungen, die nur ein begrenztes Vokabular benötigen z.B. Währungs-, Datums-, Uhrzeit- oder Rufnummernansagen.
... mehr


Spracherkennung in Second Life integriert
25.08.2009. Informationsdienst Wissenschaft
Forscher des Fraunhofer-Instituts für Produktionstechnik und Automatisierung (IPA) integrierten ein Sprachdialogsystem in die virtuelle Welt von Second Life. Das System erlaubt es, mit Objekten in Second Life zu interagieren. "Wir wollten damit zeigen, wie einfach und schnell Spracherkennung heutzutage in bestehende An­wen­dun­gen integriert werden kann", sagt Daniel Wimpff, wissenschaftlicher Mitarbeiter am Fraunhofer IPA. Die einfache Integration von Sprachdialogen in beliebige Applikationen wird durch die Fraunhofer Voice Control API ermöglicht. Diese Schnittstelle wird wie ein Webservice angesprochen und überträgt die Kontrolle über das Sprachdialogsystem an das Anwendungsprogramm.
... mehr


Voxeo präsentiert Kommunikationsplattform Prophecy 10
25.08.2009, TMC
Im Rahmen der SpeechTEK 2009 präsentierte Voxeo das neue Release seiner Kommunikationsplattform Prophecy. Prophecy 10 ermöglicht es jedem Unternehmen eigene Unified Communications- und Selfservice-Anwendungen schnell und einfach zu erstellen und zu verwalten. Die neue Plattform wurde vor allem für Multi-Channel-Interaktionen optimiert. "By enabling multi-channel self-service with no additional development costs, Prophecy 10 can 'multiply the ROI' of any enterprise voice self-service investment.", so Jonathan Taylor, CEO von Voxeo.
... mehr


Nachbesserungen bei Wolfram Alpha
22.08.2009, heise online
Laut Stephen Wolfram, Urheber der semantischen Suchmaschine Wolfram Alpha, hat das Entwickler-Team seit dem offiziellen Start zwei wesentliche Fortschritte erreicht: Zum Einen wurden neue Wissensbereiche eingebunden und zum Anderen die linguistischen Funktionen überarbeitet. Fast in jedem zweiten Fall, in dem Alpha versagt hätte, wäre der Grund nicht etwa fehlendes Wissen gewesen, sondern schlicht der, dass die Maschine nicht verstanden hätte, was man von ihr wollte. Eine Analyse der Anfragen ergab, dass die gestellten Fragen von der linguistischen Struktur her deutlich anders ausfielen, als man das erwartet hatte.
... mehr


Patent auf stimmbasierten Lügendetektor
14.08.2009, SpeechTechMag
Charles Humble, Gründer des National Institute for Truth Verification (NITV) erhielt ein zweites Patent für seinen CVSA II (Computer Voice Stress Analyzer). Das System erfasst die Veränderungen von Frequenz und Modulation in der menschlichen Stimme, wenn jemand lügt. Der CVSA II ist schon bei mehr als 1800 Strafverfolgungsbehörden und dem US-Militär im Einsatz und ermöglicht die Analyse von Live-Gesprächen, Telefonaten und aufgezeichneten Konversationen. "CVSA is much less complicated than a polygraph," sagt Humble. "A polygraph uses a lot of squiggly lines that you do not necessarily know what they mean. This uses simple graphs that chart their stress levels."
... mehr


Vorbild Gehirn - wie Computer hören lernen
13.08.2009, Max-Planck-Gesellschaft
Sehen, Hören, Fühlen - die Wahrnehmungen, die das Gehirn scheinbar mühelos bewältigt, stellen Computer bisher noch oft vor unlösbare Aufgaben. Forscher des Leipziger Max-Planck-Instituts für Kognitions- und Neurowissenschaften und des Wellcome Trust Centre for Neuroimaging in London haben nun ein mathematisches Modell entwickelt, mit dem die maschinelle Wahrnehmung und Verarbeitung von gesprochener Sprache deutlich verbessert werden könnte. Das Modell basiert auf der Annahme, dass die Bedeutung der Informationen auf verschiedenen zeitlichen Ebenen für die Verarbeitung von Wahrnehmungsreizen wahrscheinlich sehr viel größer ist als bisher angenommen.
... mehr


Exposé vorlesen: Immowelt.de integriert kostenlose Sprachfunktion
11.08.2009, fairnews
Bei Immowelt.de können sich Immobiliensuchende die Objektbeschreibungen jetzt bequem vorlesen lassen. Die kostenlose Sprachfunktion ist in alle Immobilienbeschreibungen integriert und vervollständigt das multimediale Gesamtpaket der Immobilienplattform: Neben der mobilen Suche übers Handy bietet Immowelt.de auch eine innovative Freitextsuche, praktische Kartenansichten inklusive Umgebungsinformationen und eine FreeCall-Funktion, mit der Interessenten gratis Anbieter von Wohnungen und Häusern anrufen können. Umgesetzt wurde die Sprachfunktion von der Linguatec GmbH.
... mehr


Diktiersoftware ProMobile für BlackBerry Smartphones mit erweitertem Funktionsumfang
06.08.2009, firmenpresse
Die Diktierlösung ProMobile der Berliner Brainworks GmbH bietet einen schnellen Einstieg in die digitale Diktierwelt. Mit Hilfe der Software lassen sich zum Beispiel BlackBerry Smartphones zu professionellen Diktiergeräten erweitern, so dass ein zusätzliches separates Gerät nicht mehr notwendig ist. Im Rahmen der jüngsten Weiterentwicklung wurden zahlreiche Programmteile der Promobile-Familie überarbeitet und durch zusätzliche Funktionen ergänzt. Die Einbindung der Spracherkennung ermöglicht es jetzt, erstellte und gesendete Diktate direkt im Hintergrund durch den Spracherkennungsserver umzusetzen. Damit stehen sie dem Diktierenden in kürzester Zeit als Text zur Verfügung.
... mehr


Emotions-Check durch Spracherkennung
05.08.2009, Computerwoche
Einem Forscherteam der Universität Dallas ist es jetzt in Zusmmenarbeit mit Working Solutions, einem texanischen Beratungsunternehmen für Call Center Betreiber, gelungen, ein System zu entwickeln, das Ärger identifzieren und von Sprachschwankungen sowie störenden Nebengeräuschen unterscheiden kann. Damit ist es möglich, schneller Lösungsvorschläge für verärgerte Kunden bereitzuhalten. "Bislang können wir über unser Kontaktzentrum verärgerte Anrufer erst nach Tagen oder Wochen identifizieren, wenn es bereits zu spät ist.", so John Hansen, Leiter des Center for Robust Speech Systems an der Universität Dallas. Die Zukunft des Sprachanalyse-Tools liegt für Hansen daher ganz klar in der Verbesserung des Kundenerfahrungshorizontes.
... mehr


iPhone 3GS mit VoiceOver für blinde Menschen nutzbar
05.08.2009, heise online
Apples Implementierung der kostenlosen VoiceOver-Lösung in das iPhone wird von vielen blinden und stark sehbehinderten Menschen weltweit als eine Art "sprechende Revolution" wahrgenommen. Das iPhone 3GS ist nicht nur das erste vollständig blind bedienbare Touchscreen-Gerät der Welt, sondern bietet auch Menschen mit Seh- oder Hörproblemen spezielle Hilfen wie Vergrößerung oder weiße Schrift auf schwarzem Hintergrund. Marco Zehe, Qualitätsbeauftragter für Barrierefreiheit bei Mozilla und selbst blind, hat nach einmonatiger Nutzung des iPhone 3GS mit VoiceOver in seinem Blog nun über erste Erfahrungen berichtet: VoiceOver macht nahezu alle Funktionen des Geräts auch für blinde Menschen nutzbar.
... mehr


Fonix iSpeak 1.4 für das neue iPhone
31.07.2009, SpeechTechMag
Fonix Speech, ein Anbieter von integrierten Sprachverarbeitungslösungen, stellt mit Fonix iSpeak 1.4 Spracherkennungssoftware für das iPhone zur Verfügung. Mit der Anwendung wird sprachgesteuerte Anrufwahl per Name oder Nummer möglich, die vor allem auch in lauter Umgebung zuverlässig funktionieren soll. iSpeak erlaubt eine nahezu komplette Bedienbarkeit per Spracheingabe, ohne dass zusätzlich Tasten gedrückt werden müssen.
... mehr


Schlauer googeln dank Sprachforschung
30.07.2009, Informationsdienst Wissenschaft
Indogermanisten und Wirtschaftsinformatiker der Universität Jena haben gemeinsam ein Projekt ins Leben gerufen, das die Recherche über Suchmaschinen im Internet wesentlich übersichtlicher und weniger zeitintensiv gestalten soll. "Die Idee ist, unsere Erkenntnisse auf dem Gebiet der mehrdimensionalen Wortschatzvernetzung für praktische Anwendungen nutzbar zu machen", begründet Dr. Bock von Lehrstuhl für Indogermanistik die ungewöhnliche Kooperation von Sprachwissenschaftlern und Wirtschaftsinformatikern. Die Benutzerfreundlichkeit von Suchmaschinen ließe sich beispielsweise dadurch erhöhen, dass auch sinnverwandte oder Teilbegriffe als Treffer angezeigt und vorsortiert werden.
... mehr


Neue iPhone App hilft in Notsituationen
26.07.2009, aperto move
Der von der aperto move GmbH für die Bundesvereinigung der Deutschen Apothekerverbände entwickelte Apotheken-Notdienstfinder, der seit einiger Zeit unter der mobilen Kurzwahl 22833 bundesweit per Anruf oder SMS zu erreichen ist, wird nun durch eine iPhone App ergänzt. Egal wo, egal wann - 24 Stunden, Tag und Nacht, hilft die in der Zusammenarbeit mit der acceleract GmbH entwickelte Anwendung beim Auffinden der nächstgelegenen Notdienst-Apotheke. Zu jeder Apotheke werden alle relevanten Details wie Name, Adresse, Telefonnummer, Entfernung und Öffnungszeiten ausgegeben. Die Nutzer können sich die Apotheken auf einer Karte anzeigen und eine Anfahrtroute errechnen lassen. Steht keine Internetverbindung zur Verfügung, wird ein Anruf beim mobilen 22833 Apotheken-Notdienstfinder angeboten.
... mehr


Loquendo Spracherkennung für Dänisch und Finnisch
23.07.2009, Loquendo
Loquendo bringt seine Loquendo ASR für Dänisch und Finnisch auf den Markt. Damit unterstützt die Spracherkennung von Loquendo mittlerweile 24 Sprachen. Die finnische und dänische Sprachsynthese wurden bereits Ende des vergangenen Jahres veröffentlicht. Mit den beiden neuen Produkten stellt Loquendo damit beide Technologien – ASR und TTS – für drei skandinavische Sprachen zur Verfügung. Norwegisch soll in Laufe dieses Jahres noch folgen.
... mehr


Samsung Watchphone mit Spracherkennung kommt nach Frankreich
22.07.2009, engadget
Samsungs Handy im Armbanduhrenformat, das S9110, ist gerade einmal 11.98 mm dünn und lässt sich wie eine Uhr ums Handgelenk legen. Wer nur erreichbar sein möchte, dem reicht so ein kleines Gerät am Arm - wäre da nicht das Problem der Bedienbarkeit. Denn es ist nicht leicht, auf dem winzigen Touchscreen die Tasten zu treffen. Dafür verfügt das Samsung-Handy über Spracherkennung, so dass die Bedienung spielend leicht erfolgen soll. Für 450 Euro kann das Handy ab August in Frankreich erworben werden.
... mehr


Lumenvox Speech Engine 9.0
21.07.2009, PR-inside
Durch die Integration der LumenVox Speech Engine mit VXI* und der Asterisk-Telefonie-Plattform laufen nun VoiceXML-Applikationen problemlos auch unter Linux und Asterisk. Die sprecher- und hardwareunabhängige LumenVox Speech Engine ist ein standardbasierter Spracherkenner, der mehrere Sprachen unterstützt. Das System bietet darüber hinaus eine leistungsfähige Entwicklungs- und Laufzeitumgebung, die umfangreiche Logging-Funktionen mitbringt.
... mehr


Einkaufsliste per Spracherkennung: Der Smartshopper
17.07.2009, neuerdings.com
Mit dem SmartShopper Deluxe kann man seine Einkaufsliste per Zuruf erstellen. Das Gerät, dass einem das Leben leichter machen soll, kommt aus den USA und gehorcht aufs Wort: Dank der Spracherkennung, die über 2500 Lebens- und Haushaltsmittel, Pflegeprodukte und Büroartikel erkennt, muss man das Gewünschte nur in das Mikrofon des Geräts sprechen. So kann man nach und nach eine ganze Einkaufsliste erstellen. Geht man in den Supermarkt, kann man sich die Liste vorher ausdrucken lassen. Der Wortschatz des SmartShoppers lässt sich um 5000 nutzerdefinierter Wörter erweitern. Bisher versteht das Gerät allerdings nur Englisch und ist mit 99 Dollar auch nicht wirklich günstig.
... mehr


Intelligente Kleidung hilft Ärzten und Technikern
15.07.2009, heise online
Als Zukunftsvision und als eher erfolgloses Geschäftsmodell geistert die Vorstellung von in Kleidung integrierten Computern schon lange herum. Nun entwickelten Wissenschaftler am Technologie-Zentrum Informatik und Informationstechnik der Universität Bremen intelligente Kleidung für den Automobil- und Flugzeugbau, die Feuerwehr und fürs Krankenhaus. "Wir wollten, dass Arbeiter den Computer nutzen können, ohne dafür die Arbeit unterbrechen zu müssen", sagte Michael Lawo vom Technologie-Zentrum. Der innovative Arztkittel beispielsweise arbeitet über Sensoren, die sich in seinem Ärmel befinden. So kann der Mediziner das System durch Armbewegungen steuern. Patient und Arzt tragen zudem dünne Datenarmbänder, die auf Abruf alle Informationen auf den Bildschirm neben dem Krankenbett übertragen. Neue Einträge in die Patientenakte kann der Arzt während der Visite direkt per Spracherkennung aufnehmen. "So fallen zwei Stunden für die tägliche Nachbereitung weg", sagte Lawo. In einem österreichischen Krankenhaus sei die Technik bereits erfolgreich im Einsatz.
... mehr


Alex - Deutschlands neue Computerstimme
09.07.2009, SpeechConcept
In Zusammenarbeit mit CereProc, UK, entwickelte SpeechConcept im letzten Jahr mehrere Stimmprofile. Mit "Alex" wird zunächst eine männliche Synthesestimme angeboten, die durch ihre Natürlichkeit in Prosodie und Phonetik bestechen soll. "Woran TTS-Hersteller normalerweise jahrelang arbeiten, ist uns in relativ kurzer Zeit gelungen", so Entwicklungsleiterin Dr. Maria Strobel, "nämlich eine qualitativ hochwertige TTS-Engine zu produzieren, die ihresgleichen sucht." Die TTS steht in Kürze für alle marktgängigen Telefonieanwendungen und Desktoplösungen zur Verfügung. Einen besonderen Wettbewerbsvorteil sieht das Unternehmen darin, mit der CereVoice kostengünstig und kurzfristig sogenannte Corporate Voices anbieten zu können.
... mehr


Wunderman geht mit Telenet neue Marketingwege
08.07.2009, Pressebox
Auf einer virtuellen Geburtstagskarte im Web und mit Hilfe des Telefons können sich Frequent Traveller von Miles & More, dem Vielfliegerprogramm der Lufthansa, ihr Geburtstagsgeschenk erpusten. Das innovative und interaktive Voice&Web-Spiel wurde von der Telenet GmbH Kommunikationssysteme gemeinsam mit der Frankfurter Agentur Wunderman entwickelt. Die Einladung und den Zugang zum Spiel erhalten die Kunden per Mail. Per Telefon wird der Anwender individuell und personalisiert angesprochen und aufgefordert, Konfetti vom Bildschirm zu pusten. "Durch die innovativen Lösungen von Telenet im Bereich Sprachautomation eröffnen sich für uns als Werbeagentur neue kreative Möglichkeiten.", so Bernhard Beßendörfer, Management Supervisor bei der Agentur Wunderman, die das Projekt für Miles & More umgesetzt hat.
... mehr


Texterkennung mit dem Mac
08.07.2009, golem.de
Mit Exactscan 2 präsentiert Exactcode eine neue OCR-Software für MacOS X, die dafür konzipiert ist, Scans durchsuchbar zu machen. Das System unterstützt Englisch, Deutsch, Holländisch, Französisch, Italienisch, Portugiesisch, Spanisch und Schwedisch. Die Mac-interne Suchmaschine Spotlight und andere Desktopsuchmaschinen können die erkannten Bereiche aus den PDFs indizieren und bilden so die Basis für ein kleines Dokumentenmanagementsystem (DMS), in dem der Anwender mit Suchbegriffen recherchieren kann. Das Programm ist in einer Standard- und einer Professional-Version erhältlich. ExactScan 2 Professional kostet 109 Euro, die Standardvariante wird für 89 Euro angeboten.
... mehr


Voice-Control-API (VCA)
06.07.2009, Informationsdienst Wissenschaft
Leistungsfähige Sprachverarbeitungssysteme erobern momentan viele Wirtschaftsbereiche mit direktem Endkundenkontakt. Im industriellen Sektor führen sie jedoch noch immer ein Mauerblümchendasein. Dabei sind gerade in diesem Bereich die Vorteile einer Sprachsteuerung wie z. B. die Konzentration auf die Tätigkeit bei gleichzeitiger Einsetzbarkeit beider Hände ("hands free") sowie die räumliche Flexibilität durch moderne Kommunikationsmittel offensichtlich. Die vom Fraunhofer IPA entwickelte Voice-Control-API (VCA) soll Abhilfe schaffen und die Integration von Sprachverarbeitungssystemen in beliebige industrielle Applikationen ermöglichen.
Die VCA setzt sich in Form eines Vermittlers zwischen das Sprachsystem und die industrielle Anwendung. Dabei weist sie Standardschnittstellen nach beiden Seiten auf: SOAP ("Simple Object Access Protocol") zur Applikation und VoiceXML zum Sprachverarbeitungssystem. Als Transportmedium werden die Standardprotokolle des World Wide Web verwendet. Durch dieses plattformunabhängige Konzept und durch den leicht verständlichen Aufbau der VCA-Funktionen kann praktisch jede industrielle Applikation in kurzer Zeit "sprachfähig" gemacht werden.
... mehr


Suchmaschine für Fernsehbeiträge
01.07.2009, Fraunhofer
Wann wurde die Finanzkrise in der Tagesschau zum ersten Mal erwähnt? Was sagte doch gleich Merkel zur Präsidentschaftswahl? Bisher müssen Journalisten, Archivare und Medienbeobachter lange suchen, bis sie eine bestimmte Stelle in Sendungsmitschnitten finden. Oder sie investieren viel Geld in ein Spracherkennungssystem, das diese Aufgabe übernimmt. Doch solche Systeme mussten bisher von Experten regelmäßig auf den neuesten Stand gebracht werden und waren daher mit hohen laufenden Kosten verbunden. Die Forscher am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin haben nun ein System entwickelt, mit dem man kostengünstig in Fernsehbeiträgen recherchieren kann. "Unser System basiert auf einem Silbenlexikon statt auf einem Wortlexikon. Klassische Spracherkenner können nur eine begrenzte Zahl von Worten erkennen – die Zahl der existierenden Wörter ist jedoch unüberschaubar groß. Im Unterschied dazu ist die Anzahl verschiedener Silben handhabbar. Mit etwa 10 000 gespeicherten Silben können wir jedes Wort zusammensetzen", sagt Daniel Schneider, Forscher am IAIS.
... mehr


Uni Bremen: Sprechender Kaffeeautomat gibt auch Auskünfte
30.06.2009, heise online
Wissenschaftler der Universität Bremen haben einen Kaffeeautomaten entwickelt, der nicht nur acht verschiedene Sorten Kaffee servieren, sondern auch sprechen kann. "Wir haben die Maschine so programmiert, dass sie die entsprechenden Vokabeln und die Grammatik erkennt", erklärte die Informatikerin Hui Shi vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI). Der Automat kennt außerdem die Telefonnummern der Mitarbeiter am Institut, weist Gästen den Weg zu den Büros und weiß, wann die nächste Straßenbahn an der Uni abfährt. Zurzeit arbeiten die Wissenschaftler daran, dass das Gerät auch Gesichter erkennen kann. Damit könnte die Maschine seine Kunden auch persönlich ansprechen und deren Vorlieben speichern. "Die Gesichtserkennung ist noch im Anfangsstadium. Es wird noch einige Jahre dauern, bis es so weit ist", betonte Shi. Künftig könnte der Automat in Hotellobbys, Flughäfen oder öffentlichen Gebäuden als kaffeekochendes Infoterminal zum Einsatz kommen.
... mehr


Maschinen lesen das Internet: Internet-Analysewerkzeug für US-Armee entwickelt
29.06.2009, golem.de
Die Forschungsagentur des US-Verteidigungsministeriums, die Defense Advanced Research Projects Agency (DARPA), hat BBN Technologies mit der Entwicklung eines automatischen Texterkennungssystems beauftragt. Die DARPA stellt für das Machine Reading Program über fünf Jahre hinweg 29,7 Millionen US-Dollar bereit. Ziel des Vorhabens ist ein System, das Texte aus dem Web analysiert, die Informationen mit vorhandenen Datenbanken oder Ontologien abgleicht und daraus ein Dossier für menschliche Analysten oder KI-Systeme anfertigt. Die Technik soll zunächst militärischen Zwecken zugute kommen, könne aber auch für zivile Zwecke eingesetzt werden: In einer Zeit, da Bibliotheken über immer mehr digitale Inhalte verfügen, könnten Wissenschaftler es für umfangreiche historische Forschungen nutzen.
... mehr


iPhone 3G S: Sicherheitslücke bei der Sprachsteuerung
25.06.2009, MacWelt
Die Sprachsteuerung von Apples neuem iPhone 3G S sollte die Bedienung des Gerätes noch nutzerfreundlicher und das Telefonieren oder die iPod-Bedienung auch im Auto oder ähnlichen Situationen ohne weiteres möglich machen. Doch ein Nutzertest der Macwelt zeigt: Das neue Feature hat nicht nur Schwächen, sondern stellt eine ausgewachsene Sicherheitslücke dar. Denn die Sprachsteuerung hat einen großen Haken: Sie umgeht die Code-Sperre des iPhones, die Unbefugte von der Benutzung abhalten soll. Per Sprachsteuerung kann auch bei gesperrtem Telefon jede beliebige Nummer angerufen werden. Die iPod-Funktionen sind ebenfalls zugänglich, bergen aber kein Kostenrisiko für den Besitzer.
... mehr


Webkonferenzen und virtuelle Messen
23./25.06.2009, Informationsdienst Wissenschaft + Presseecho
Noch bis zum 23. August bietet Cycos Unternehmen die Möglichkeit, das Webconferencing-Modul der Unified Communications(UC)-Software mrs Vanguard kostenlos zu testen. Mit der Testversion können bis zu fünf User an Webkonferenzen teilnehmen. Cycos Webconferencing ist eine besonders einfach zu handhabende Lösung, wenn es darum geht, bis zu 100 Teilnehmer von unterschiedlichsten Orten weltweit an einen "virtuellen" Tisch zu bekommen. Wenn sich das Unternehmen nach der Testphase für die Lösung entscheidet, besteht die Möglichkeit, die Anwendung in eine Unified Communications-Umgebung einzubetten.

Eine Messe erleben, ohne auf eine Messe zu fahren - das bietet jetzt die Universität Mannheim Studieninteressierten mit einem virtuellen "Tag der Wirtschaftsinformatik". Am 6. und 7. Juli 2009 können Internetnutzer durch Veranstaltungsräume "laufen", Vorlesungen anhören und Messestände besuchen. Die technische Grundlage für die virtuelle Messe wurde von drei ehemaligen Doktoranden der Universität Mannheim entwickelt, die planen, die Technologie auch über den akademischen Rahmen hinaus einzusetzen. So ist beabsichtigt, die Event-Plattform auch in Zusammenarbeit mit Unternehmen zu nutzen. Diese könnten durch den Einsatz virtueller Events nicht nur Raumprobleme lösen, sondern auch Ihren Kunden Zeit und Kosten sparen.


Valuescope Finsights geht mit erster Version live
17.06.2009, Live-PR
Valuescope, Spezialist für semantische Technologien im Vertriebsumfeld, geht mit der ersten Version von Finsights, einer Online-Plattform speziell zur Aggregation von Finanznachrichten, live. Finsights greift auf valuescope's fortschrittliche Technologie automatisierter Sprachverarbeitung zurück, die neben Schlüsselwörtern Ontologien und Taxonomien nutzt, um Texte zu klassifizieren und deren Relevanz zu beurteilen. Auf das Feld der Finanztechnologie angewandt, werden automatisch relevante Branchenereignisse aus einer überwältigenden Menge an Internetinhalten gefiltert und über eine leicht bedienbare Benutzeroberfläche übersichtlich aufbereitet dargestellt. Am Ende steht ein leistungsstarkes Werkzeug, das insbesondere für Vertriebs- und Marketingverantwortliche hilfreich ist, die nach Ansprechpartnern im mittleren Management suchen.
... mehr


Flexibles Echtzeit-Monitoring für virtuelle Call Center
14.06.2009, Gunnar Sohn
In der Callcenter-Branche wird Flexibilität groß geschrieben. So arbeiten die Agenten immer häufiger an wechselnden Standorten und Arbeitsplätzen für ein- und dieselbe Hotline. Moderne Softwarelösungen wie die webbasierte Automatic Call Distribution (ACD) der Deutschen Telekom verbinden dabei Anrufer automatisch mit dem richtigen Ansprechpartner. Obwohl räumlich von einander entfernt, werden die Agenten mit der ACD zu Teilnehmern eines großen virtuellen Callcenters: Anrufer wählen eine Servicenummer und erreichen stets einen Gesprächspartner - ganz egal, wo dieser sitzt. Um die Effizienzpotenziale eines virtuellen Callcenters voll auszuschöpfen, benötigen Anwender ausgefeilte Instrumente für die Steuerung und das Monitoring des Telekommunikationsverkehrs. Um für die ACD ein solches flexibles Echtzeit-Monitoring zu realisieren, hat das Dortmunder Softwareunternehmen VoicInt Telecommunications GmbH sein "Web Enterprise Monitoring" an die Call Center-Plattform der Deutschen Telekom angebunden. Damit stehen ACD-Nutzern nun umfassende Informationen, Statistiken und Kennzahlen parallel zu den laufenden Prozessen bereit.
... mehr


Apple präsentiert sein neues iPhone 3GS
11.06.2009, heise online + golem.de + connect
Das "S" im Namen des neuen iPhone 3GS steht für "Speed", denn Dank neuer Hardware soll das Handy etwa doppelt so schnell arbeiten wie sein Vorgänger. Darüber hinaus ist das neue Smartphone von Apple mit Sprachsteuerung ausgestattet. Damit kann zukünftig sowohl die Telefonfunktion als auch iTunes per Sprachbefehl gesteuert werden. Und das Gerät antwortet sogar in gesprochener Sprache. Apple demonstrierte auf seiner Entwicklerkonferenz WWDC 2009 die Musikwiedergabe per Sprachkommando: Auf die Frage, welches Lied gerade gespielt wird, nennt das Gerät Interpret und Titel. Das neue iPhone soll am 19. Juni auf den Markt kommen.

Noch im Juni 2009 will Navigon die Navigationssoftware MobileNavigator für das iPhone 3G anbieten. Die Software funktioniert auf allen iPhones mit der neuen Firmware iPhoneOS 3.0 und somit auch auf dem neuen iPhone 3GS. Der MobileNavigator umfasst die von anderen Navigationsgeräten von Navigon bekannten Komfortfunktionen, wie Reality View Pro, Tag-und-Nacht-Modus, Geschwindigkeits- sowie Fahrspurassistent Pro. Außerdem lassen sich Points of Interests (POIs) einblenden. Die Software kann das iPhone-Adressbuch nutzen, um sich bequem zu eingetragenen Adressen leiten zu lassen. Navigon verspricht, dass es den MobileNavigator im Juni 2009 über den App Store geben wird.

Das Berliner Unternehmen Textunes, das elektronische Bücher für mobile Endgeräte anbietet, hat für das iPhone eine besondere Form von E-Books entwickelt: eine Kombination aus digitalem Text und Hörbuch. Der Nutzer lädt das digitale Buch auf sein iPhone und kann dann wählen, ob er ein Kapitel lieber liest, anhört, oder ob er multimedial gleichzeitig lesen und hören möchte. Die kombinierten Text-Audio-Bücher träfen "das Lebensgefühl der urbanen Zielgruppe", sagt der Textunes-Geschäftsführer. Sie könnten den Text "in der U-Bahn lesen, und wenn man umsteigen muss, dann wird eben aufs Hörbuch umgeschaltet."

Und noch eine neue App für das iPhone: Voicesafe soll dem iPhone-Nutzer mehr Sicherheit gewähren, denn mit Hilfe dieses Programms lässt sich das Apple-Smartphone nur mit der eigenen Stimme öffnen. "Vergessen Sie Ihre Passwörter, das ist sicherer. Ihre Stimme ist Ihr Passwort", wirbt darum der Hersteller Voicetrust. Laut der Münchner Entwicklerfirma sind mit dem so genannten "mobilen Geheimnisspeicher" die Zeiten vorbei, in denen das Handy neugierigen Mitmenschen persönlichste Geheimnisse über dessen Besitzer verriet.


woopla verbindet 6 Millionen Twitter User per Telefon
09.06.2009, openPR
Die auf interaktive Sprachapplikationen spezialisierte woopla GmbH aus Duisburg startet mit twitwoop eine Web&Voice-Applikation für den Consumerbereich und spricht damit 6 Millionen Nutzer des Microblogging-Dienstes Twitter an. Mit twitwoop haben registrierte Twitter-Nutzer die Möglichkeit, Sprachnachrichten per Telefon aufzunehmen und diese direkt in Ihre eigene Twitter-Timeline zu stellen. woopla hat hierfür die von Twitter angebotene API vollständig in die eigenen IVR-Systeme integriert. Zur Nutzung des Dienstes müssen registrierte Twitter-User zunächst Ihre Rufnummer unter twitwoop.com freischalten. Nach erfolgter Freischaltung kann eine der Einwahlrufnummern in Grossbritannien, den USA oder Deutschland genutzt werden. Hinterlassene Nachrichten werden mit einem numerischen Antwortcode versehen. Über diesen haben andere User wiederum die Möglichkeit, per Telefonanruf zu antworten.
... mehr


Genesys integriert UC-Lösungen von Fremdanbietern
08.06.2009, Genesys
Genesys bringt UC-Connect auf den Markt, eine Software zur Unterstützung der Interoperabilität zwischen der Genesys Customer Interaction Management (CIM) Software Plattform und den UC-Lösungen anderer großer Anbieter. Laut Genesys kann die CIM-Plattform mithilfe von UC-Connect direkt mit Alcatel-Lucents MyInstant Communicator, IBM Sametime, Microsoft Office Communications Server 2007 und Siemens Openscape verbunden werden. Genesys-Kunden können durch den Einsatz von UC-Connect also künftig selbst bestimmen, welche UC-Software sie nutzen.
Daneben bietet UC Connect noch weitere Features. Zum Beispiel überprüft die Software die Verfügbarkeit von Experten und informiert anschließend nicht nur, welche Experten namentlich für ein Kundengespräch zu Verfügung stehen, sondern auch welche Skills diese jeweils bieten.
... mehr


Google Wave: Der Echtzeit-Wiki-Kommunikator
29.05.2009, NeueNachricht + heise online
Wissensmanagement in Unternehmen und geeignete IT-Werkzeuge sind zentrale Stütze der Projektarbeit. Die Studie "Kollaborieren oder Kollabieren" der mind Business Consultants zeigt jedoch, dass ein Großteil der "Wissensarbeiter" sich von den ihnen zur Verfügung gestellten Arbeitsmitteln nicht ausreichend unterstützt fühlt.

Das neue Produkt Google Wave schließt hier eine empfindliche Lücke. Google Wave ist ein Echtzeitkommunikator, der neben synchroner Kommunikation (Instant-Messaging, Chat) auch das gemeinsame Editieren von Dokumenten in Echtzeit erlaubt. Auf diese Weise werden nicht nur Entwicklungsprozesse optimiert - auch das Managemet wird dabei unterstützt, den aktuellen Projektstatus zu identifizieren, Aufgaben zu verteilen, deren Erledigung zu verfolgen und das Geleistete zu dokumentieren.


Bing: Microsofts neue Suchmaschine
28.05.2009, heise online
Microsoft bringt seine neue Suchmaschine Bing auf den Markt und nimmt damit einen neuen Anlauf ins lukrative Geschäft der Internet-Suche. Bing wird in Zukunft die Windows Live Search komplett ersetzen. Noch heute würden rund 30 Prozent aller Suchanfragen ohne Ergebnis abgebrochen, erläutert Microsoft-Managerin Dorothee Ritz. Bing solle dagegen den Nutzern mit einem verbesserten Index deutlich mehr relevante Ergebnisse liefern. Auf der Startseite von Bing werden die Anwender ähnlich wie bei Google neben einer globalen Suche auch zwischen verschiedenen Suchkategorien auswählen können. Dazu zählen "Bilder", "Videos", "Shopping", "News" und "Maps". Für komplexe Suchanfragen, wie etwa im Zuge einer Kaufentscheidung, werden für den deutschsprachigen Markt künftig die Ergebnisse der User-Bewertungssite Ciao eingebunden.

Bislang waren Microsofts Bemühungen im Suchmaschinen-Markt weniger erfolgreich: Im vergangenen Jahr lag Microsofts Marktanteil hier bei 4,8 Prozent, während Google mit einem Anteil von 81 Prozent die Konkurrenz weit hinter sich ließ.
... mehr


Druckergeräusche verraten Patientenakten und Kontodaten
27.05.2009, Informationsdienst Wissenschaft
Mit einer Kombination aus automatischer Spracherkennung und maschinellem Lernen ist es einer Forschergruppe um Michael Backes, Professor für Kryptografie und Informationssicherheit an der Universität des Saarlandes, gelungen, über 70 Prozent der auf einem Nadeldrucker gedruckten Texte zu rekonstruieren - allein über die Auswertung der Druckergeräusche. Damit die Nadeldrucker ihre Geheimnisse preisgeben, mussten die Wissenschaftler einige Vorarbeit leisten: Sie druckten zunächst ein Wörterbuch aus, zeichneten die entsprechenden Druckgeräusche auf und ordneten in einer Datenbank den Wörtern das jeweils charakteristische Tonmuster zu. Die Herausforderung bestand dann darin, bei weiteren Tonaufnahmen die Wörter automatisch zu erkennen und Störgeräusche, wie zum Beispiel Patientengespräche in einer Arztpraxis, herauszufiltern.

Mit dieser Methode gelang es den Forschern über 70 Prozent der Wörter herauszufiltern und damit die meisten Inhalte einer Patientenakte oder Angaben auf Kontoauszügen zu verstehen. Auch einzelne Zahlen wie etwa Geheimnummern von Konten können auf diese Weise mit erstaunlich hoher Trefferquote erkundet werden.
... mehr


Yahoo! oneSearch Voice vereinfacht mobile Suche durch Spracherkennung
26.05.2009, Presseportal
Yahoos Web-Suche soll Smartphone-Besitzern künftig aufs Wort gehorchen. Mit "oneSearch Voice" gestaltet Yahoo die Suche im mobilen Internet für seine User noch einfacher und bequemer: Statt Suchbegriffe auf einem Touchscreen oder einer winzigen Handytastatur mühsam einzutippen, können die Anwender künftig ihre Anfragen einfach per gesprochener Sprache eingeben. Die Ergebnisse werden wie bisher bei der mobilen Yahoo-Suche üblich angezeigt. Ab sofort ist die Anwendung "oneSearch Voice" für Smartphones mit Symbian- oder Windows-Mobile-Betriebssystem erhältlich. Auch Blackberrys und Apples iPhone werden unterstützt.
... mehr


Across Systems präsentiert Plattform für "Enterprise Language Intelligence"
26.05.2009, goodnews.de
Across Systems präsentierte auf der Localization World in Berlin mit Across v5 eine neue Plattform für die mehrsprachige Unternehmenskommunikation. In Across v5 werden Konzepte für das Übersetzungsmanagement adaptiert, Unternehmen erlangen so mehr Kontrolle über Sprachressourcen und über die oft komplexen Übersetzungsprozesse. Mechanismen des Text- und Data-Minings ermöglichen es, Fremdsprachenfassungen beliebiger Texte - z.B. Produktkataloge oder Bedienungshandbücher - mit maximaler Effizienz wiederzuverwenden. Gegenüber bisherigen Systemen soll dadurch der Aufwand für Übersetzungen weiter reduziert werden, bei gleichzeitiger Steigerung der Qualität.
... mehr


Wolfram Alpha - die Wissensmaschine ist online
16.05.2009, golem.de
Stephen Wolframs Wissensmaschine berechnet aus gegebenen Daten Antworten auf konkrete Fragen aus unterschiedlichen Wissensgebieten - von Mathematik und Statistik über Chemie und Medizin bis hin zu Sprache, Kultur und Medien. Wie bei Google & Co. kann in das Textfeld auf Wolfram Alphas Webseite eine Anfrage eingegeben werden. Das Ergebnis jedoch besteht nicht aus einer Liste von Links auf Webseiten, deren Text einen oder mehrere der Suchbegriffe enthalten, sondern aus einer übersichtlichen Zusammenfassung der passenden Fakten und Quellenangaben und je nach Thema zusätzlich aus Schaubildern, Diagrammen und Karten.

Die Frage nach einem Becher Orangensaft beantwortet Wolfram Alpha mit einer entsprechenden Nährwerttabelle. Wird aber nach einem Becher Orangensaft plus einer Scheibe Cheddar-Käse gefragt, so erhält der Nutzer die Summe der Nährwerte. Wer nach gelb plus rot fragt, bekommt orange als Antwort, nebst Daten wie RGB- und HSB-Wert sowie den entsprechenden Hexadezimalcode.

Was jetzt von Wolfram Alpha zu sehen ist, sei nur der Anfang, betont Stephen Wolfram. Es handle sich um ein langfristig angelegtes Projekt.
... mehr


Sprachsteuerungssoftware für indische Landwirtschaft
14.05.2009, heise online
Das Hochschulteam der TU Dresden "The Liaisoners" überzeugte im Deutschland-Finale des Imagine Cups in Berlin mit seinem "Talk to aAqua" Projekt. Die prämierte Software soll indischen Landwirten helfen, Ratschläge von Agrarexperten einzuholen. Viele der Bauern sind Analphabeten und können daher den SMS-basierten Beratungsdienst nicht nutzen, der zur Verbesserung ihrer Anbaumethoden eingerichtet wurde. Nun können sie via Sprachsteuerung mit den Experten in Kontakt treten. Ein telefonbasiertes Sprachdialogsystem überwindet die Barrieren des SMS-basierten Frage-Antwort-Dienstes und die Fragen werden per Sprachnachricht in einem Forum hinterlassen.

Der Imagine Cup wurde vor sieben Jahren von Bill Gates ins Leben gerufen und wird seither als internationaler Wettbewerb jährlich von Microsoft ausgerichtet. Das diesjährige Motto des Wettbewerbs lautete: "Technologie für eine bessere Welt".
... mehr


Der IRISnotes 1.0 spart Zeit, Nerven und liegt im Trend
13.05.2009, Firmenpresse
Der IRISnotes des belgischen Herstellers I.R.I.S. erkennt handgeschriebene Notizen bereits während des Schreibens und überträgt sie per Funk auf einen kleinen Empfänger. Über diesen Empfänger gelangt der Text dann via USB-Kabel zum Rechner. Dort kann er gespeichert und bei Bedarf weiterverarbeitet und wie jedes andere digitale Text-Dokument verwendet werden. Im Offline-Modus kann der handgeschriebene Text auf dem Empfänger gespeichert und später auf den Rechner übertragen werden. Mit dem Stift wird wie gewohnt auf Papier geschrieben. Die mitgelieferte Texterkennungssoftware erkennt handgeschriebenen Text in 22 Sprachen.
... mehr


Nuance präsentiert OmniPage 17
13.05.2009, Nuance Communications, Inc.
Die aktuelle Version der OCR-Software Omnipage bietet eine erhöhte Erkennungsgenauigkeit, erweiterte 3D-Korrekturtechnologien und neue Funktionen für Smartphone-Anwender. "Bei OmniPage 17 hat sich Nuance zuerst auf das wichtigste Element für die Dokumentkonvertierung konzentriert: die Erkennungsgenauigkeit. Die neue Version liefert bei der Konvertierung von Papierdokumenten in editierbare elektronische Dokumente daher eine erstaunliche Präzisionssteigerung von vierzig Prozent", kommentiert Robert Weideman, General Manager der Nuance Document Imaging Division.

OmniPage Professional 17 wird Ende Mai über das weltweite Händlernetzwerk von Nuance erhältlich sein. Der Preis für Einzelanwender von OmniPage Professional 17 beträgt EURO 299,00, OmniPage Standard 17 ist zu einem Preis von EURO 99,00 erhältlich. Außerdem wird OmniPage Professional 17 bis zum 30. Juni 2009 zum Einführungspreis von EURO 99,00 angeboten.
... mehr


Intelligentes Rückrufmanagement mit Voxtron Contact Center Suite agenTel
12.05.2009, Pressebox
Das agenTel Rückrufmanagement-Modul sichert durch seine automatische Wahlsteuerung korrekte Rufnummern und schützt vor Tippfehlern durch Agenten. Besetzte Anschlüsse, Anrufbeantworter und Faxgeräte identifiziert das System selbsttätig und verhindert unnötige Ausfallzeiten. Faxgeräte lassen sich automatisch mit einem Marker versehen. Technisch gesehen werden aktive und passive Rückrufe unterschieden. Passive Rückrufe reagieren auf Anrufe, die in der Warteschlange vom Anrufer abgebrochen wurden, während aktive Rückrufe über das integrierte Sprachportal angenommen werden. Als Teil der agenTel Contact Center Suite ist das neue Modul herstellerunabhängig an nahezu jeder Telefonanlage nutzbar.
... mehr


Das Internet der nächsten Generation
04.05.2009, FAZ.net
Stephen Wolfram hat erstmals seine Suchmaschine der Öffentlichkeit vorgestellt. Wolfram selbst bezeichnet seinen Dienst als Computational Knowledge Engine, der, anders als eine Suchmaschine wie Google, auf systematisch aufbereiteten Datenquellen aufbaut, die für natürlichsprachliche Anfragen durchsuchbar gemacht werden. Die Frage nach der Zahl der Internet-Nutzer in Europa etwa beantwortet Wolfram Alpha mit 289,9 Millionen, während Google einen Link zur Seite „Internetworldstats“ bringt, wo der Nutzer selbst weitersuchen muss.
... mehr


Elektronischer Horchposten mit Microsoft-Genen
04.05.2009, FAZ.net
Linguatec, das bislang die betagte IBM-Spracherkennung unter dem Namen Voice Pro vertrieben hat, setzt nun auf die in Vista eingebaute Spracherkennung von Microsoft und vertreibt das Programm als Voice Pro 12 zu Preisen von 70 bis 370 Euro. Michael Spehr probierte für die F.A.Z. die Premium-Variante für 170 Euro, die gegenüber dem kleinsten Paket ein Fachvokabular aus den Bereichen EDV, Wirtschaft, Sport, Wissenschaft und Technik mitbringt und die Outlook-Bedienung ebenso wie den Einsatz von Diktiergeräten erlauben soll. Fazit: Beschäftigt man sich länger mit Voice Pro 12, stößt man an Grenzen.
... mehr


"He, Nudlaug, wos is?" - Computer spricht jetzt Wienerisch
30.04.2009, derStandard.at
Im Rahmen des vom Wiener Wissenschafts-, Forschungs- und Technologiefonds geförderten Projekts sollten effiziente Methoden gefunden werden, um synthetische Stimmen für Sprachen zu entwickeln, die Varianten einer anderen Sprache sind. In der sprachgesteuerten Kommunikation wird die Natürlichkeit der Interaktion immer wichtiger. „Dafür brauchen wir eine qualitativ hochwertige Sprachsynthese für verschiedene Sprachen und deren Varianten“, so Projektleiter Dr. Michael Pucher. Zwei Jahre benötigten die Forscher des Forschungszentrum für Telekommunikation Wien, um eine TTS zu entwickeln, die verschiedene Wiener Dialekte beherrscht. Praktisch umgesetzt werden sollen die Forschungsergebnisse in einem mobilen Bezirksinformationssystem. Vorerst kann man den synthetisierten Wiener Dialekt nur im Rahmen eines interaktiven Restaurantführers für den ersten Wiener Bezirk unter der Wiener Rufnummer 890 40 55 70 51 hören.
... mehr


IBM-Computer soll Jeopardy gewinnen
28.04.2009, Focus online
In der populären amerikanischen Quizshow „Jeopardy“ will der Computerkonzern IBM zeigen, dass seine Computer Menschen schlagen können. Verglichen mit den Herausforderungen von Jeopardy ist Schachspielen für einen Computer geradezu ein Kinderspiel. Statt eine beschränkte Anzahl von Zügen vorherzuberechnen und zu analysieren, muss der Computer hier nämlich Entscheidungen treffen. „Um Entscheidungen zu treffen, muss der Computer riesige Mengen von Daten nach bestimmten Mustern durchsuchen, alle Auswahlmöglichkeiten abwägen und schließlich schnell und akkurat antworten“, erklärt IBM-Manager Samuel Palmisano.
Eine der größten Herausforderungen dabei ist die menschliche Sprache. Mit den unterschiedlichen Bedeutungen von Worten kommen Menschen prima klar, für Computer sind sie jedoch ein kaum zu überwindendes Hindernis. Kommen noch Wortspiele und subtile Irreführungen hinzu – wie bei „Jeopardy“ üblich – stoßen selbst Supercomputer an ihre Grenzen. Nicht pure Rechenkraft sondern eine intelligent programmierte Software soll das Problem lösen.
... mehr


Verständige Maschinen: Spracherkennung nach Vorbild menschlicher Kognition
22.04.2009, Informationsdienst Wissenschaft
Im Rahmen des Cognitive Systems Programms der EU leitet die Bremer Jacobs University ein dreijähriges Verbundprojekt zur Spracherkennung nach dem Vorbild menschlicher Kognition. Basierend auf den neuronalen Grundlagen menschlichen Sprachverstehens sucht das interdisziplinäre ORGANIC-Forscherteam nach völlig neuen Wegen in diesem Bereich der Künstlichen Intelligenz und verspricht Lösungen für die seit langem ungeklärten Probleme computergestützter Spracherkennung. Da Menschen das flexible Sprachverständnis spielend beherrschen, will das Team soviel wie möglich von menschlichen Gehirnen und den am Sprachverständnis beteiligten Prozessen lernen. Dies ist ein natürlicher, aber keineswegs selbstverständlicher Forschungsansatz: Alle heute existierenden Spracherkennungssysteme basieren auf Forschungen, die sich nie mit Biologie und Funktionsweise von Gehirnen beschäftigt haben. Grundlage war vielmehr eine rein mathematisch-statistische Analyse der Sprachsignale, wie sie von Mikrophonen aufgenommen werden - eine "nachrichtentechnische" Herangehensweise, die offensichtlich prinzipiell zu kurz greift. ... mehr


iPhone bald mit integrierter Sprachsteuerung?
21.04.2009, golem.de
Seit der Einführung des iPhones ist kritisiert worden, dass Apple keine Sprachsteuerung bereitstellt. Dies soll sich nun Gerüchten zufolge ändern: Es gibt Hinweise darauf, dass mit der neuen iPhone-Firmware Spracherkennung und TTS in das Betriebssystem integriert werden. Zum Einsatz kommen diese Technologien aller Voraussicht nach im Rahmen des Voice-Activated Dialing und im Rahmen der ebenfalls neu angekündigten Spotlight3.0-Suche. Bislang unklar ist, ob diese Neuerung auch auf bestehenden iPhones genutzt werden kann oder ob der Endkunde erst ein neues Gerät erwerben muss.
... mehr


Microsoft Exchange Server 2010: Multichannel-Lösung inklusive Voice2Text-Funktion
15.04.2009, heise online
Die Beta-Version des Microsoft Exchange Server 2010 steht seit wenigen Tagen zum Download bereit. Interessant an diesem Produkt sind vor allem die erweiterten Möglichkeiten im Zusammenspiel mit Voice: Durch die verbesserte Integration von Telefondiensten können Voice-Mails künftig auch direkt über Outlook angehört werden. Für die englische Sprache bietet Microsoft zudem eine Voice2Text-Funktion an, mit der Sprachnachrichten in Text konvertiert werden können. In der finalen Version, die für die zweite Jahreshälfte 2009 geplant ist, soll es zusätzlich möglich sein, einen Exchange-Server direkt vom Telefondienst-Anbieter als Voice-Mailbox adressieren zu lassen.
... mehr


OCR für Android und iPhone
14.04.2009, heise online
Die Firma Abbyy Europa hat ihr Produkt „Mobile OCR Engine 3.0 Software Development Kit“ jetzt auch in Android und iPhone integriert. Mithilfe dieser Software kann Text in Bildern erkannt und in maschinenlesbares Format transferiert werden. Ein beliebter Anwendungsfall ist beispielsweise das Einlesen von Visitenkarten. Da die Technologie von Abbyy bereits in allen anderen wichtigen mobilen Plattformen - Windows Mobile, Symbian und Linux - integriert ist, dürften sich in Zukunft funktionale Erweiterungen ausnahmslos auf das Produkt von Abbyy stützen.
... mehr


Philips SpeechMike und Dragon Naturally Speaking jetzt kompatibel
11.04.2009, FAZ.net
Für die Nutzerfreundlichkeit von Diktiersoftware kann es von großem Vorteil sein, wenn die Navigation nicht per Sprache, sondern über einen anderen Kommunikationskanal vorgenommen werden kann. Dies wird durch Produkte wie das SpeechMike von Philips möglich: Befehle wie Diktierbeginn- und Diktierende können damit per Knopfdruck an das System übermittelt werden. Leider war die weit verbreitet Diktiersoftware Dragon Naturally Speaking bislang nicht mit Mikrofonen von Marktführern wie Philips oder Olympus kompatibel. Philips bietet deshalb seit kurzem unentgeltlich eine Windows-Software, Speech-Control, an, mit der diese Lücke geschlossen wird. Neben Dragon Naturally Speaking lässt sich das SpeechMike, dank Speech-Control, auch für andere Diktier-Anwendungen verwenden.
... mehr


Hitachi nutzt multimodale Sprachlösung von Zetes
10.04.2009, autoid-ready
Für das neue Warenlager in den Niederlanden hat der Logistikanbieter Hitachi Transport Systems sich für eine multimodale Lösung von Zetes entschieden. Mit mobilen Sprachterminals und Scannern kommunizieren die Mitarbeiter direkt mit dem Zentralrechner. Neben der Mobilität, die mit dieser Lösung möglich wird, ist vor allem die geringe Fehleranfälligkeit zu erwähnen. Da alle Mitarbeiter mit dem gleichen System ausgerüstet sind, können außerdem bei Bedarf problemlos die Arbeitsbereiche gewechselt werden, was zu mehr Flexibilität und im Endeffekt zu höherer Produktivität führt.

Stef Wildschut, Manager Logistics Engineering Department von Hitachi Transport Systems, zeigt sich zufrieden mit der neuen Lösung: „Als Teil einer japanischen Unternehmensgruppe fiel die Entscheidung für die Einführung von Sprachtechnologie nicht ohne weiteres, da diese Technologie in Japan noch nicht so bekannt ist. Aus diesem Grund kombinieren wir, auf Wunsch eines unserer Kunden, Mitsubishi, nach wie vor Sprache und Scannen. Zetes überzeugte uns von den Vorzügen der Lösung und bisher wurden alle Erwartungen zu unserer vollsten Zufriedenheit erfüllt. Wir erwägen daher nun, Sprachtechnologie auch in anderen Gebieten einzusetzen.“
... mehr


Neue Innovationen im UC-Bereich: Voice, Web und Telefonie wachsen zusammen
31.03./06.04.2009, SpeechTechMag + Opusresearch
Die Technologien wachsen weiter zusammen – und Voice spielt weiterhin eine wichtige Rolle. Die Firma Jaduka hat jüngst ihr Produkt Jaduka Voice Notification vorgestellt, mit dem Sprachnachrichten per E-Mail direkt über den Telefonkanal verschickt werden können.

Die erste Vernetzung von Twitter mit Voice wurde von der Firma Quicktate ins Leben gerufen. Das Produkt TweetCall ist derzeit kostenlos und setzt gesprochene Twitter-Nachrichten in Text um. Dabei gilt, wie bei Twitter üblich, eine Begrenzung von 140 Zeichen, was in etwa 25 Wörtern entspricht. Laut Lee Dorfman, CEO von Quicktate, wird sich in Zukunft auch eine Integration von TTS, die in der Lage ist, den emotionalen Gehalt der Nachrichten widerzuspiegeln, in Twitter lohnen.


Neue alte Sprachsoftware: IBM Via Voice kehrt zurück
03.04.2009, Computerwoche
IBM Via Voice war in Sachen Spracherkennung viele Jahre der Gegenspieler zu Dragon Dictate. Dann verschwand das Produkt vom Markt, IBM hatte kein Interesse mehr an einer gemeinsamen Weiterentwicklung mit Linguatec. Mittlerweile hat Linguatec mit Microsoft einen neuen Kooperationspartner gefunden und bietet nun eine runderneuerte Version von Via Voice als Voice Pro an. Somit ist das Quasi-Monopol von Nuance’s Produkt Dragon Naturally Speaking vorerst wieder gebrochen.
... mehr


IBM treibt Unified Communications voran
02.04.2009, neuerdings.com
Durch IBMs neue Unified-Communications-Lösungen sollen Unternehmen nicht nur effektiver arbeiten und Kosten senken können – generell soll auch der Übergang zu Unified-Communications auf der bestehenden Infrastruktur erleichtert werden. Herzstück im Unified-Communications-Portfolio von IBM ist der Lotus Sametime Unified Telephony Server (SUT), der sowohl mit neuen als auch bereits installierten Systemen arbeitet. SUT bringt dadurch Sprachkommunikation in die am meisten genutzten Geschäftsanwendungen ein. Um sicherzustellen, dass Kunden SUT leicht in die bestehende IT-Infrastruktur implementieren können, kündigte IBM ein umfangreiches Validierungsprogramm an, an dem führende TK-Ausrüster wie Alcatel-Lucent, Avaya und Siemens teilnehmen.
... mehr


Telisma bringt Spracherkennung für Afrikaans und South African English auf den Markt
31.03.2009, Telisma
Gemeinsam mit einem lokalen Partner, CatchWorld, ein Pionier der Sprachtechnologie im südlichen Afrika, hat Telisma eine neue Spracherkennung für Afrikaans und South African English entwickelt. Die neue Software ist kompatibel mit den am häufigsten eingesetzten Voice-Plattformen, unter anderem Avaya, Cisco, Envox-Syntellect, Genesys, HP, Holly, OnMobile und Voxeo.

Die Einführung von Spracherkennung, speziell in Südafrika, dürfte sich lohnen: Mit über 42 Millionen Mobilkunden ist Südafrika eine der am schnellsten wachsenden Mobile Communities der Welt. Zudem wird Afrikaans bzw. South African English nicht nur in Südafrika, sondern auch in umliegenden Ländern wie Botswana und Angola aber auch in Australien und Neuseeland gesprochen.
... mehr


T-Mobile vs. Skype: Streit um die iPhone-App
30.03.2009, winfuture + heise online
Über den AppStore steht seit kurzem Skype für iPhone und iPod kostenlos zum Download zur Verfügung. Die Internettelefonie ist für iPhone-Nutzer aber nur über private oder öffentliche Funk-Netzwerke möglich - nicht aber über UMTS. T-Mobile will es so: Apples deutscher Partner lässt sich durch Skype seine Mobiltelefonie-Einnahmen nicht vermiesen.

“Smartphone kaufen, Datenflatrate abonnieren, billig per Skype telefonieren.” Genau das versucht T-Mobile zu verhindern. Offiziell begründet das Unternehmen die Skype-Blockade mit dem “Schutz der Netz-Performance”. “Dass durch die Skype-Nutzung das Netz überlastet wird, kann ebenso als vorgeschobenes Argument angesehen werden wie die Behauptung, dass Kunden sich bei T-Mobile beschweren würden. Ich glaube vielmehr, dass durch die Nutzung der VoIP-Software die etablierten Spielregeln in Gefahr geraten und T-Mobile seine Gatekeeper-Funktion mit aller Macht aufrecht erhalten will. So ist denkbar, dass Kunden den günstigsten iPhone-Tarif buchen und ihre Gespräch dann über Skype führen. Noch gravierender ist sicherlich der Kontrollverlust. Über Skype kann gechattet und weitere Zusatzdienste genutzt werden. Die Dose der Pandora hat sich also schon geöffnet”, erklärt der Düsseldorfer Unternehmensberater Bernhard Steimel von Mind Business Consultants.


Nortel mit neuen Produkten – speziell für den Healthcare-Bereich
27.03.2009, SpeechTechMag + TMC
Ungeachtet der wirtschaftlichen Lage entwickelt Nortel weiterhin neue Lösungen im Voice- und UC-Bereich: Das Contact Center 7.0 ist eine flexible UC-Lösung, die nun auch den Microsoft Office Communications Server (OCS) integriert.

Gerüchten zufolge will Nortel sich außerdem auch weiter im Healthcare-Markt etablieren. Aus Insider-Kreisen heißt es, dass hier 500 Millionen US-Dollar investiert werden sollen. Diese Investitionen sind Teil eines 5-Jahres-Plans, bei dem eine Reihe von Produkten für verschiedene vertikale Märkte entwickelt werden sollen.


Nandoo.net: Neue Software für das Semantic Web
23.03.2009, Meedia
CyberConsult und die Universität Potsdam, unter der Leitung des Linguisten Manfred Stede, arbeiten an einer neuen Software für semantische Analyse: Nandoo.net. Die intelligente Software spürt selbständig Nachrichtentexte zu einem bestimmten, vom Nutzer vorgegebenen Thema auf. Dadurch wird sie auch für den automatisierten Customer-Service relevant – etwa, wenn es um das Sortieren von Emails oder um das Auspüren von Kundenfeedback zu bestimmten Produkten geht. Zwar sind die Funktionen von Nandoo.net als solche keine Neuerung – neu ist aber laut Hersteller die Qualität der gelieferten Suchergebnisse: "...mit Unwichtigem werden Sie in Zukunft gar nicht mehr belästigt“, so Produktmanager Bernd Mrohs. Um die Performance der Suchmaschine stetig zu verbessern, können die Nutzer sie selbst auf einfache Weise trainieren.
... mehr


Aastra optimiert Prozesse in der Altenpflege durch mobile Technologien
20.03.2009, pressebox
Aastra hat dem Arbeiter- und Samariterbund (ASB) Mainz in diesen Tagen den Abschlussbereicht zum Projekt „Das intelligente Heim“ vorgelegt. Im Rahmen des vom Landesministerium für Soziales, Arbeit und Familie in Rheinland-Pfalz geförderten Modellprojekts hat Aastra eine Lösung realisiert, die den bürokratischen Aufwand in der Altenpflege spürbar reduziert – für die von Kürzungen und Einsparungen gebeutelte Branche eine große Stütze, zumal so mehr Zeit für die persönliche Patientenbetreuung bleiben soll. „Der Einsatz innovativer Technik zählt zu den Kernelementen, mit denen soziale Einrichtungen und Pflegeheime die sich ständig ändernden Bedingungen im Gesundheitswesen erfüllen und gleichzeitig eine qualitativ hochwertige und effektive Versorgung pflegebedürftiger Menschen gewährleisten können. Angesichts der gesetzlichen Vorgaben, der Medienbrüche zwischen verschiedenen Technologien und fehlender Handlungsleitlinien zur Pflegedokumentation verursachte die Dokumentation erbrachter Leistungen in der Altenpflege bislang einen erheblichen zeitlichen und bürokratischen Aufwand.“, erklärt Thomas Althammer, bei Aastra verantwortlich für HealthCare-Solutions. Besonders erwähnenswert ist die mobile Leistungserfassung per DECT-Telefon: Durch diese Technologie können zeitnah, beispielsweise vor Ort in Bewohnerzimmern, Patientenwerte erfasst und dokumentiert werden. Pflegeberichte können auf Wunsch per Spracherkennung eingegeben werden.
... mehr


Sprachtechnologie im Web: Blog-Einträge, News und Emails per TTS
16./19.03.2009, heise online + Marketing-Börse
Sprachtechnolgie und Internet wachsen zusammen. Ein einfaches Anwendungsszenario, welches vor allem für das Mobile Web wertvoll ist, ist das Readback von Web-Inhalten per TTS.

Die schwedische Firma Voicecorp stellt mit dem webReader ein solches Produkt vor. "Wir haben uns die Rückmeldungen einer Menge kleinerer Internetseiten und Blogs genau angeschaut. Daraufhin haben wir viel Arbeit investiert um ein Paket zu entwickeln, das zu diesen Kunden passt. Es gibt auch eine gebührenfreie, mit Werbebannern finanzierte Version speziell für kleine Internetauftritte und Blogs.", erklärt CEO und Firmengründer Niclas Bergström. Anwendung findet der webReader bereits auf der Seite der Techniker Krankenkasse oder auf heise online.

Ein ähnliches Produkt stellte die Firma Evalanche, eine Agentur für E-Mail Marketing vor. Das aktuelle Release V 3.1 bietet die Möglichkeit, sich Newsletter, News und Emails per TTS ausgeben zu lassen.


Optimales Suchmaschinenmarketing: Grundlagen des Natural Language Processing
16.03.2009, marketingpilgrim
Qualitativ hochwertige Suchmaschinen-Optimierung (SEO) und Marketing (SEM) stehen und fallen mit den Suchmaschinen – allen voran Google. Um hier optimale Ergebnisse zu erzielen, sind Grundkenntnisse im Natural Language Processing (NLP) sehr hilfreich: Dies ermöglicht das Anpassen von Website-Inhalten auf die am häufigsten genutzen Suchmaschinen. Marie-Claire Jenkins, Spezialistin für Sprachtechnolgie an der University of East Anglia, erklärt im Interview den Zusammenhang von NLP und SEO/SEM.
... mehr


Small Talk – der iPod shuffle spricht
11.03.2009, Apple
Stark in ihrer Größe reduzierte Interfaces und steigende Software-Komplexität stellen die mobile Technologie vor eine große Herausforderung. Hier wird Sprachtechnologie schon lange als vielversprechende Lösung gehandelt. Für den neuen iPod shuffle setzt Apple zwar keine Spracherkennung zur Systemsteuerung ein – wohl aber eine TTS für die Systemrückmeldungen. Bei einer Größe von 45,22 mm x 17,5 mm bleibt auch kaum eine andere Wahl: Der Nutzer navigiert mithilfe einer im Kopfhörerkabel eingelassenen Bedieneinheit, während Titel und Playlists per TTS ausgegeben werden. Insgesamt soll die Handhabung des Apple-Produkts gewohnt einfach sein – dies verspricht zumindest die Guided Tour auf der Homepage des Herstellers.
... mehr


Neue mobile Sprachapplikationen drängen auf den Markt
02.-09.03.2009, TMC, Nuance Communications, opusresearch, news.de, heise online
Stetig gibt es Neuerungen auf dem mobilen Voice-Markt, vor allem für Apples iPhone: Die Firma Metaphor Solutions stellt mit SayMedia eine Voice Search Anwendung für das iPhone vor. SayMedia ermöglicht die sprachgesteuerte Suche nach Medien wie Musiktiteln und Filmen, zum Beispiel bei Youtube, aber auch Filmkritiken und Kinoprogramme können mit SayMedia via iPhone abgerufen werden.

Ebenfalls für das iPhone entwickelt: ShoutOUT, die erste Voice-to-SMS Anwendung von Promptu Systems. Promptu plant darüber hinaus noch weitere Vorstöße in die mobile Voice2Text-Welt: Ausweitungen auf Twitter, Email oder Facebook sind laut Promptu-CEO Giuseppe Staffaroni schon in naher Zukunft denkbar.

Eine weitere iPhone-Anwendung, die demnächst auf den Markt kommen soll, ist Speeek!, ein Produkt von BB Softservice Corp. aus Tokio. Speeek! ist ein erweitertes Lexikon: Die Software erkennt gesprochene Lexikoneinträge, übersetzt sie in eine andere Sprache und gibt das Übersetzungsergebnis per TTS aus.

Einen ganz anderen Hintergrund hat die Anwendung TokTok von Ditech Networks. Diese Anwendung lässt sich per Spracherkennung, sogar während eines Telefongesprächs, aufrufen. Mit TokTok können Nutzer eigene Sprachnotizen verfassen und dank der Integration in web-basierte Dienste z.B. Sprachnachrichten via Facebook verschicken

Schließlich hat noch Nuance die Verfügbarkeit von Nuance Mobile’s VSuite 3 und XT9 auf Samsung Memoir angekündigt. Die integrierte Spracherkennung unterstützt bei der Navigation, während XT9 das Verfassen von Textnachrichten durch intelleigentes Vervollständigen (“predictive text support”) erheblich erleichtert. So wird nicht nur das Verfassen von SMS und Emails vereinfacht, auch das Eingeben von URLs wird erheblich komfortabler.

Und zu guter Letzt: Amazons umstrittener E-Book-Reader Kindle ist nun auch auf dem iPhone verfügbar. Der Streit um die Vertonungsrechte ist inzwischen ebenfalls beigelegt: Auf Wunsch der Autoren kann die Vorlesefunktion für die betreffenden Werke deaktiviert werden.


SpinVox verwandelt Skype-Voicemails in Textnachrichten
03.03.2009, Pressebox
Durch das Zusammenspiel von Spinvox und Skype wird eine noch höhere Erreichbarkeit gewährleistet – Spracherkennung und Multichannel-Technologie machen es möglich. Spinvox-Technolgie konvertiert Skype-Sprachnachrichten in Text und versendet diese per SMS auf das Mobiltelefon. Der Service ist für die Sprachen Englisch, Spanisch, Französisch und Deutsch verfügbar und bedarf keiner zusätzlichen Software auf dem Mobiltelefon.

"Durch SpinVox erhalten unsere Nutzer zusätzliche Flexibilität und mehr Bedienkomfort", sagt Mike Bartlett, Director of Product Strategy bei Skype. "Da die Menschen immer häufiger unterwegs und dabei auf ihre mobilen Geräte angewiesen sind, wollen sie auch ihre Skype-Unterhaltungen immer dabei haben. SpinVox bietet die großartige Möglichkeit, die empfangenen Nachrichten direkt und unmittelbar auf das Mobiltelefon gesendet zu bekommen und so Zeit zu sparen."
... mehr


Die IT wächst zusammen: Innovative Neuerungen in der Unified Communications
03./06.03.2009, Avaya, searchnetworking.de
Neuerungen im Bereich der Unified Communications lassen die Kommunikationstechnologie weiter zusammenwachsen: Avaya stellt das erste Media Phone der Produktfamilie Avaya one-X Deskphone (Serie 9600) vor. Mit diesem Gerät können Anwender über einen Farb-Touchscreen direkt auf Anwendungen und internet-basierte Informationen zugreifen. Das Gerät bietet integrierte Funktionen, die Anwender bislang von mobilen Geräten wie PDAs kennen - etwa den Zugriff auf eine QWERZ-Tastatur, Taschenrechner, Straßenkarten oder Wetterberichte. Zudem können Nutzer auf dem Bildschirm durch ihre Kontakte scrollen oder Bedienfelder aufrufen. Bei Bedarf können weitere Features aus dem Internet heruntergeladen werden

Ferrari Electronic hat mit dem OfficeMaster Gate UC ein neues Mediagateway angekündigt. Das von Microsoft zertifizierte Gerät verbindet klassische ISDN-Telefonie mit den IP-basierten Plattformen Office Communications Server 2007 und Exchange Server 2007. Auf Wunsch kann der OfficeMaster um die Dienste Fax, SMS oder Voicemail erweitert werden. „Durch das ausgereifte Zusammenspiel mit dem Office Communications Server 2007 können Unternehmen die Microsoft-/Ferrari-Technologien als vollwertige Telefonanlage oder als Ergänzung zur vorhandenen PBX einsetzen“, erläutert Christoff Wiethoff, Vertriebs- und Marketingleiter von Ferrari Electronic


Revolution in der Künstlichen Intelligenz? Neue Suchmaschine Wolfram Alpha vor der Markteinführung
10.03.2009, Spiegel online
Stephen Wolfram, bekannter Physiker, “Wunderkind” und Erfinder der Software Mathematica, will im Mai seine neue “Computational Knowledge Engine” Wolfram Alpha vorstellen. Glaubt man den Ankündigungen und dem Urteil namenhafter Semantic Web-Experten wie Nova Spivack, dann wird Wolfram Alpha Suchmaschinen wie Google weit in den Schatten stellen. Wolfram Alpha greift nicht bloß auf Datenbanken zurück, es “berechnet” die Antworten zu vom Nutzer gestellten Fragen. Genauer gesagt, werden aus natürlichsprachlich formulierten Anfragen Formeln generiert, welche auf eine Wissensbasis zugreifen. Laut Wolfram wird die Knowledge Engine “uns beinahe an den Punkt bringen, von dem die Menschen schon vor 50 Jahren dachten, dass Computer ihn erreichen würden". Die Erwartungen damals waren sehr hoch - man darf gespannt sein auf das GoLive im Mai 2009.
... mehr


Entwicklungswerkzeug für Sprachanwendungen: Das VoiceWorksModule von Telenet
09.03.2009, Telenet
Mit dem Entwicklungswerkzeug VoiceWorksMobile (Arbeitstitel) von Telenet können laut Hersteller in kürzester Zeit mit eigenem Personal multi-mandantenfähige und mehrsprachige Sprachanwendungen entwickelt und implementieret werden. Dadurch, dass VWM Java-basiert ist, kann es mit geringem Zeitaufwand einer breiten Masse von Entwicklern zugängig gemacht werden.
... mehr


Loquendo bringt neue Version von VoxNauta auf den Markt
23.02.2009, SpeechTechMag
Mit VoxNauta 7.1.0 hat Loquendo eine neue Version seiner VoiceXML/CCXML-Plattform auf den Markt gebracht – und das nur wenige Monate nach dem Release von Version 7.0.25. Zwar soll VoxNauta 7.0 nicht vom Markt verschwinden, aktiv angeboten wird in Zukunft jedoch lediglich Version 7.1.

Zu den Neuerungen zählen ein standardisierter CCXML-Interpreter nach aktueller W3C-Norm und die Möglichkeit, VoxNauta als Media Resource Function einzusetzen, wodurch im Rahmen eines RFC 4240 SIP Protokolls Conference-Calls initiiert oder Ansagen abgespielt werden können. Außerdem können Anwender nun via VXML alle Features der Loquendo-Technologien gezielt nutzen.
... mehr


Voice Pro 12 - verbesserte Spracherkennung von Linguatec
19.02.2009, Pressebox
Laut Linguatec wurde die Erkennungsgenauigkeit der neuen Version auf bis zu 99 Prozent verbessert. Um diese Quote zu erreichen, hat das Unternehmen die akustischen Modelle erheblich erweitert. Mit der neuen Funktion SpeechCorrect sollen auch Homophone kein Problem mehr sein. Eine Satz wie: "Nach Lektüre des logischen Empirismus von Friedrich Waismann weiß man wirklich mehr" soll demnach fehlerfrei in Text umgesetzt werden. Und die neuen SmartCommands erlauben dem Nutzer die Eingabe komplexer Anweisungen wie: "E-Mail schreiben an Jörg Hoppe mit Betreff Unser Meeting". Die Spracherkennungssoftware ist ab dem 27. März in fünf verschiedenen Versionen erhältlich.

... mehr


Emotions-Radar: Erkennen, was den Kunden bewegt
18.02.2009, Informationsdienst Wissenschaft
Kommerzielle Marken und Produkte sind immer stärker abhängig von über Online-Medien verbreiteten Trends und Meinungen – zu diesem Ergebnis kommt auch die aktuelle Studie von Genesys zur Generation der Millenials. Passend dazu bringt das Fraunhofer IAIS mit dem “Online-Emotions-Radar” ein wichtiges Instrument zur Erfassung von emotionalen Stimmungen zu Marken und Produkten auf den Markt. Der Emotions-Radar basiert auf einem statistischen Verfahren und ist auf verschiedenste Anwendungsdomänen optimierbar. Auf der CeBIT wird exemplarisch das Ergebnis einer Analyse zu bekannten Autoherstellern vorgestellt. Dazu wurden ca. 1 Million deutschsprachiger Online-Beiträge ausgewertet. Resultat ist eine Zuordnung der prominentesten Basisemotionen wie Ärger, Freude und Ablehnung zu den jeweiligen Marken.
... mehr


Microsoft Recite: Software für Sprachnotizen
16.02.2009, golem
Mobiltelefone, auf denen man Sprachnachrichten als akustische Notiz hinterlegen kann, sind nicht Neues. Mit Microsoft Recite können diese Notizen jetzt aber auch per gesprochener Sprache durchsucht werden. Aufnahme und Suche sind dabei ganz einfach über das Interface getrennt: Für eine Aufnahme drückt der Nutzer den Button „Remember“, für eine Suche den Button „Search“. Die Suche basiert dabei nicht auf klassischer Spracherkennung, sondern mit Voice Pattern Matching auf einer eigentlich eingeschränkteren Technologie. Stathis Papaefstathiou, Produktmanager bei Microsoft, sieht viele mögliche Szenarien, in denen Microsoft Recite zum Einsatz kommen könnte – zum Beispiel beim Aufsprechen von Einkaufslisten, Geburtstagen, Adressen oder spontanen Ideen.
... mehr


Sprachcomputer sollen Gefühle erkennen
16.02.2009, Informationsdienst Wissenschaft
Die Anstrengungen der Forschung zur maschinellen Spracherkennung beliefen sich bislang vornehmlich auf die Identifikation des rein linguistischen Gehalts im akustischen Sprachsignal. Neben der linguistsichen Komponente besteht ein Sprachsignal jedoch noch aus der sogenannten paralinguistischen Komponente, zu der neben permanenten Eigenschaften wie Alter und Geschlecht des Sprechers auch der emotionale Zustand gehört. Dieser emotive Aspekt des Sprachsignals wird schwerpunktmäßig am Lehrstuhl für Systemtheorie und Signalverarbeitung der Universität Stuttgart erforscht. Mithilfe von Sprachdatenbanken und statistsichen Verfahren werden Sprecher nach Basisemotionen wie Ärger oder Freude klassifiziert. Der Mehrwert für Anwendungsbereiche wie Automotive oder Service-Center liegt auf der Hand.
... mehr


ESTOS und Aastra zertifizieren Kommunikationsanwendungen für Unified Communications
13.02.2009, Aastra DeTeWe GmbH
Softwarehersteller ESTOS und Telekommunikationsspezialist Aastara haben zwei Anwendungen für Unified Communications mit CTI zertifiziert, welche sich nahtlos in die bestehende Infrastruktur mit bereits eingesetzten ERP- und CRM-Systemen einfügen. Dadurch soll die Konvergenz in der Unternehmenskommunikation weiter vorangetrieben werden. Einheitlichkeit in den Technologien wie z.B. VoiP und die konsequente Ausrichtung an Standards, z.B. SIP, gewährleistet die Integration von Kommunikationstechnologien in die klassischen IT-Anwendungen von Unternehmen. Eine zentrale Rolle spielt dabei die Computer Telephony Integration.
... mehr


Neue Version der Dialoganalyse-Software “Qualityobserver”
13.02.2009, funkschau
Die Firma Next Level Speech stellt den Qualityobserver 2.0 vor – eine aktualisierte Voice-Analytics Software. Nach Aussage von Next Level Speech zeichnet sich die neue Version vor allem durch eine verbesserte Spracherkennung aus. "In unserer Version 2.0 stecken Erkenntnisse aus über zwei Millionen echten Kundengesprächen", stellt Geschäftsführer Thomas Riegel fest. Voice-Analytics Software wie der Qualityobserver dient insbesondere dazu, “auffällige”, d.h. nicht einer bestimmten sprachlichen Norm entsprechende Telefongespräche, herauszufiltern, um anschließend die Agenten entsprechend “nachzuschulen”. Was dabei als Norm gelten soll und was nicht, kann der Anwender jeweils selbst festlegen. Als Input für die Analyse dienen dem Qualityobserver 2.0 nicht nur die Äußerungen des jeweiligen Service-Agenten, sondern auch die des Anrufers.
... mehr


Angel.com kombiniert SugarCRM mit Sprachtechnologie
02.02.2009, SpeechTechMag
SugarCRM, ein beliebtes Open Source Tool zur Pflege von Kundendaten, gibt es nun auch als Multichannel-Lösung. Dank der Integration von Sprachtechnologie durch Angel.com kann SugarCRM jetzt komplett via IVR gesteuert werden. Neben der mobilen Nutzung von Stammdaten sind noch weitere wertvolle Funktionen vorgesehen: Das Aufnehmen von Notizen, das Anlegen von Aufgaben und das Erstellen und Senden von E-Mails mithilfe von Spracherkennung. Ahmed Bouzid, Director of Partner Solutions bei Angel.com, betont vor allem den Vorteil der Kostenersparnis dieser neuen Voice-Lösung: Dadurch, dass der IVR Anrufer und Kontext des Anrufs jeweils bekannt seien, würden Anrufe von drei bis vier Minuten Länge im Schnitt auf 20 Sekunden reduziert, so Bouzid.

... mehr


Amazons neues Kindle
09./11.02.2009, FAZ.Net + golem.de
Amazon präsentierte am Montag dieser Woche das neue Modell seines E-Book-Readers Kindle auf einer Pressekonferenz in New York. Das digitale Lesegerät fällt mit 9 mm deutlich dünner aus als der Vorgänger, wiegt 289 Gramm und hat sich von seinem kantigen Design verabschiedet. Wer ein Kindle 2 besitzt, kann sich künftig den digitalen Lesestoff auch vorlesen lassen, anstatt ihn nur zum Lesen anzuzeigen. Das aber verletzt nach Ansicht des US-Schriftstellerverbandes Author's Guild die Urheberrechte der Autoren. "Sie haben nicht das Recht, ein Buch laut vorzulesen", sagte der Chef der amerikanischen Autorenvereinigung Paul Aiken. Amazon selbst bezeichnet die Ausgabe per TTS noch als experimentell.
... mehr


Intelligenter Raum hört und sieht Nutzer
05.02.2009, Pressetext Schweiz
Der im Rahmen des EU-Projektes CHIL bereits 2004 entworfene „Smart Room“ wird nun von Forschern der Universitat Politècnica de Catalunya (UPC) vor allem im Bereich Sprach- und Geräuscherkennung auf Vordermann gebracht. Das gesprochene Wort kann das System bereits ausreichend verstehen und entsprechend reagieren. Der Forschungsschwerpunkt liege deshalb auf der Erkennung akustischer Ereignisse, erklärt der projektbeteiligte Wissenschaftler Josep Ramón Casas. „Geräusche, die keine gesprochenen Worte sind, werden normalerweise nicht erkannt“, beschreibt Casas eine Einschränkung aktueller Systeme. Dabei sind für Menschen auch Schritte, das Geräusch einer Tür, die geöffnet wird, oder das Ablegen von Gegenständen Hinweise darauf, was um sie herum geschieht. In Zukunft werde eine Art Geräusch-Karte erstellt, mit der Sprecher lokalisiert werden können, so Casas über seine Forschung.
... mehr


Websites hören auf‘s Wort
04.02.2009, Computerzeitung
Die von Materna zum Patent angemeldete Technologie VoiceFlash soll dafür sorgen, dass Anwender ihre Websites ohne Tastatur und Maus per Sprachbefehl steuern können. Mit der Technologie sollen sich auch Webformulare vollständig ausfüllen lassen. VoiceFlash soll nicht nur auf dem heimischen Computer, sondern auch mobil - auf dem Handy oder Smartphone - zum Einsatz kommen. Die Interaktion mit Webinhalten via plattformübergreifender Sprachsteuerung bedeutet für Webentwickler auch die Möglichkeit, das Problem der Barrierefreiheit von Webseiten ein Stück weit zu entschärfen. VoiceFlash soll auf dem Mobile World Congress vom 16.-19. Februar in Barcelona vorgestellt werden.
... mehr


IBM: Computerstimmen sollen menschlicher werden
02.02.2009, Windows Online Magazin
Der Technologiekonzern IBM will die Ausgabe per Sprachsynthese deutlich natürlicher klingen lassen. Monotone oder abgehackt klingende Computerstimmen gehören damit der Vergangenheit an. In Zukunft werden TTS-Stimmen weniger steril wirken und bewusst nicht perfekt sein. So sorgt die neue Technologie beispielsweise dafür, dass das Sprechtempo variiert und an passenden Stellen Pausen eingefügt werden. Ein weiteres Mittel der „Vermenschlichung“ ist das Einstreuen der verbreiteten Fülllaute wie „äh“ und „hm“. Diese Laute werden in der Sprache für gewöhnlich nicht wahrgenommen, ihre Integration habe aber einen profunden psychologischen Effekt, so Andy Aaron vom Sprachforschungsteam bei IBM: Der Anrufer fühlt sich bei der Kommunikation mit dem Sprachcomputer deutlich wohler.
... mehr


Computer 'lernen' vom Menschen
30.01.2009, Informationsdienst Wissenschaft
Um Maschinen leidliches Sprachverstehen und intelligentes Verhalten zu ermöglichen, waren bislang oft regelbasierte Systeme im Einsatz. Derartige Systeme müssen von Experten in mühsamer Handarbeit erstellt und optimiert werden und sind meist hochkomplex. Seit Begründung der KI in den 1960er Jahren träumt die Wissenschaft daher davon, dass der Computer sich das nötige Wissen selbst aneignet und die gewünschten Fähigkeiten erlernt. Jetzt haben Informatiker der TU Darmstadt eine Software entwickelt, die es dem Computer ermöglicht, auf das eigentlich für menschliche Leser bestimmte Wissen in Online-Werken wie Wikipedia oder Wiktionary zuzugreifen. Diese Software bringt den Traum des automatischen Sprachverstehens der Realisierung näher.
... mehr


Sprechwissenschaftler erforschen Call Center Gespräche
28.01.2009, Martin-Luther-Universität Halle-Wittenberg
Das Seminar für Sprechwissenschaft und Phonetik der Martin-Luther-Universität Halle-Wittenberg beschäftigt sich unter der Leitung von Seminar-Direktor Prof. Dr. Baldur Neuber mit der „Erforschung und Optimierung der professionellen Telefonie“ in Call Centern. Erklärtes Ziel des Vorhabens ist es, im Bereich der Sprechwirkungsforschung Gesprächsverläufe in Call Centern zu beschreiben und zu optimieren.

Neuber und seine Mitarbeiter haben dafür Call Center besucht und Gespräche aufgenommen. Der Gesprächsverlauf wird analysiert und soll Aufschluss geben über mögliche Gesprächsoptimierungen, die Automatisierung von Prozessen mündlicher Kommunikation in der professionellen Telefonie sowie die Automatisierung mündlicher Kommunikation an der Mensch-Maschine-Schnittstelle.
... mehr


Spracherkennung erleichtert Mobilität und Arbeitsabläufe in Produktion und Logistik
28.01.2009, proLogistik, Vocollect
Spracherkennung setzt sich immer mehr als beliebtes Hilfsinstrument in Produktion und Logistik durch. Die Dortmunder Firma proLogistik beispielsweise bietet seit Kurzem den Mobilcomputer Voice-Client pL-Voice 8.25 an. Ein weiteres Indiz ist die Implementierung der Sprachsoftware Vocollect Voice auf dem CK3 - einem Mobilcomputer von Intermec für logistische Aufgaben. “Indem wir Vocollect Voice auf dem CK3 anbieten, können Kunden den CK3 in einem ‘händefreien’ Modus nutzen und so ihre Prozesse und ihre Produktivität im Lager erheblich verbessern.", so Barry Issberner, Vice President of Global Marketing bei Intermec.
... mehr


EU-Projekt Luna: Durchbruch bei der kontinuierlichen Spracherkennung?
28.01.2009, Innovationsreport
Ziel des EU-Projekts Luna ist es, die maschinelle Erkennung von spontan gesprochenen Äußerungen wesentlich zu verbessern. Dafür wurde der gewaltige Sprachkorpus, der das Rückgrat von Erkennung und Interpretation ist, allerdings auf drei Domänen begrenzt: Reiseauskünfte, IT-Probleme bei Endverbrauchern und Touristik-Informationen. Mit industriellen Partnern wie der France Telecom, Loquendo und CSI Piemonte wird dabei die Brücke zwischen Theorie und Praxis geschlagen.
... mehr


Dialogsystem schult Pharmazie-Studenten im Umgang mit Patienten
28.01.2009, Wissenschaft aktuell
Als neues Anwendungsfeld für Sprachtechnologie scheinen sich Dialogsysteme zum Erlernen kommunikativer Fähigkeiten herauszukristallisieren. Nach den virtuellen Avataren, die zum Verkaufstraining eingesetzt werden (vgl. Bericht in der VOICE Community), gibt es nun ein von britischen Forschern entwickeltes Dialogsystem, mit dem Pharmaziestudenten den Umgang mit Patienten erlernen können. „Der virtuelle Patient ermöglicht es, eine vollständige ärztliche Beratung des Patienten zu erleben und den Studenten aus Fehlern lernen zu lassen - und das in einer sicheren Umgebung, wie sie in der Realität nicht möglich wäre“, erläutert Stephen Chapman, Leiter der Keele's School of Pharmacy. Die Interaktion ist dabei sowohl per Spracherkennung als auch per Tastatur möglich.
... mehr


Loquendo bringt russische Spracherkennungssoftware auf den Markt
28.01.2009, Wissenschaft aktuell
Die russische Sprache hat europaweit die meisten Sprecher. Deshalb ist Russland auch für den Sprachtechnologiemarkt interessant. Nach Einführung einer TTS für Russisch im Oktober 2008 hat Loquendo nun auch eine russische Spracherkennungs-Software auf den Markt gebracht.
... mehr


Nuance präsentiert Dragon NaturallySpeaking Legal 10
14.01.2009, Nuance Communications, Inc.
Nuance Communications gibt die Markteinführung von Dragon NaturallySpeaking Legal 10 bekannt - eine Spracherkennungssoftware speziell für Rechtsabteilungen großer Unternehmen, Behörden sowie Anwaltskanzleien. Die neue Version Nr. 10 zeichnet sich vor allem durch eine weiter verbesserte Erkennungsgenauigkeit sowie den Wegfall eines aufwendigen Sprachtrainings aus. Sprachgesteuertes Surfen im Internet ist mit Dragon NaturallySpeaking Legal genauso möglich wie das Diktieren in Microsoft Word, Excel, Corel WordPerfect und in den meisten anderen Windows-Anwendungen. Mit Nuance RealSpeak 2, die Text-to-Speech-Anwendung mit einem natürlichen Sprachklang, können E-Mail-Nachrichten und Dokumente laut vorgelesen werden. Dragon NaturallySpeaking lässt sich außerdem in andere Anwendungen integrieren: elektronische Berichtsmanagementsysteme, elektronische Formulare sowie Programme zur Berechnung von Rechts- und Gerichtskosten.
... mehr


Virtueller Avatar soll Verkäufer schulen
14.01.2009, Speech Technology
Die Firma Knowledgeshift hat mithilfe eines IVR-Systems von Ifbyphone eine multimodale Rollenspiel-Anwendung entwickelt: Verkäufer können mit einem virtuellen Avatar Kundengespräche trainieren. Das Gespräch kann dabei aufgezeichnet und anschließend im Detail analysiert werden. Allerdings ist eine echte Interaktivität bislang noch nicht gegeben – das System handelt, zumindest unter der Nutzer-Oberfläche, unabhängig von der Eingabe des Nutzers. Knowledgeshift plant jedoch für die zukünftigen Versionen eine Einbeziehung der Nutzereingaben in die Systemhandlungen.
... mehr


Multichannel-Lösung aus einer Hand – Aastra prästentiert Aastra Smart Center 4.0 und Astra Voice Portal 7.5
14.01.2009, Aastra DeTeWe GmbH
Hilfreich auf dem Weg zum "Unified Customer Service": Die neuesten Versionen der Aastra Call Center Lösungen: Aastra Smart Center 4.0, Aastra Smart Dialer 3.0 und Aastra Voice Portal 7.5. Die neuen Produktversionen helfen, die Prozesse im Call Center noch weiter zu optimieren. Das neue ASC 4.0 integriert nahtlos alle Medien. Alle eingehende Nachrichten – per Telefon, Fax, E-Mail, Web oder Sprachbox – werden medienunabhängig schnell und flexibel an die verfügbaren Agenten verteilt. In Verbindung mit dem Aastra Smart Dialer lässt sich das ASC auch für Outbound-Kampagnen nutzen und mit dem multimedialen Sprachdialogsystem Aastra Voice Portal 7.5 lässt sich das ASC jederzeit um IVR-Funktionen erweitern.
... mehr


VoiceObjects stellt die VoiceObjects Developer Edition 7.4 zum Download zur Verfügung
12.01.2009, VoiceObjects
Voice Objects hat die VoiceObjects Developer Edition Version 7.4 zum Download bereitgestellt. Neu bei dieser Version ist vor allem die Integration von SMS, wodurch Anwendern die Möglichkeit gegeben wird, Ihre Self-Service-Kanäle zu erweitern. Außerdem ist das Produkt nun mit zwei weiteren Plattformen kompatibel: Nortel ICP und Voxeo Prophecy 9.0. Daneben wurden Verbesserungen in der Sicherheit vorgenommen und neue Funktionen integriert, um die Handhabung zu erleichtern.
... mehr


Hausroboter in Japan: Sprachgesteuerte Helfer im Alltag
14.01.2009, SpeechTechBlog/Mitsubishi
Sie sehen rund und niedlich aus und sie sind immer für Ihre Mitbewohner da: Hausroboter in Japan. Zurzeit machen zwei Exemplare besonders von sich reden: Wakamaru von Mitsubishi und Apripoko, den Toshiba demnächst auf den Markt bringen will. Diese beiden kleinen Wesen sind auch von ihrem Äußeren her dazu angelegt, “mit den Menschen zu leben”. Sie können Personen anhand von Gesicht und Stimme erkennen und lernen, indem Sie zuschauen und zuhören.
... mehr


Nuance und GE Healthcare integrieren SpeechMagic erstmals in Citrix-fähiges Radiologieinformationssystem
17.12.2008, VOICE Community
Nuance gab kürzlich bekannt, dass seine Spracherkennungstechnologie SpeechMagic in das Centricity Radiologieinformationssystem (RIS) von GE Healthcare integriert wurde. Erstmals ist es damit möglich, vollwertige Spracherkennung innerhalb des RIS, sowohl im Front-End- als auch im Back-End-Betrieb, in einer Citrix-Umgebung zu nutzen. Krankenhäuser, Radiologiezentren und Versorgungsnetzwerke können damit unabhängig von der bestehenden Netzwerkstruktur einen digitalen radiologischen Arbeitsablauf umsetzen. Nuance erwartet, dass die neue Lösung die Anwendung von Spracherkennung in der Radiologie signifikant erhöhen wird.
... mehr


Neuer Nuance Webcast: Benchmarking von Anrufererfahrungen
17.12.2008, VOICE Community
In diesem 15-minütigen on-demand Webcast beschreiben der prämierte Tech-Writer Stan Gibson und Christy Murfitt von Nuance, wie Sie durch Benchmarking die Qualität Ihres Call Centers mit der Ihrer Wettbewerber vergleichen können. Lernen Sie zudem, welchen ROI Ihr Benchmark zeitigen kann und wie er Ihnen dabei hilft, Optimierungspotenziale zu heben und erfolgreich neue Call Center-Anwendungen als Ergebnis Ihres Benchmarks zu implementieren.
... mehr


EMMA: Extensible MultiModal Annotation Markup Language steht zur Diskission
17.12.2008, VOICE Community
Die Multimodal Interaction Working Group des W3C hat eine Empfehlung für EMMA, die Extensible MultiModal Annotation Markup Language publiziert. Dieses Dokument ist Teil eines Satzes von Spezifikationen für multimodale Systeme und enthält Details einer XML Markup Language für die Erfassung und Zuordnung von Nutzereingaben. Kommentare zu der Empfehlung sind willkommen bis zum 15 Januar 2009.
... mehr


Update für Loquendo VoxNauta VoiceXML/CCXML Platform
17.12.2008, VOICE Community
Loquendo publiziert mit Loquendo VoxNauta 7.0.25 eine neue Version seiner VoiceXML/CCXML platform. Loquendo VoxNauta ist laut Anbieter eine mächtige, voll skalierbare leicht zu nutzende Plattform, die von vielen Carriern, Unternehmen, Service Providern und Innovatoren eingesetzt werde, um IVRs und sprachgesteuerte Applikationen zu entwickeln, die auf den W3C VoiceXML and CCXML Standards beruhen.
... mehr


Thumbtack - moderne Bookmarksammlung von Microsoft
17.12.2008, golem.de
Mit Thumbtack startet Microsoft im Rahmen seiner Live Labs einen Dienst, um Links, Fotos und alles was sich sonst im Web findet, an einem Platz zusammenzuführen und in sogenannten Collections zu gruppieren. Dazu werden zuerst die Webschnipsel markiert, dann kopiert und in Thumbtack eingefügt - und schon steht dort eine Zusammenfassung des Fundstücks bereit. Microsoft setzt dabei auf lernende Algorithmen und natürliche Spracherkennung, um beispielsweise Adressen aus dem markierten Text hervorzuheben und diese auf einer Karte darzustellen.
... mehr


Technologien von morgen für Applikationen von heute
10.12.2008, Speech Technology Magazine
Innovative Sprachapplikationen erfordern neue Sprachtechnologien. Die bekannten Sprachverarbeitungstechnologien kontext-unabhängiger Grammatiken und statistische Sprachmodelle leisten gute Dienste in aktuellen Sprachapplikationen. Aber diese Technologien begrenzen unser Denken und somit auch die Bandbreite möglicher Applikationen. Zwei grundlegende Technologien werden die Möglichkeiten von Sprachapplikationen massiv ausweiten: Natürliche Spracherkennungsalgorithmen und semantische Repräsentationssprachen.
... mehr


“Brutkasten”-Gruppenbericht: Elemente einer “Emotion Markup Language 1.0”
10.12.2008, W3C
Die Emotion Markup Language Brutkasten-Gruppe publizierte ihren Abschlussbericht: Mit der zunehmenden Allgegenwärtigkeit des Internets, der zunehmenden Interaktivität und Multimodalität muss sich die Technologie immer häufiger mit menschlichen Faktoren wie Emotionen auseinandersetzen. Der Abschlussbericht beschreibt Elemente einer Emotion Markup Language und schafft so eine Balance zwischen wissenschaftlichen Grundlagen und praktischer Anwendbarkeit. Die Sprache kann als "plug-in" für drei Themenfelder eingesetzt werden: (1) für die händische Anreicherung von Daten, (2) für die automatische Erkennung von Emotionen durch Interpretation des Nutzerverhaltens und (3) für die Generierung “emotionalen” Systemverhaltens.
... mehr


Hilfe, mein Computer spricht!
03.12.2008, funkschau.de
Während einerseits das Thema Spracherkennung derzeit großes Medieninteresse erfährt, hat sich andererseits fast unbemerkt eine Technologie verbreitet, die genauso spektakulär ist: die Sprachsynthese. funkschau beleuchtet, auf welchen Prinzipien sie basiert und sagt Ihnen, ob diese Technik auch für Sie in Frage kommt. Ansagen auf Bahnhöfen und Flughäfen werden längst nicht mehr von Menschen gesprochen. Das, was durch die Lautsprecher ertönt, wird bis auf wenige Ausnahmen durch Sprachsynthese erzeugt. Die Technik hat sich so weit entwickelt, dass nicht mehr blecherne und abgehackte Stimmen die Hörorgane schädigen, sondern dass diese künstlichen Stimmen kaum bis gar nicht mehr von menschlichen Stimmen zu unterscheiden sind. Das hat wiederum zur Folge, dass Sprachsynthese mittlerweile auch in Callcentern von Banken, Hotlines, Telekommunikationsunternehmen und Fluglinien eingesetzt wird.
... mehr


Google mobile arbeitet mit Näherungssensor
26.11.2008, Maclife.de
Obwohl Google ein eigenes Mobilfunk OS im Ärmel hat, beteiligte sich der Suchmaschinenriese ebenfalls eifrig an der Entwicklung von iPhone-Anwendungen und überraschte die Öffentlichkeit kürzlich mit einer sprachgesteuerten Version von Google Mobile. Was die Nutzer erfreut, ärgert jedoch die Konkurrenz: Denn Google greift mit der App auf den Näherungssensor des iPhones zurück um die Sprachsuche zu starten - ein Hilfsmittel, das anderen Entwicklern bisher verwehrt blieb.
... mehr


RFID trifft Sprache
26.11.2008, tecCHANNEL
Pick-by-Voice-Lösungen in der Kommissioniertechnik sind längst nichts Neues mehr. Die von Vocollect jetzt auf den Markt gebrachte Kombination aus Sprach- und Radio-Frequency-Identification- (RFID-) Technik direkt am Körper des Kommissionierers hat das Potenzial, den Kommissioniervorgang im Lager noch einmal deutlich schneller und sicherer zu gestalten. Verwenden die Kommissionierer diese RFID-Leseeinheit, entfallen die für sie störenden Arbeitsschritte zur Identifikation von Produkten, Behältern, Paletten oder Orten. Die Logistik-Mitarbeiter können so noch schneller und fehlerfreier Artikel zusammenstellen. Darüber hinaus ergeben sich neue Möglichkeiten für das Lagerverwaltungssystem bezüglich der Transparenz von Daten und Produktbewegungen.
... mehr


"Mamtam" durchsucht gesprochenen Text in Handy-Videos
26.11.2008, diePresse.com
Mit einem getippten Suchbegriff kann dank einer österreichischen Software der gesprochene Text von Videos auf einem Handy durchsucht werden. Zunächst findet "Mamtam" nur ORF-Videos. Videos am Handy haben großes Potential. YouTube ist mittlerweile auf nahezu jedem Smartphone verfügbar und TV-Inhalte können entweder per UMTS gestreamt oder per DVB-H auf das Handy geholt werden. Um das Finden des gewünschten Videos leichter zu machen, wurde auf der TU Graz ein innovatives Programm entwickelt: "Mamtam" findet auf Basis eines getippten Suchbegriffs alle Videos in denen dieser als gesprochenes Wort vorkommt. Die Software arbeitet mit Spracherkennung, die zuletzt auch von Google für die Suche auf Handys entdeckt wurde.
... mehr


Google Technology Round Table: Human Language Technology
19.11.2008, VOICE Community
Google macht sich für den Transfer von Expertenwissen in die Öffentlichkeit verdient. Dazu veranstaltet der Suchmaschinengigant in loser Regelmäßigkeit den „Google Technology RoundTable”, eine im Internet veröffentlichte Expertenrunde. Thema dieser Episode ist „Human Language Technology”. Die Experten aus dem Hause Google Franz Josef Och, Research Scientist Lead - Machine Translation, und Mike Cohen, Manager Speech Technology, diskutieren ihre Forschungsergebnisse in den Bereichen maschinelle Übersetzung und Sprachtechnologie mit Alfred Spector, VP of Research and Special Initiatives.
... mehr


Wissenschaftler lesen Muster aus dem Gehirn
19.11.2008, VOICE Community
Wissenschaftler der Universität in Maastricht haben eine Software entwickelt, die anhand der Gehirnwellen erkennt, mit wem sich ein Mensch unterhält und was er gesagt bekommt. Ihre Entdeckung könne, so die Wissenschaftler, zur Entwicklung besserer Systeme zur Erkennung von Sprache beitragen. Es ist ein alter Menschheitstraum, sich nicht nur mit seinem Gegenüber zu unterhalten, sondern auch seine Gedanken lesen zu können. Ein Team aus vier Neurowissenschaftlern der Universität in Maastricht ist diesem Traum einen Schritt näher gekommen: Sie haben ein System entwickelt, mit dessen Hilfe sie aus Gehirnwellen den Inhalt einer Unterhaltung herauslesen und erkennen können, wer der Gespächspartner ist. Dazu haben die Wissenschaftler ein bildgebendes Verfahren, die funktionelle Magnetresonanztomographie (fMRT), mit einem Dataminingsystem kombiniert. Ihre Erkenntnisse haben sie im Wissenschaftsmagazin Science beschrieben.
... mehr


iPhone: Google versteht Sprachanfragen
14.11.2008, chip.de
Google hat eine iPhone-Applikation entwickelt, die Suchanfragen per Sprachbefehl ermöglichen soll. Dabei wird die Spracheingabe digitalisiert, an die Google-Server gesendet und dort in Text umgewandelt. Das Ergebnis der Suchanfrage wird dann wieder zurück an das iPhone gesendet. Auch wenn es dabei vorkommen kann, dass Anfragen von dem System nicht verstanden werden - in den allermeisten Fällen soll die Spracherkennung einwandfrei funktionieren. Das iPhone-Tool digitalisiert allerdings nicht nur die Spracheingabe, sondern nutzt bei Bedarf auch den GPS-Empfänger des iPhones, um die Suchanfrage um Ortsangaben zu ergänzen. So ist es beispielsweise möglich, Ergebnisse für die Anfrage "Wo ist der nächste Starbucks?" zu erhalten.
... mehr


Sprachtechnologischer Exkurs: Die Evolution der Sprachentstehung
19.11.2008, faz.net
Zur Sprachentstehung äußerte sich Charles Darwin mit der gebotenen Vorsicht, wurde die Sprache doch immer wieder als hervorstechender Beleg für die evolutionsgeschichtliche Sonderstellung des Menschen angeführt. Die menschliche Sprache, schrieb Darwin, sei aus dem Singen entstanden, die Musikalität so eine der bedeutendsten menschlichen Fähigkeiten. Demgegenüber steht eine These, dass dem Sprachvermögen die Gesten voraus gingen. Aus dem Bereich der Evolutionsbiologie erhält Darwins Hypothese in den letzten Jahren Unterstützung. In einem kurzen Exkurs erläutert die FAZ die derzeit wahrscheinlichste Evolutionstheorie.
... mehr


SVOX präsentiert polyglotte TTS
19.11.2008, Speech Technology Magazine
SVOX präsentierte eine neue Funktionalität für Mehrsprachigkeit in ihren Text-to-speech (TTS) Produkten. Die sogenannte “Polyglot SVOX TTS” unterstützt SVOX Corporate, SVOX Automotive Pro, SVOX Automotive, SVOX Mobile Pro uand SVOX Mobile TTS und sorgt dafür, dass zum Beispiel englische Begriffe auch von einer auf deutsch eingesetzten TTS nun korrekt “ausgesprochen” werden können.
... mehr


W3C veröffentlicht neue Empfehlung für Speech Synthesis Markup Language (SSML), Version 1.1
12.11.2008, W3C
Die Voice Browser Working Group empfiehlt die Speech Synthesis Markup Language (SSML), Version 1.1 als Standard. Die Speech Synthesis Markup Language Specification wurde entwickelt, um eine reiche, XML-basierte Markup Language zur Unterstützung von synthetischer Sprache im Web und in anderen Anwendungen. Die wichtigste Aufgabe dieser Markup Language ist, Autoren synthetisierbarer Inhalte eine standardisierte Möglichkeit zu bieten, Aspekte von Sprache wie Aussprache, Lautstärke, Pitch, etc. auf verschiedenen Synthese-Plattformen zu vereinheitlichen.
... mehr


Vierbeinige Assistenten inspirieren Roboterforscher
12.11.2008, heise-online
Speziell trainierte tierische Assistenten öffnen Türen, schalten Lichter ein und führen andere nützliche Aufgaben aus, um Menschen mit Behinderung zu helfen – und das schon seit vielen Jahren. Wissenschaftler am Georgia Institute of Technology haben sich davon nun inspirieren lassen und einen Roboter entwickelt, der die Beziehung zwischen Hilfebedürftigen und Assistenzhunden nachbilden soll. Die neueste Version von El-E wurde nun so verbessert, dass er nicht nur auf das Training mit einem Laserstift reagieren kann, wie es bei der Ausbildung von tierischen Assistenten üblich ist, sondern auch gesprochene Befehle versteht und eine größere Anzahl von Kommandos beherrscht.
... mehr


Nuance's VSuite 3 jetzt auch für die neue Katana Serie von Sanyo
29 October 2008, VOICE Community
Nuance gab bekannt, dass die neueste VSuite Software jetzt auch für die neuesten Mobiltelefone der Sanyo Katana-Reihe zur Verfügung steht. VSuite 3 liefert damit Sprachsteuerung auch für die Modelle Katana Eclipse and Katana LX. Kunden, die die Software auf ihr Katana-Phone herunterladen, erhalten gleichzeitig Nuances T9 Predictive Text-Software.
... mehr


Emotion ist der Schlüssel zu intelligentem Design: VUIs sollen natürlicher und ausdrucksstärker werden
05.11.2008, VOICE Community
In diesem Artikel beleuchtet Sheyla Militello von Loquendo die Bedeutung, die ausdrucksvolle Sprachdialogsysteme für eine positive Kundenerfahrung haben. Dabei vertritt sie die These, dass es möglich ist, eine telefonsche Serviceleistung so zu gestalten, dass sie beim Anrufer keine Wünsche offen lässt – solange die VUI entsprechend designt wird und auch natürliche Emotionen und Ausdrucksweisen verarbeiten kann.
... mehr


OPAS Mobil drei Phone von Aastra optimiert die Pflegedokumentation
04.11.2008, xdial.de
Die Software-Applikation OPAS Mobil drei Phone von Aastra sorgt für Mobilität in der Pflegedokumentation. Dank der Datenerfassung mit schnurlosen DECT-Telefonen von Aastra, wie sie bereits in vielen Alten- und Pflegeheimen eingesetzt werden, lassen sich Arbeitsabläufe effizienter gestalten und die Wirtschaftlichkeit steigern. Das Pflegepersonal erfasst mit schnurlosen Telefonen Leistungsnachweise, Vitalwerte, Ein-/Ausfuhrwerte und Informationen über Lagerung sowie optional sogar Pflegeberichte per Spracherkennung direkt und das bei intuitiver Bedienung über das Display der Telefone.
... mehr


W3C Standard vereinfacht die Umsetzung von sprachgesteuerten Web Applikationen
29.10.2008, W3C
Die W3C-Organisation publizierte einen Standard, der die Entwicklung sprachgesteuerter Webseiten vereinfachen soll. Der “Pronunciation Lexicon Specification (PLS) 1.0“ getaufte Standard ist das neueste Stück des W3C Speech Interface Framework zur Schaffung von sprachgesteuerten Web Applikationen. PLS soll die Kosten solcher Entwicklungen senken, indem es Entwicklern ermöglicht, Aussprachevokabularien zu nutzen und auszutauschen. "Es gibt zehn mal mehr Telefone in der Welt als internetfähige Rechner, daher werden Telefone in Zukunft zum Haupteingang zum Web," ist sich James A. Larson sicher, der stellvertretende Vorsitzende der Voice Browser Working Group, die den neuen Standard entwickelte.
... mehr


W3C publiziert das fünfte Arbeitspapier (Empfehlung) für multimodale Architekturen und Interfaces
29.10.2008, W3C
Die Arbeitsgruppe für “Multimodal Interaction” der W3C hat ein Update des Arbeitspapiers “Multimodal Architecture and Interfaces“ (kurz: “MMI Architecture”) vorgelegt, das eine lose zusammengefügte Architektur für multimodale User Interfaces beschreibt. Hauptänderung zum letzten Arbeitspapier ist das Hinzufügen der Regeln und Leitlinien, die Modality-Experten erlauben, die Funktionalitäten, Möglichkeiten und APIs für spezifische Komponenten in ausreichender Detailliertheit so zu beschreiben, dass die Komponenten innerhalb einer Multimodalen Architektur kompatibel sind.
... mehr


Aspect kündigt Aspect Unified IP 6.6 für Dezember an
29.10.2008, VOICE Community
Aspect kündigt die allgemeine Verfügbarkeit der integrierten Contact Center-Lösung Aspect Unified IP 6.6 für den Monat Dezember an. Die neue Produktversion verfügt über eine ganze Reihe wesentlicher neuer Leistungsmerkmale, dazu zählt eine “Ask-an-Expert”-Funktion, die die Instant Messaging und Präsenzfunktionen des Microsoft Office Communications Server 2007 nutzt. Mit dieser Funktion kann gezielt Echtzeit-Präsenzinformation über Spezialisten im ganzen Unternehmen abgefragt werden. So kann direkt im Kundendialog Hilfe geleistet und die Quote der Kundenanfragen, die beim ersten Kontakt zufriedenstellend abgeschlossen werden, erhöht werden. Aspect Unified IP 6.6 führt Inbound-, Outbound- und gemischte Kontakte (einschließlich Sprache, E-Mail, Web, Workflow und Fax) in einer einzigen, skalierbaren SIP (Session Initiation Protocol)-basierten VoIP (Voice over IP)-Softwareplattform zusammen.
... mehr


Whitepaper von VoiceObjects: Produktivität verdoppeln durch verbesserte Wartung von Sprachanwendungen
22.10.2008, VOICE Community
Die aktuellen Turbulenzen auf den Finanzmärkten sind ein guter Grund, über Kostensenkungen durch den Einsatz von Sprachdialogsystemen nachzudenken. Dr. Ingo Bors erläutert, wie sich ungenutzte Einsparpotenziale heben lassen und die Produktivität sich verdoppeln kann, wenn State-of-the-art-Sprachportale bestmöglich gewartet werden. Dieses Paper beschreibt die verschiedenen Elemente der Wartung von Sprachportalen und vergleicht die zwei Ansätze “handcodierter Java/VXML Systeme” mit dem objektbaiserten, einfach zu bedienenden System von VoiceObjects.
... mehr


MacSpeech bringt Update der Diktiersoftware für Mac OS
22.10.2008, Speech Technology Magazine
MacSpeech präsentierte sein neues Produkt MacSpeech Dictate v1.2. Zu den Verbesserungen von MacSpeech Dictate gehören laut Angaben des Anbieters u.a.:
* der Buchstabiermodus, mit dem auch Worte, die das System nicht erkennt, durch einfaches Buchstabieren eingegeben werden können,
* das Phrasen-Training, das die Erkennungsakkuratesse mit jeder Nutzung weiter verbessert,
* der “Move"-Befehl, mit dem sich der Cursor zur einfacheren Bearbeitung von Dokumenten steuern lässt.
... mehr


Victrio bringt sprachbasiertes Call Screening System auf den Markt
22.10.2008, Speech Technology Magazine
Victrio präsentierte eine neue Voice Risk Management Solution, die Betrugspotenziale bei Anrufern auf Kundenserviceleitungen im Handel oder bei Finanzdienstleistern aufdecken kann, indem sie die Stimmprofile der Anrufer mit denen von bekannten Kriminellen, die in einer Datenbank erfasst sind, vergleicht. Werden Übereinstimmungen festgestellt, kann die Authorisation einer Transaktion verhindert werden, bevor ein Schaden entsteht. Die Lösung wird als Managed Service (SaaS) angeboten und adressiert vor allem große online-Verkäufer, Banken oder Kreditkartenanbieter.
... mehr


Best Practice im Fokus: Dialog - 0800 VOLKSWAGEN
15.10.2008, VOICE Community
Die DiaLog 0800-Volkswagen-Sprachanwendung ermöglicht bei Anfragen von VW-Kunden die Vorselektion nach Modellabfrage (Polo, Phaeton etc.) und stellt dann zum entsprechenden Operator durch. Jeder zwölfte Anrufer bekommt zudem die Möglichkeit, an einer sprachgesteuerten Zufriedenheitsbefragung teilzunehmen. Zusätzlich zur Automatisierung der Vorqualifizierung wird eine thematische Fokussierung vorgenommen und die Anzahl interner Weiterleitungen minimiert. Somit wird ein optimierter Einstiegspunkt für den Call Center-Agenten geschaffen. Damit soll zugleich die Servicequalität verbessert werden.
... mehr


Babylon setzt auf ‘Language Weaver’ für Online-Translation-Lösung
15.10.2008, TMC.net
Babylon, Anbieter von Single-Click Translation und Dictionary Software will in Zukunft auf Language Weaver setzen, eine Translation On-Demand Human-Communication-Lösung. Diese soll in die Single-Click Translation und Dictionary Service Suite von Babylon integriert werden und Anwendern einen Zugriff auf automatisierte High-Speed Übersetzungstechnologie auf Basis offener Standards wie HTTP, SSL und XML bieten.
... mehr


Nuance stärkt Technologieentwicklung
09.10.2008, VOICE Community
Nuance und Nokia haben den Vertragsabschluss für ihre auf mehrere Jahre ausgelegte Zusammenarbeit bekannt gegeben. Das Abkommen der beiden Unternehmen umfasst u.a. die strategische Zusammenarbeit und die Implementierung eines Rahmensystems, um die Technologieentwicklung und Innovation in einem größeren Kreis von Entwicklern voranzutreiben. So sollen offene Protokolle entwickelt werden, mit denen Entwicklungspartner weitere umfassende multimodale Features, Anwendungen und Nutzererfahrungen auf Nokia-Geräten schaffen können. Durch eine Reihe offener Programmier-Schnittstellen, Sprachmodelle und Entwicklungstools können diese Partner Zugang zu einer dynamischen Entwicklungsumgebung haben, in der sie mobile Innovation rund um fortschrittliche, multi-modale Nutzeraktionen entwickeln können.
... mehr


VOICE Days 2008: Guided Tours zeigen die richtigen Lösungen und die passenden Anbieter
01.10.2008, Initiative VOICE BUSINESS
Die Initiative VOICE BUSINESS bietet auch in diesem Jahr geführte Touren durch den Best Practice Park, den Messe- und Ausstellungsbereich der VOICE Days. Über 250 Besucher haben auf den VOICE Days 2007 das Angebot genutzt, auf direktem Wege die Anbieter und Wettbewerber kennen zu lernen - und waren begeistert! Lernen Sie am ersten und zweiten Veranstaltungstag in Begleitung unabhängiger Marktexperten die erfolgreichsten Lösungen und Anbieter Ihrer Branche oder Ihres Anwendungsbereichs kennen. Wählen Sie die für Sie passende Guided Tour aus den drei Kategorien aus: Allgemeine Touren (Einsteiger Tour, Award Nominees und Award Gewinner), Branchentouren (Call Center Performance, Financials und Telco & Carrier) und Thementouren (Auskunft & Vermittlung, Self Service und Voice Biometrics).
... mehr


MIT entwickelt sprachgesteuerten Rollstuhl
01.10.2008, Speech Technology Magazine
Forscher des Massachusetts Institute of Technology arbeiten an einem selbststeuernden Rollstuhl, der in der Lage ist, seinen Nutzer per Sprachbefehl zu bestimmten Orten in einer Immobilie zu bringen. Spracherkennungstechnologie ermöglicht dem Nutzer, seinen Rollstuhl durch Befehle wie “Bring mich ins Bad” oder “Fahr in die Küche” zu steuern – der selbstlernende Rollstuhl nutzt dann eine Karte, die er bei einer Guided Tour seines Nutzers selbst erstellt Prototyp nutzt ein W-Lan-System mit verschiedenen W-Lan Knoten, um seine Karten zu erstellen und auf deren Basis sicher navigieren zu können.
... mehr


Ältere Newsartikel ...
Name:
Kennwort:
Anmeldung speichern
jetzt registrieren!
Up-to-date mit dem VOICE Flash!
... mehr
| | | |
© VOICE Community 2004 bis 2017 - Alle Rechte vorbehalten