Le W3C simplifie la création d’applications Web à reconnaissance vocale

Le W3C a publié aujourd’hui un standard Web qui simplifiera le développement des applications Web qui parlent à l’utilisateur et qui l’écoutent. Le Lexique de prononciation PLS 1.0 (« Pronunciation Lexicon Specification ») est la toute dernière composante de la plate-forme d’interface vocale du W3C pour la création d’applications Web pilotées par la voix et la parole.
PLS peut réduire le coût de développement de ces applications grâce au partage et à la réutilisation de dictionnaires de prononciation. En outre, PLS peut faciliter la localisation des applications, en séparant les questions de prononciation des autres aspects.

« Les lexiques de prononciation standard constituaient une pièce manquante dans la plate-forme d’Interface vocale du W3C, » explique Paolo Baggia, directeur des standards de Loquendo et éditeur de la spécification PLS 1.0. « Je suis très satisfait d’avoir activement contribué à la mise en place de PLS, et de savoir qu’à partir de maintenant, il est possible de créer des applications vocales « 100% standard’. »

Partie Interaction vocale de la vision « Un Web » du W3C

Les applications pilotées par la voix affluent sur le Web, sans que l’utilisateur ait toujours conscience qu’il interagit avec un service Web ; c’est le cas par exemple des services d’informations sur les heures de départ et d’arrivée de vols, de transactions bancaires, de rappels automatique de rendez-vous par téléphone, ou encore des standards téléphoniques automatiques. D’après les estimations, plus de 85 % des applications à réponse vocale interactive pour téléphone (y compris les portables) utilisent le standard VoiceXML 2.0 du W3C.

« Il existe dix fois plus de téléphones dans le monde que de PC connectés. Les téléphones sont amenés à devenir le principal portail du Web », explique James A. Larson, co-animateur du groupe de travail Navigateur vocal à l’origine du nouveau standard. « La reconnaissance vocale n’est pas encore couramment associée au « Web visuel », mais cela évoluera d’une part avec la taille sans cesse réduite des terminaux qui font que les petits claviers sont de moins en moins pratiques à utiliser, et d’autre part avec le développement des téléphones cellulaires dans des régions où le taux d’alphabétisme est bas ».

Par exemple, demander la direction à suivre tout en conduisant un véhicule et écouter la réponse obtenue par synthèse vocale illustre le caractère pratique des applications « mains libres » pour les utilisateurs de téléphones portables. Les applications vocales rendent également de grands services aux personnes souffrant d’un handicap (comme une déficience visuelle) ou ne sachant pas lire.

Le W3C considère l’accès vocal comme l’une des composantes d’un accès «multimodal » plus général, où les utilisateurs peuvent combiner divers moyens d’interaction : entrée vocale, retour de parole, encre électronique, entrée tactile et gestes physiques (comme ceux utilisés dans certains jeux vidéo). Le groupe de travail Navigateur vocal et le groupe de travail Interaction multimodale coordonnent leurs efforts afin de rendre le Web disponible sur un plus grand nombre de supports et dans un plus grand nombre de situations.

Laisser un commentaire