Opera Software daje głos przeglądarce

tashi w środę 24 marca 2004 o 13⁰⁹ napisał(a):

Więcej tu:
http://www.pcworld.pl/news/65010.html

Czyżby już jako standard w O7.5?
Poczekamy, zobaczymy

jedrzej w środę 24 marca 2004 o 13¹⁴ napisał(a):

eee, moim zdaniem raczej w 8.

andol w środę 24 marca 2004 o 17³⁶ napisał(a):

Originally posted by jedrzej
eee, moim zdaniem raczej w 8.

Hm...
Taka Opera jest już dostępna od ponad roku... Ja ją mam chyba od lutego 2003.
Nie widziałem jeszcze sterowania za pomocą głosu interfejsem użytkownika Opery - w ostatniej wersji MM opcja ta jest nieaktywna (załącznik).

mm.png

andol w poniedziałek 29 marca 2004 o 14¹¹ napisał(a):

Sterowanie Opery za pomocą głosu jest już aktywne

Operę możemy teraz nazywać "baby" Dokładniej, każdą komendę głosową sterującą interfejsem użytkownika należy poprzedzić jednym z haseł (wybranych w preferencjach):
-Browser,
-Opera,
-Baby,
-Hal.

Pobawię się i opowiem później.

mm_opera.png

jedrzej w poniedziałek 29 marca 2004 o 14²² napisał(a):

skąd zdobyć taką Operę?

Mayor w poniedziałek 29 marca 2004 o 15³¹ napisał(a):

andolq drugi raz na ten sam numer nas nie nabierzesz
a 1st April dopiero za 3 dni

Pragma_Inline w poniedziałek 29 marca 2004 o 15³⁶ napisał(a):

Oficjalna wersja Opery sterowana głosem powinna pojawić się wraz z 7.5 final. Wiem z pewnego źródła od Junyora. Poza tym był gdzieś o tym artykuł.
pi

titus-s w poniedziałek 29 marca 2004 o 20⁴⁴ napisał(a):

Artykuł był na www.dobreprogramy.pl.

oksza w poniedziałek 29 marca 2004 o 22⁰⁴ napisał(a):

Ja mogę tylko dodać że widziałem bodajże w ostatnim press release że opera głosowa to kwestia miesiąca, dwóch.. więc raczej nie 8.

andol w poniedziałek 29 marca 2004 o 23⁰¹ napisał(a):

Originally posted by Mayor
andolq drugi raz na ten sam numer nas nie nabierzesz
a 1st April dopiero za 3 dni

LOL!

Wystarczy raz zrobić kawał, a potem nikt człowiekowi nie uwierzy

. Nie pozostaje mi nic innego jak zrezygnować z primaaprilisowego żartu w tym roku.
Zapewniam: to co było rok temu moim żartem [1] -- stało się teraz faktem. Niestety mój akcent jest najwidoczniej za mało amerykański

i sterowanie Operą za pomocą głosu nie za dobrze wychodzi...

[1] Zeszłoroczny żarcik jest wciąż dostępny tutaj.

qviri we wtorek 30 marca 2004 o 00¹⁰ napisał(a):

Weźcie mi tego nie przypominajcie

Nasty we czwartek 01 kwietnia 2004 o 16³⁸ napisał(a):

Originally posted by andol
Sterowanie Opery za pomocą głosu jest już aktywne
(...) każdą komendę głosową sterującą interfejsem użytkownika należy poprzedzić jednym z haseł (wybranych w preferencjach):
-Browser,
-Opera,
-Baby,
-Hal.

Naprawdę? Fajnie.

Będę więc z przyjemnością (obustronną?

) rozmawiał z moją Operą, zwracając się do niej per Hal.

outofspace w sobotę 15 maja 2004 o 07⁴⁸ napisał(a):

hmm no i mamy 7.50 ale hmm mowie do niej a ona nic

klausa w sobotę 15 maja 2004 o 08²⁶ napisał(a):

A jak uaktywnić tą opcję?

MrL w sobotę 15 maja 2004 o 11³⁹ napisał(a):

Nie wiem jak wyglada ta kwestia w wersji 7.50, wydaje mi sie ze nie jest
jeszcze aktywna.

Postanowilem jednak jakis czas temu poeksperymentowac troche z tymi dzwiekowymi
bajerami. Znalazlem na forum jeden watek na ten temat, ale juz dosc stary,
wiec opisze do czego mnie udalo sie dojsc.

Po pierwsze nalezy sciagnac ze strony IBM Multimodal Tools, czyli pakiet
w sklad ktorego wchodza:

1. Multimodal Toolkit V4.1.5 for WebSphere Studio
2. Multimodal Browser V4.1
3. IBM WebSphere Voice Server SDK 3.1.1

Ad. 1. Ta czesc nie chciala sie zainstalowac, z powodu braku WebSphere Studio,
ktore ma w zaleznosci od wersji od 860MB do 1,5GB. Jak dla mnie to troche za
duzo, wiec nie probowalem nawet sciagania.

Ad. 2. Jest to specjalna wersja opery, z aktywna modulem dzwiekowym. Przedstawia
sie jako Opera 7.30. Co ciekawe nie ma bannera reklamowego i podaje w about ze
jest registered Nie wiem czy posiada wszystkie funkcje, bo testowalem tylko dzwiek.

Ad. 3. Zdaje sie ze ta czesc wlasnie odpowiada za obrobke dzwieku.

Calosc zajmuje 128MB i jest przeznaczona dla Win2K, nie sprawdzalem czy dziala na
innych systemach.

Kiedy przebrnalem przez sciaganie i instalacje, przystapilem do testow.
Pierwszy test z prezentacji zawartej w helpie do opery to wypelnianie formy glosem.
Klikamy na puste okienko i slyszymy glos: "Please say a number between one and three".
Zalozenie jest takie ze system rozpozna liczbe ktora podamy i wstawi tekst w okienko.

Probowalem w ten sposob wstawic liczbe kilkaset razy i ciagle w odpowiedzi slyszalem
tylko "Sorry, I did not understand". Jeden jedyny raz udalo mi sie podac liczbe trzy.
Majstrowalem na wszystkie strony w swoich ustawieniach dzwieku, ustawialem mikrofon
w roznych miejscach, mowilem szybko, wolno, grubym glosem i cienkim. Jedna udana proba
na jakies 400.

Drugi test to sterowanie przegladarka, tutaj kompletna porazka, ani razu nie udalo mi
sie wydac poprawnie komendy.

Podsumowujac calosc, przezylem srogi zawod. Byc moze nie ustawilem czegos tak jak
trzeba, a moze mam az tak beznadziejna dykcje :| Probowalem nagrywac swoj glos przy
roznych ustawieniach i nawet kiedy brzmi on bardzo czysto nie jest przyjmowany jako
komenda.

Przepraszam za strasznie dlugi post.
Chetnie przeczytalbym o doswiadczeniach innych w tym temacie, moze po prostu cos
zle ustawilem.

Mayor w sobotę 15 maja 2004 o 12⁰¹ napisał(a):

nie przepraszaj za długi post jak pisze się coś ciekawego to czyta się momentalnie

bardzo mnie to interesuje, tyle się mówiło o głosowej obsłudze Opery ale jak widać to wciąż tylko melodia przyszłości

MrL w niedzielę 16 maja 2004 o 17³¹ napisał(a):

Hmm, a wiec czegos niedopatrzylem w konfiguracji.
Posiedze jeszcze nad tym wieczorem.

andol w niedzielę 16 maja 2004 o 19⁰⁰ napisał(a):

Ad. 2. Jest to specjalna wersja opery, z aktywna modulem dzwiekowym. Przedstawia
sie jako Opera 7.30. Nie wiem czy posiada wszystkie funkcje, bo testowalem tylko dzwiek.

Bo jest to Opera 7.30. A brak w niej M2.

Kiedy przebrnalem przez sciaganie i instalacje, przystapilem do testow.
Pierwszy test z prezentacji zawartej w helpie do opery to wypelnianie formy glosem. [...]
Probowalem w ten sposob wstawic liczbe kilkaset razy i ciagle w odpowiedzi slyszalem
tylko "Sorry, I did not understand".

Trzy dema o których tu wspominasz działają doskonale -- i to zarówno w przypadku rozpoznawania spontanicznej mowy ciągłej jak i izolowanych słów. Moim zdaniem nie skonfigurowałeś odpowiednio systemu dźwiękowego.
Uruchom koniecznie program "Audio Setup - US English". Najważniejszym elementem konfiguracji jest określenie poziomu tła akustycznego. Dzięki temu aplikacja może prawidłowo odróżniać Twoje wypowiedzi od szumu tła oraz innych zakłóceń.
Jeżeli nie przeprowadziłeś kalibracji, lub co gorsza podczas określania poziomu tła po prostu mówiłeś do mikrofonu -- rzeczywiście nie masz szans na skuteczne rozpoznawanie mowy.
Ważne: na wykrywane tło mają wpływ nie tylko zakłócenia zewnętrzne, ale również zastosowany mikrofon. Tak więc o ile stosunkowo duże zmiany hałasu panującego w otoczeniu (już po przeprowadzeniu kalibracji) nie obniżają drastycznie skuteczności rozpoznawania, to po zmianie mikrofonu konieczna jest ponowna kalibracja.

Wszystkie trzy dema działają bardzo dobrze -- a skuteczność rozpoznawania mogłaby być jeszcze wyższa, gdyby zoptymalizować bazę wzorców.

Pizzę bez problemów mogę zamówić:
- wygłaszając po angielsku zdanie "Chciałbym zamówić jedną dużą pizzę z dodatkowym serem, z oliwkami i z szynką;
- prowadząc "dialog" z witryną polegający na odpowiadaniu na pytania typu "Czy chciałbyś zamówić dodatkowy ser?", "Tak".

Drugi test to sterowanie przegladarka, tutaj kompletna porazka, ani razu nie udalo mi
sie wydac poprawnie komendy.

Podsumowujac calosc, przezylem srogi zawod. Byc moze nie ustawilem czegos tak jak
trzeba, a moze mam az tak beznadziejna dykcje :| Probowalem nagrywac swoj glos przy
roznych ustawieniach i nawet kiedy brzmi on bardzo czysto nie jest przyjmowany jako
komenda.

Tutaj rzeczywiście nie można spodziewać się w obecnej wersji pozytywnych efektów.
Sterowanie interfejsem użytkownika wprowadzono eksperymentalnie dopiero w multimodalnej Operze 7.30 wydanej w grudniu 2003, podczas gdy obsługa VoiceXML-a jest w niej obecna od lutego 2003.
Jest to tylko dodatek nie mający nic wspólnego z przeznaczeniem Opery dostępnej w pakiecie Multimodal Browser.
Sterowanie interfejsem użytkownika wprowadzono "na szybko", bez stworzenia odpowiedniej bazy wzorców - działa to zapewne w przypadku głosu Jonny'ego, który zajmuje się funkcjami głosowymi w Operze.

[POPRAWKA]
Mieszają mi się już wersje i daty.
Sterowanie Operą z pomocą głosu dodano dopiero w lutowej wersji Opery 7.30 (luty 2004). W wersji 7.30 opublikowanej w grudniu 2003 funkcji tej jeszcze nie było.
Ale głowy nie daję...

MrL w niedzielę 16 maja 2004 o 22³⁶ napisał(a):

Ha! No i jednak dziala.

Moge sobie wstawiac te liczby do formy, moge sterowac przegladarka, moge ustawic sobie
wlasne komendy ('Baby: close' na zamkniecie strony, 'Baby: shut up!' na zamkniecie
opery ). Komendy nie zawsze wchodza, ale dziala to nawet nawet.

Problem byl z mikrofonem, podlaczylem inny i po kalibracji dziala.
Dziwne jest tylko ze obsluga dzwieku jest nieaktywna kiedy nie jest zaladowana
zadna strona, przez co np. nie mozna powiedziec 'Baby: home', kiedy nie jest sie
juz na jakiejs stronie.

andol: dzieki za ostatniego posta, dzieki niemu jeszcze raz sie za to wzialem
i zmienilem zdanie na temat tej technologii

Nasty w poniedziałek 17 maja 2004 o 07³⁰ napisał(a):

Originally posted by MrL
Ha! No i jednak dziala.

Moge sobie wstawiac te liczby do formy, moge sterowac przegladarka, moge ustawic sobie
wlasne komendy ('Baby: close' na zamkniecie strony, 'Baby: shut up!' na zamkniecie
opery ).

Originally posted by andol
Pizzę bez problemów mogę zamówić:
- wygłaszając po angielsku zdanie "Chciałbym zamówić jedną dużą pizzę z dodatkowym serem, z oliwkami i z szynką;

:droooooooooooooooooling:

Zaraz, to będzie można też wypełniać formularze na zwykłych stronach?? Czyli np. będę mógł dyktować Operze posta na forum po angielsku?

andol w poniedziałek 17 maja 2004 o 08³⁶ napisał(a):

Originally posted by Nasty
:droooooooooooooooooling:

Zaraz, to będzie można też wypełniać formularze na zwykłych stronach?? Czyli np. będę mógł dyktować Operze posta na forum po angielsku?

Nie, nie...
To działa na stronach VioceXML.
Takich stron przeznaczonych do użytku na komputerach klasy desktop nie znajdziesz obecnie w sieci z prostego powodu: żadna popularna przeglądarka desktopowa nie obsługuje VoiceXML-a.
Wyjątkiem jest ta specjalna wersja Opery czy też windowsowa wersja Netfronta (która służy raczej do testowania witryn stworzonych dla urządzeń przenośnych z zainstalowanym Netfrontem).

VoiceXML nie musi być wiązany ze stroną wizualną (aplikacja VoiceXML nie musi np. być stroną WWW). Jeśli chodzi o przyszłość, zapewne prędzej trafisz na aplikację VoiceXML-ową dzwoniąc do jakiegoś biura obsługi klienta...

Nasty w poniedziałek 17 maja 2004 o 08⁵⁸ napisał(a):

Originally posted by andol
Nie, nie...
To działa na stronach VioceXML.

Ok, ale ja nie mówię o sterowaniu stroną głosem, tylko ustawiam się na polu edycyjnym i Opera przekłada to co mówię na tekst. Jeśli Opera rozpoznaje mowę, to coś takiego na pewno jest możliwe do zrobienia. A jeśli jest możliwe - i jaki to by był power feature!! - to chyba jak najbardziej powinni to umożliwić..

BTW: nie działa serwer hostujący mini-stronę OperaPL. Nie wiesz może kiedy wstanie i czy będą jeszcze jakieś przerwy? Bo na infojama.pl opublikowali newsa o Operze i ktoś pyta o polską wersję. Chciałem dać odnośnik do http://operapl.prv.pl/opera.html

andol w poniedziałek 17 maja 2004 o 09²² napisał(a):

Originally posted by Nasty
Ok, ale ja nie mówię o sterowaniu stroną głosem, tylko ustawiam się na polu edycyjnym i Opera przekłada to co mówię na tekst. Jeśli Opera rozpoznaje mowę, to coś takiego na pewno jest możliwe do zrobienia. A jeśli jest możliwe - i jaki to by był power feature!! - to chyba jak najbardziej powinni to umożliwić..

Nie sądzę, aby to wprowadzono, chyba że jako osobno pobieraną dodatkową funkcję. Dołączenie funkcji głosowych znacznie zwiększa rozmiar Opery.

O ile wiem, to implementacją funkcji głosowch zajmuje się obecnie jedna osoba. Jak na razie jest jeszcze bardzo dużo do zrobienia w podstawowym nurcie, tzn. w obsłudze VoiceXML. Wtyczka VoiceXML-owa Opery jest jeszcze daleka od ideału.

BTW: nie działa serwer hostujący mini-stronę OperaPL. Nie wiesz może kiedy wstanie i czy będą jeszcze jakieś przerwy? Bo na infojama.pl opublikowali newsa o Operze i ktoś pyta o polską wersję. Chciałem dać odnośnik do http://operapl.prv.pl/opera.html

Niestety nic na ten temat nie wiem. Serwer ma być podobno uruchomiony dzisiaj w nocy.
To już drugi pad serwera w ciągu ostatnich dwóch tygodni... Gdyby nie brak czasu, już rozejrzałbym się za czymś innym. Dotychczas byłem bardzo zadowolony z działania starzaki.eu.org. Jednak te ostatnie pady, i to akurat w takim momencie...

Nasty w poniedziałek 17 maja 2004 o 17²² napisał(a):

Originally posted by andol
Nie sądzę, aby to wprowadzono, chyba że jako osobno pobieraną dodatkową funkcję. Dołączenie funkcji głosowych znacznie zwiększa rozmiar Opery.

Dobrze, ale wciąż nie rozumiem w czym problem...
Wiem, muszę dociągnąć sobie powiedzmy ponad 100MB. Ale jeśli opera potrafi zrozumieć moje słowa i wypełnić nimi formularz VoiceXML, to chyba nie jest żadnym problemem zrozumieć moje słowa (to już umie) i wypisać je w postaci tekstu w jakimkolwiek polu edycyjnym.. Coś przeoczyłem?

Originally posted by andol
O ile wiem, to implementacją funkcji głosowch zajmuje się obecnie jedna osoba. Jak na razie jest jeszcze bardzo dużo do zrobienia w podstawowym nurcie, tzn. w obsłudze VoiceXML. Wtyczka VoiceXML-owa Opery jest jeszcze daleka od ideału.

No, teraz są na giełdzie, ponoć to im daje szerokie perspektywy na rozwój, inwestycje, zwiększenie zatrudnienia. Więc myślę, że jeśli będzie potrzebna więcej niż jedna, to zatrudnią więcej osób.

Ryszard w poniedziałek 17 maja 2004 o 17⁴⁹ napisał(a):

/ot/ www.operapl.prv.pl

Chciałem dać odnośnik do http://operapl.prv.pl/opera.html

W tym momencie działa tylko odnośnik do http://operapl.prv.pl/ - "rezerwowa" strona na webpark.pl

Opera Software daje głos przeglądarce - za PCWK

/ot/ www.operapl.prv.pl