Opera Software daje głos przeglądarce - za PCWK

w dziale Opera
tashi napisał(a):

Więcej tu:
http://www.pcworld.pl/news/65010.html

Czyżby już jako standard w O7.5?
Poczekamy, zobaczymy

jedrzej napisał(a):

eee, moim zdaniem raczej w 8.

andol napisał(a):

Originally posted by jedrzej
eee, moim zdaniem raczej w 8.



Hm...
Taka Opera jest już dostępna od ponad roku... Ja ją mam chyba od lutego 2003.
Nie widziałem jeszcze sterowania za pomocą głosu interfejsem użytkownika Opery - w ostatniej wersji MM opcja ta jest nieaktywna (załącznik).

mm.png

andol napisał(a):

Sterowanie Opery za pomocą głosu jest już aktywne bigsmile

Operę możemy teraz nazywać "baby" wink Dokładniej, każdą komendę głosową sterującą interfejsem użytkownika należy poprzedzić jednym z haseł (wybranych w preferencjach):
-Browser,
-Opera,
-Baby,
-Hal.

Pobawię się i opowiem później.

mm_opera.png

jedrzej napisał(a):

skąd zdobyć taką Operę? smile

Mayor napisał(a):

andolq drugi raz na ten sam numer nas nie nabierzesz p
a 1st April dopiero za 3 dni wink

Pragma_Inline napisał(a):

Oficjalna wersja Opery sterowana głosem powinna pojawić się wraz z 7.5 final. Wiem z pewnego źródła od Junyora. Poza tym był gdzieś o tym artykuł.
pi

titus-s napisał(a):

Artykuł był na www.dobreprogramy.pl.

oksza napisał(a):

Ja mogę tylko dodać że widziałem bodajże w ostatnim press release że opera głosowa to kwestia miesiąca, dwóch.. więc raczej nie 8.

andol napisał(a):

Originally posted by Mayor
andolq drugi raz na ten sam numer nas nie nabierzesz p
a 1st April dopiero za 3 dni wink



LOL!

Wystarczy raz zrobić kawał, a potem nikt człowiekowi nie uwierzy bigsmile bigsmile. Nie pozostaje mi nic innego jak zrezygnować z primaaprilisowego żartu w tym roku.
Zapewniam: to co było rok temu moim żartem [1] -- stało się teraz faktem. Niestety mój akcent jest najwidoczniej za mało amerykański wink i sterowanie Operą za pomocą głosu nie za dobrze wychodzi...


[1] Zeszłoroczny żarcik jest wciąż dostępny tutaj.

qviri napisał(a):

Weźcie mi tego nie przypominajcie bigsmile

Nasty napisał(a):

Originally posted by andol
Sterowanie Opery za pomocą głosu jest już aktywne bigsmile
(...) każdą komendę głosową sterującą interfejsem użytkownika należy poprzedzić jednym z haseł (wybranych w preferencjach):
-Browser,
-Opera,
-Baby,
-Hal.


bigeyes lol Naprawdę? Fajnie. smile
Będę więc z przyjemnością (obustronną? whistle ) rozmawiał z moją Operą, zwracając się do niej per Hal. happy bigsmile

outofspace napisał(a):

hmm no i mamy 7.50 ale hmm mowie do niej a ona nic smile

klausa napisał(a):

A jak uaktywnić tą opcję?

MrL napisał(a):

Nie wiem jak wyglada ta kwestia w wersji 7.50, wydaje mi sie ze nie jest
jeszcze aktywna.

Postanowilem jednak jakis czas temu poeksperymentowac troche z tymi dzwiekowymi
bajerami. Znalazlem na forum jeden watek na ten temat, ale juz dosc stary,
wiec opisze do czego mnie udalo sie dojsc.

Po pierwsze nalezy sciagnac ze strony IBM Multimodal Tools, czyli pakiet
w sklad ktorego wchodza:

1. Multimodal Toolkit V4.1.5 for WebSphere Studio
2. Multimodal Browser V4.1
3. IBM WebSphere Voice Server SDK 3.1.1

Ad. 1. Ta czesc nie chciala sie zainstalowac, z powodu braku WebSphere Studio,
ktore ma w zaleznosci od wersji od 860MB do 1,5GB. Jak dla mnie to troche za
duzo, wiec nie probowalem nawet sciagania.

Ad. 2. Jest to specjalna wersja opery, z aktywna modulem dzwiekowym. Przedstawia
sie jako Opera 7.30. Co ciekawe nie ma bannera reklamowego i podaje w about ze
jest registered smile Nie wiem czy posiada wszystkie funkcje, bo testowalem tylko dzwiek.

Ad. 3. Zdaje sie ze ta czesc wlasnie odpowiada za obrobke dzwieku.

Calosc zajmuje 128MB i jest przeznaczona dla Win2K, nie sprawdzalem czy dziala na
innych systemach.

Kiedy przebrnalem przez sciaganie i instalacje, przystapilem do testow.
Pierwszy test z prezentacji zawartej w helpie do opery to wypelnianie formy glosem.
Klikamy na puste okienko i slyszymy glos: "Please say a number between one and three".
Zalozenie jest takie ze system rozpozna liczbe ktora podamy i wstawi tekst w okienko.

Probowalem w ten sposob wstawic liczbe kilkaset razy i ciagle w odpowiedzi slyszalem
tylko "Sorry, I did not understand". Jeden jedyny raz udalo mi sie podac liczbe trzy.
Majstrowalem na wszystkie strony w swoich ustawieniach dzwieku, ustawialem mikrofon
w roznych miejscach, mowilem szybko, wolno, grubym glosem i cienkim. Jedna udana proba
na jakies 400.

Drugi test to sterowanie przegladarka, tutaj kompletna porazka, ani razu nie udalo mi
sie wydac poprawnie komendy.

Podsumowujac calosc, przezylem srogi zawod. Byc moze nie ustawilem czegos tak jak
trzeba, a moze mam az tak beznadziejna dykcje :| Probowalem nagrywac swoj glos przy
roznych ustawieniach i nawet kiedy brzmi on bardzo czysto nie jest przyjmowany jako
komenda.

Przepraszam za strasznie dlugi post.
Chetnie przeczytalbym o doswiadczeniach innych w tym temacie, moze po prostu cos
zle ustawilem.

Mayor napisał(a):

nie przepraszaj za długi post jak pisze się coś ciekawego to czyta się momentalnie wink

bardzo mnie to interesuje, tyle się mówiło o głosowej obsłudze Opery ale jak widać to wciąż tylko melodia przyszłości

MrL napisał(a):

Hmm, a wiec czegos niedopatrzylem w konfiguracji.
Posiedze jeszcze nad tym wieczorem.

andol napisał(a):

Ad. 2. Jest to specjalna wersja opery, z aktywna modulem dzwiekowym. Przedstawia
sie jako Opera 7.30. Nie wiem czy posiada wszystkie funkcje, bo testowalem tylko dzwiek.



Bo jest to Opera 7.30. A brak w niej M2.

Kiedy przebrnalem przez sciaganie i instalacje, przystapilem do testow.
Pierwszy test z prezentacji zawartej w helpie do opery to wypelnianie formy glosem. [...]
Probowalem w ten sposob wstawic liczbe kilkaset razy i ciagle w odpowiedzi slyszalem
tylko "Sorry, I did not understand".



Trzy dema o których tu wspominasz działają doskonale -- i to zarówno w przypadku rozpoznawania spontanicznej mowy ciągłej jak i izolowanych słów. Moim zdaniem nie skonfigurowałeś odpowiednio systemu dźwiękowego.
Uruchom koniecznie program "Audio Setup - US English". Najważniejszym elementem konfiguracji jest określenie poziomu tła akustycznego. Dzięki temu aplikacja może prawidłowo odróżniać Twoje wypowiedzi od szumu tła oraz innych zakłóceń.
Jeżeli nie przeprowadziłeś kalibracji, lub co gorsza podczas określania poziomu tła po prostu mówiłeś do mikrofonu -- rzeczywiście nie masz szans na skuteczne rozpoznawanie mowy.
Ważne: na wykrywane tło mają wpływ nie tylko zakłócenia zewnętrzne, ale również zastosowany mikrofon. Tak więc o ile stosunkowo duże zmiany hałasu panującego w otoczeniu (już po przeprowadzeniu kalibracji) nie obniżają drastycznie skuteczności rozpoznawania, to po zmianie mikrofonu konieczna jest ponowna kalibracja.

Wszystkie trzy dema działają bardzo dobrze -- a skuteczność rozpoznawania mogłaby być jeszcze wyższa, gdyby zoptymalizować bazę wzorców.

Pizzę bez problemów mogę zamówić:
- wygłaszając po angielsku zdanie "Chciałbym zamówić jedną dużą pizzę z dodatkowym serem, z oliwkami i z szynką;
- prowadząc "dialog" z witryną polegający na odpowiadaniu na pytania typu "Czy chciałbyś zamówić dodatkowy ser?", "Tak".


Drugi test to sterowanie przegladarka, tutaj kompletna porazka, ani razu nie udalo mi
sie wydac poprawnie komendy.

Podsumowujac calosc, przezylem srogi zawod. Byc moze nie ustawilem czegos tak jak
trzeba, a moze mam az tak beznadziejna dykcje :| Probowalem nagrywac swoj glos przy
roznych ustawieniach i nawet kiedy brzmi on bardzo czysto nie jest przyjmowany jako
komenda.



Tutaj rzeczywiście nie można spodziewać się w obecnej wersji pozytywnych efektów.
Sterowanie interfejsem użytkownika wprowadzono eksperymentalnie dopiero w multimodalnej Operze 7.30 wydanej w grudniu 2003, podczas gdy obsługa VoiceXML-a jest w niej obecna od lutego 2003.
Jest to tylko dodatek nie mający nic wspólnego z przeznaczeniem Opery dostępnej w pakiecie Multimodal Browser.
Sterowanie interfejsem użytkownika wprowadzono "na szybko", bez stworzenia odpowiedniej bazy wzorców - działa to zapewne w przypadku głosu Jonny'ego, który zajmuje się funkcjami głosowymi w Operze.

[POPRAWKA]
Mieszają mi się już wersje i daty.
Sterowanie Operą z pomocą głosu dodano dopiero w lutowej wersji Opery 7.30 (luty 2004). W wersji 7.30 opublikowanej w grudniu 2003 funkcji tej jeszcze nie było.
Ale głowy nie daję...

MrL napisał(a):

Ha! No i jednak dziala.

Moge sobie wstawiac te liczby do formy, moge sterowac przegladarka, moge ustawic sobie
wlasne komendy ('Baby: close' na zamkniecie strony, 'Baby: shut up!' na zamkniecie
opery smile ). Komendy nie zawsze wchodza, ale dziala to nawet nawet.

Problem byl z mikrofonem, podlaczylem inny i po kalibracji dziala.
Dziwne jest tylko ze obsluga dzwieku jest nieaktywna kiedy nie jest zaladowana
zadna strona, przez co np. nie mozna powiedziec 'Baby: home', kiedy nie jest sie
juz na jakiejs stronie.

andol: dzieki za ostatniego posta, dzieki niemu jeszcze raz sie za to wzialem
i zmienilem zdanie na temat tej technologii smile

Nasty napisał(a):

Originally posted by MrL
Ha! No i jednak dziala.

Moge sobie wstawiac te liczby do formy, moge sterowac przegladarka, moge ustawic sobie
wlasne komendy ('Baby: close' na zamkniecie strony, 'Baby: shut up!' na zamkniecie
opery smile ).


Originally posted by andol
Pizzę bez problemów mogę zamówić:
- wygłaszając po angielsku zdanie "Chciałbym zamówić jedną dużą pizzę z dodatkowym serem, z oliwkami i z szynką;


bigeyes eek faint knockout :droooooooooooooooooling:

Zaraz, to będzie można też wypełniać formularze na zwykłych stronach?? Czyli np. będę mógł dyktować Operze posta na forum po angielsku? yikes faint faint

andol napisał(a):

Originally posted by Nasty
bigeyes eek faint knockout :droooooooooooooooooling:

Zaraz, to będzie można też wypełniać formularze na zwykłych stronach?? Czyli np. będę mógł dyktować Operze posta na forum po angielsku? yikes faint faint



Nie, nie...
To działa na stronach VioceXML.
Takich stron przeznaczonych do użytku na komputerach klasy desktop nie znajdziesz obecnie w sieci z prostego powodu: żadna popularna przeglądarka desktopowa nie obsługuje VoiceXML-a.
Wyjątkiem jest ta specjalna wersja Opery czy też windowsowa wersja Netfronta (która służy raczej do testowania witryn stworzonych dla urządzeń przenośnych z zainstalowanym Netfrontem).

VoiceXML nie musi być wiązany ze stroną wizualną (aplikacja VoiceXML nie musi np. być stroną WWW). Jeśli chodzi o przyszłość, zapewne prędzej trafisz na aplikację VoiceXML-ową dzwoniąc do jakiegoś biura obsługi klienta...

Nasty napisał(a):

Originally posted by andol
Nie, nie...
To działa na stronach VioceXML.


Ok, ale ja nie mówię o sterowaniu stroną głosem, tylko ustawiam się na polu edycyjnym i Opera przekłada to co mówię na tekst. Jeśli Opera rozpoznaje mowę, to coś takiego na pewno jest możliwe do zrobienia. A jeśli jest możliwe - i jaki to by był power feature!! - to chyba jak najbardziej powinni to umożliwić.. idea

BTW: nie działa serwer hostujący mini-stronę OperaPL. Nie wiesz może kiedy wstanie i czy będą jeszcze jakieś przerwy? Bo na infojama.pl opublikowali newsa o Operze i ktoś pyta o polską wersję. Chciałem dać odnośnik do http://operapl.prv.pl/opera.html

andol napisał(a):

Originally posted by Nasty
Ok, ale ja nie mówię o sterowaniu stroną głosem, tylko ustawiam się na polu edycyjnym i Opera przekłada to co mówię na tekst. Jeśli Opera rozpoznaje mowę, to coś takiego na pewno jest możliwe do zrobienia. A jeśli jest możliwe - i jaki to by był power feature!! - to chyba jak najbardziej powinni to umożliwić.. idea



Nie sądzę, aby to wprowadzono, chyba że jako osobno pobieraną dodatkową funkcję. Dołączenie funkcji głosowych znacznie zwiększa rozmiar Opery.

O ile wiem, to implementacją funkcji głosowch zajmuje się obecnie jedna osoba. Jak na razie jest jeszcze bardzo dużo do zrobienia w podstawowym nurcie, tzn. w obsłudze VoiceXML. Wtyczka VoiceXML-owa Opery jest jeszcze daleka od ideału.

BTW: nie działa serwer hostujący mini-stronę OperaPL. Nie wiesz może kiedy wstanie i czy będą jeszcze jakieś przerwy? Bo na infojama.pl opublikowali newsa o Operze i ktoś pyta o polską wersję. Chciałem dać odnośnik do http://operapl.prv.pl/opera.html



Niestety nic na ten temat nie wiem. Serwer ma być podobno uruchomiony dzisiaj w nocy.
To już drugi pad serwera w ciągu ostatnich dwóch tygodni... Gdyby nie brak czasu, już rozejrzałbym się za czymś innym. Dotychczas byłem bardzo zadowolony z działania starzaki.eu.org. Jednak te ostatnie pady, i to akurat w takim momencie... sad sad sad

Nasty napisał(a):

Originally posted by andol
Nie sądzę, aby to wprowadzono, chyba że jako osobno pobieraną dodatkową funkcję. Dołączenie funkcji głosowych znacznie zwiększa rozmiar Opery.


Dobrze, ale wciąż nie rozumiem w czym problem...
Wiem, muszę dociągnąć sobie powiedzmy ponad 100MB. Ale jeśli opera potrafi zrozumieć moje słowa i wypełnić nimi formularz VoiceXML, to chyba nie jest żadnym problemem zrozumieć moje słowa (to już umie) i wypisać je w postaci tekstu w jakimkolwiek polu edycyjnym.. Coś przeoczyłem? confused

Originally posted by andol
O ile wiem, to implementacją funkcji głosowch zajmuje się obecnie jedna osoba. Jak na razie jest jeszcze bardzo dużo do zrobienia w podstawowym nurcie, tzn. w obsłudze VoiceXML. Wtyczka VoiceXML-owa Opery jest jeszcze daleka od ideału.


No, teraz są na giełdzie, ponoć to im daje szerokie perspektywy na rozwój, inwestycje, zwiększenie zatrudnienia. Więc myślę, że jeśli będzie potrzebna więcej niż jedna, to zatrudnią więcej osób.

Ryszard napisał(a):

/ot/ www.operapl.prv.pl

Chciałem dać odnośnik do http://operapl.prv.pl/opera.html


W tym momencie działa tylko odnośnik do http://operapl.prv.pl/ - "rezerwowa" strona na webpark.pl