Testwiki:Bar/wymowa, IPA, AS, sylaby
Transkrypcja i transliteracja
Kiedyś w dyskusji użytkownika Romek poruszyłem problem transkrypcji i transliteracji. W ramach wstępu proszę wszystkich o zapoznanie się z moją wiadomością tam. Romek zaczął teraz wstawiać stworzony przez siebie szablon Szablon:S do haseł. W ten sposób powstaje kilka problemów:
- dalej nie wiadomo, według jakich zasad wpisywana jest transkrypcja/transliteracja z cyrylicy a jest to niezwykle ważne bo jest kilka standardów dla rosyjskiego i chyba kilku innych języków
- w kilku hasłach mamy transkrypcję i transliterację osobno a w jidysz (אַמביציעז) mamy razem
- absolutnie niedopuszczalne jest, żeby wstawiać kod HTML do haseł, jak to jest np. w Москва; rozwiązaniem byłoby zmienienie obecnego szablonu Szablon:S, żeby wstawiał <br> przed siebie - ale to trzeba ustalić i zaklepać a nie wstawiać HTML ręcznie
- dodatkowa linijka to jednak dodatkowe marnowanie miejsca, najczęściej nie będzie w niej nic; czasami - jedno słowo
Są dwa wyjścia: albo tworzymy dodatkową linijkę "transkrypcja" w każdym haśle w alfabecie niełacińskim, albo wykorzystujemy obecną linijkę "transliteracja" do wstawiania również transkrypcji. Ja jestem za drugim rozwiązaniem. --Derbeth talk 16:35, 5 lis 2007 (CET)
- Temat raczej grząski, ale wtrącę moje trzy grosze. Transkrypcję - tę fonetyczną - mamy już przy wymowie. Natomiast transliteracja, uważam, że w przyszłości, nie będzie używana. Bo zastanówmy się, gdzie była ona stosowana: przy cytatach lub bibliografii z języków pisanych innymi alfabetami, kiedy teksty pisano na maszynach do pisania i nie było możliwości zastosowania innych alfabetów. Dzisiaj komputery pozwalają nam na to. No ale to tylko moja opinia. :) --Richiski 17:04, 5 lis 2007 (CET)
Nie ma sensu tworzyć sekcj/linijki Szablon:S, bo transkrypcja ma służyć pomocą przy wymowie (według węższego znaczenia transkrypcji → Wikipedia) albo "odtworzeniu tekstu pisanego danym alfabetem za pomocą innego alfabetu albo innych zasad ortograficznych" (według szerszego znaczenia transkrypcji, obejmującego także transkrypcję fonetyczną → Encyklopedia językoznawstwa ogólnego, Wrocław, 1999). A więc miejsce dla transkrypcji jest jak najbardziej w sekcji/linijce Szablon:S albo w sekcji/linijce Szablon:S. Zgadzam się z 3. i 4. punktem Derbetha, a propos 2. nic nie mogę powiedzieć, bo nie znam się na jidysz, natomiast co do 1. proponuję wymagać (tak jak to zostało zrobione w jidysz) podawania w jakiej tranksrypcji/transliteracji dany zapis jest... heh... podany (jeśli nie ma, to kasujemy albo, praca dla nielicznych chętnych/znających się, odszukujemy i wstawiamy). Youandme 20:03, 5 lis 2007 (CET)
- Aha, zapomniał bym. W dyskusji Romka postulowałem, by w sekcji tłumaczenia podawać w nawiasie nie transliterację, ale transkrypcję. Co o tym myślicie? Ma to sens, czy nie? --Derbeth talk 21:00, 5 lis 2007 (CET)
- W mojej opinii ma to bardzo duży sens, ale obciążyłoby: 1. pracą - nas, 2. zawartością - hasła. Wiemy bardzo dobrze, że inaczej wymawia się słowa pojedyncze, a inaczej, gdy tworzą one ciąg zdaniowy. Np. weźmy angielskie zdanie: tell him, już nie wymawia się tak, jak oddzielne słowa tell i him; podobnie zresztą jest w wielu innych językach (fr, es, el itp.) a również w polskim, gdzie sąsiedztwo jednych dźwięków wpływa na wymowę innych. DIXI :)--Richiski 21:13, 5 lis 2007 (CET)
- Ale i tak musimy coś podawać, bo nie każdy zna np. pismo arabskie! I teraz dylemat: czy podawać transliterację (wtedy coś łacinką jest, ale i tak nie wiemy, jak to wymówić, bo nie znamy arabskiego), czy podawać transkrypcję? --Derbeth talk 21:34, 5 lis 2007 (CET)
- Zgoda, ale transkrypcja fonetyczna, dzięki wspólnym dla wszystkich języków znakom, pomaga w odczytaniu - teoretycznie - jakiegokolwiek języka. Użytkownik powinien tylko znać jakiemu dźwiękowi odpowiada znak z IPA. Natomiast transliteracja wprowadza zamieszanie, bo są różne systemy (np. to, co wspomniałeś wyżej o j. rosyjskim), albo w różnych krajach inaczej się to stosuje (np. greckie nazwisko Χατζηνικολάου, Francuzi transkrybują Chatzinikolaou, a w Polsce ten Pan wydał książki transkrybując swe nazwisko jako Chadzinikolau. Nie razbierioszsia czy ne rozberoszsja ? :) --Richiski 21:43, 5 lis 2007 (CET)
Gwoli ścisłości zabiorę głos :) Więc w jidysz w polu Szablon:S jest podawana transliteracja, która w przypadku tego języka w większości* pokrywa się z transkrypcją. Dodatkowo podaję ją w dwóch standardach: oficjalnym YIVOwskim oraz polskim zwyczajowym (różnym z polską normą PN-74/N-01212).
*W większości... bowiem słowa zapożyczone z hebrajskiego (np. → שבת) rządzą się własnymi prawami i ich oryginalny bezsamogłoskowy zapis wymaga od czytającego znajomości ich wymowy. W tym przypadku konsekwentnie podawana jest transliteracja, zaś ułatwiająca wymowę transkrypcja (bo nie było wcześniej takiego szablonu) umieszczana jest w polu Szablon:S zaraz po zapisie IPA. W tym przypadku, jak do tej pory, tylko w standardzie polskim zwyczajowym, z pominięciem YIVOwskiego.
Zastosowanie kilku systemów ma tę zaletę, iż pozwala na łatwe wyszukiwanie słowa znając tylko jego brzmienie bądź zapis. Dlatego rozważam ciągle aby po IPA dodać też zapis YIVOwski. Generalnie dużym ułatwieniem byłoby rozdzielenie transliteracji od transkrypcji ale to wymagałoby zmiany szablonu który dla wszystkich języków musi być identyczny.
Rozumiem i częściowo zgadzam się z uwagami o których pisał Richiski odnośnie sensu podawania transliteracji (maszyny do pisania, postęp) ale trzeba mieć też na uwadze to, iż nie wszyscy mają, lub nawet wiedzą jak zainstalować, inne klawiatury niż łacińska. Dlatego ów podział należałoby rozważyć. Zwłaszcza, że obecnie jest mniej potrzebna transliteracja, a od początku brakuje, bardziej uzasadnionej, trankrypcji. Ja osobiście bym za nim oponował.
Inną już zupełnie kwestią jest to, iż w jidysz zaplątały się dwa tożsame szablony Szablon:S i Szablon:S, przy czym ten drugi występuje w hasłach swego czasu importowanych botem. Dobrze by było jeszcze raz to przelecieć botem i zunifikować. Swego czasu miał to zrobić tsca ale z braku czasu odłożył na później.
Co do ewentualnego podziału to zastanawiam się nad zasadnością użycia taklich rozwijanych ramek jak w Wikipedii, angielskim Wiktionary czy przy spisach treści stron dyskusji. Na pierwszym miejscu wyświetlał by się jeden system a po kliknięciu rozwiń mielibyśmy resztę. Ale to już chyba zbyt idąca ingerencja w obecny wygląd szablonu głównego. Bo skoro tu, to czemu i nie gdzie indziej...
Pozdrawiam, --joystick [[Dyskusja Wikipedysty:Joystick|Szablon:Ltr]] 22:29, 5 lis 2007 (CET)
- Do mnie osobiście nie przemawia pomysł tworzenia sekcji transkrypcji, poza paroma szczególnymi przypadkami, o czym dalej. Nie przemawia z prostych powodów przytoczonych wcześniej: wymowa jest już zapisana uniwersalnym alfabetem IPA, a ponadto ogrom haseł ma nagrania. Do tego nie da się oddać w pełni fonemów jednego języka fonemami drugiego, zawsze musi dojść do jakiegoś niesatysfakcjonującego kompromisu. Transkrypcja nie dotyczy przecież tylko języków posługujących się innym alfabetem niż łacinką. Du ju spiik inglisz? - aż kole w oczy, a powiedzcie, to jest przecież transkrypcja? Jeśli nie znam jakiegoś języka, to jestem w stanie pogodzić się z faktem, że słownik tegoż języka nie jest dla mnie w stu procentach funkcjonalny, bo nie znam gramatyki, wymowy, itd. A Wy?
- Przypadki szczególne, kiedy to można byłoby podawać transkrypcję to tzw. "nieprzetłumaczalne" wyrazy. Chodzi głównie o nazwy własne, które można transliterować lub opcjonalnie transkrybować, czasami te zapisy się pokrywają (np. Putin). Rovdyr [łubudubu] 23:19, 5 lis 2007 (CET)
O transkrypcji i transliteracji raz jeszcze...
W związku planowaną przeze mnie reformą języka chińskiego, natknąłem się na problem, dyskutowany już, transkrypcji i transliteracji.
W hasłach z języka chińskiego używany jest szablon Szablon:S pokazujący na stronie słowo "transliteracja", tymczasem w polu tym umieszczona jest transkrypcja fonetyczna pinyin i bopomofo. Jest to błąd merytoryczny. To tak jakby, biorąc przykład z naszego poletka, kolokacje wrzucać do związków frazeologicznych albo na odwrót.
Mam następującą propozycję: by Szablon:S (tudzież Szablon:S) wyświetlał w haśle wyrażenie "transkrypcja i transliteracja" - wtedy wszyscy powinni być zadowoleni, i Joystick, który po Szablon:S wstawia transliteracje, i ci co pracują nad japońskim (to co się pojawia w tym polu to w większości transkrypcja, prawda?), i ci co będą dodawać transkrypcje języka chińskiego (ShenMi_MeiRen już sporo dodała). Ważne tylko by konsekwentnie dodawać link, który wyjaśni zapis, tak jak mamy z Szablon:S, Szablon:S, pinyin, bopomofo,...
Jak rozumiem wcześniejsza dyskusja z Baru nie dała przyzwolenia na utworzenie dodatkowego pola "transkrypcja". Przyjmując powyższe rozwiązanie udałoby się przy minimalnym wysiłku uporządkować sporo rzeczy i to tak by nikt już nie przeżywał dysonansu poznawczego. Chaotycznego nadmiaru nie powinno być, rzadko kiedy będą więcej niż dwa, trzy zapisy (ważne tylko by były otagowane), problem "zawsze jedno z pól będzie świeciło pustką" też odpada (co najwyżej jedno jedyne zaświeci ;) ).
Youandme 17:22, 29 lut 2008 (CET)
- To nie lepiej zrobić szablon Szablon:Transkrypcja i stosować go zamiennie z Szablon:Sliteracją w zależności od potrzeb danego języka? --joystick [::ש::] 20:45, 29 lut 2008 (CET)
- Jak dla mnie takie rozwiązanie jest OK, ale widziałem, że jest tendencja, do tego, by szablon był (prawie?) jednakowy dla wszystkich języków, a to wymagałoby istnienia "transliteracji" i "transkrypcji" jednocześnie. Z czego jedno z pól z reguły świeciłoby wspomnianą pustką (patrz cytowana dyskusja). Niniejszym wycofuję się ze stanowiska, żeby nie tworzyć oddzielnego pola "transkrypcja", bo patrząc na hasło z chińskiego, wolę zobaczyć jednak
- zamiast (co wynikało z mojej zeszłorocznej propozycji)
- Pozdrawiam i... na razie dobranoc Youandme 21:38, 29 lut 2008 (CET)
Moim zdaniem jeśli szablon dla różnych języków będzie się różnił ta jedną pozycją (stosowaną zamiennie) to jest do przełknięcia. Ja mam inny problem bo generalnie używam transliteracji, ale dla haseł pochodzenia hebrajskiego, gdzie stosuje się ich oryginalną tradycyjną pisownię, odpowiedniejsza byłaby jednak transkrypcja. Może w istocie najłatwiej będzię w szablonie Szablon:S naisać transkrypcja lub transliteracja: Albo go zmodyfikować i wywoływać opcjonalnie z parametrem {{trans|k}}. Brak parametru lub l to ...literacja a k to ...krypcja. --joystick [::ש::] 21:54, 29 lut 2008 (CET)
- Mieszamy pojęcia: w naszym wikisłownikowym uzusie wymowa oznacza tyle, co transkrypcja, więc nie widzę sensu tworzenia kolejnego szablonu. Prędzej bym zmieniła nazwę istniejącej sekcji i przeniosła (auć!) wszystko to, co jest w złym miejscu.
- Ad. japońskiego: to co się pojawia przy japońskim rzeczywiście jest transkrypcją Hepburna. Jest ona dostosowana do wymowy angielskiej. Chyba jednak trudno jest mówić o transliteracji języków azjatyckich zapisywanych ideogramami. W japońskim taki unik jest możliwy: tam każdy wyraz zapisany ideogramami można zapisać jednym z ichnich alfabetów, a ten z kolei przetransliterować. I właśnie "transkrypcja" Hepburna jest dla mnie raczej transliteracją, bo pomija pewne zjawiska fonetyczne ściśle przypisując określonym znakom ich odpowiedniki w alfabecie łacińskim. Nic więc nie wiem – trzeba odwołać się do autorytetu w tej kwestii. Rovdyr [odp.] 22:43, 29 lut 2008 (CET)
- Zapis Hepburna jest transkrypcją a nie transliteracją (nie wszystkie znaki kany mają swój niepowtarzalny odpowiednik w piśmie łacińskim, np. は można odczytać jako ha oraz wa). Za transliterację kany uważane są natomiast zapisy Nippon-siki i Kunreisiki (zapisy zgodnie z ich własnymi transliteracjami), gdzie każdemu znakowi kana odpowiada dokładnie jeden, niepowtarzalny ciąg liter łacińskich. Warszk 11:51, 1 mar 2008 (CET)
- Ha! Czyli pierwotnie zaproponowane rozwiązanie dla japońskiego chyba jest idealne :) (nieskromny uśmiech)
- Widzę, że Joystick też dostrzegł jego potencjał :)
- Przenoszenia wolałbym uniknąć (jak najbardziej "auć!"). Co do parametryzacji szablonu też czuję opór - na poziomie najważniejszych nagłówków chyba dobrze jest zachować jak największą prostotę.
- A uzus.. no tak... dobrze jest chronić. W takim razie gotów byłbym przełknąć "wymowę" z pinyinem i bopomofo (bo tutaj mam chyba już tylko argumenty z pogranicza estetyki i prywatnych przyzwyczajeń).
- To co teraz? Bo chyba pozostały 2 propozycje:
- 1) zachowujemy uzus, czyli transkrypcje przenosimy do "wymowy"
- 2) transkrypcje i transliteracje wrzucamy do "trans" (a w wymowie pozostaną ładnie oklamerkowane transkrypcje fonetyczne)
- Youandme 09:24, 1 mar 2008 (CET)
- Hmm... Ja w sumie zupełnie nie rozumiem sensu dyskusji - być może jestem laikiem, ale dla mnie transliteracja = transkrypcja. Pi razy oko. Zakładam jednak, że większość użytkowników słownika też nie odróżnia. Może słabe uzasadnienie, ale jednak.
- Przeciw przeniesieniu pinyin i bopomofo do wymowy przemawia fakt, że żadne z nich nie jest wystandaryzowane (IPA?) ani spolszczone (xi czytamy jako polskie si/ś etc). Więc może lepiej zostawić jedną pozycję - transkrypcję. W wymowie okazjonalnie można zamieścić za to link do odsłchania słowa...
- Ad. japońskiego: przejrzałam kilkanaście haseł i myślę, że wypadałoby - wzorem chińskiego - gdzieś wyjaśnić dlaczego hasła mają często kilka różnych transkrypcji i jaka jest między nimi różnica. Zwłaszcza, że w przeciwieństwie do j.chińskiego, gdzie pinyin i bopomofo są synonimiczne, czytania japońskie są różne i uzależnione od kontekstu występowania kanji. Więc należałoby jakoś zapisać to, że 人 można odczytać jako (1.1)ヒト(hito) lub (1.2)じん (jin), odpowiednio mówiąc o (1.1) osobie lub o (1.2) człowieku. Także, chyba trzebaby usunąć hasła "japońskie" w stylu arigatō, ale to już odrębna kwestia. ShenMi MeiRen 18:33, 1 mar 2008 (CET)
- Dobrze, że jesteś, ShenMi_MeiRen.
- Definicjami zaczerpniętymi z papierowych źródeł mogę służyć dopiero w poniedziałek po południu, a teraz jedynie polecam w:Transliteracja i w:Transkrypcja. Różnica w znaczeniach jest ewidentna, prawda?
- Wobec powyższego, i pinyin, i bopomofo nie są transliteracjami, bo nie przypisują każdemu znakowi chińskiemu unikalnej kombinacji znaków z innego systemu, czyli tak by na podstawie zapisu przy użyciu tego drugiego systemu można było jednoznacznie określić o jaki znak chodzi. Ponadto sama przyznasz, że starają się odzwierciedlić wymowę. Więc są transkrypcjami. Fonetycznymi - w pełni lub nie, ale nie transliteracjami.
- Jeśli nawet większość użytkowników słownika nie odróżnia tych dwóch terminów, to nie wprowadzajmy ich w błąd! Tak jak staramy się odróżniać kolokacje od związków frazeologicznych (by nie podawać bardziej drastycznych przykładów).
- Z jednej strony przeniesienie pinyinu i bopomofo do "wymowy" jest o tyle uprawnione, że jednak opisują wymowę. To nic, że nie są spolszczone. Czy IPA jest spolszczone? To nic, że nie wystandaryzowane. Zaczniemy umieszczać zapisy wystandaryzowane, których nie używa nikt oprócz garstki językoznawców?
- Z drugiej strony, gdyby transkrypcje i transliteracje trzymać w jednym worku nazwanym właśnie "transkrypcje i transliteracje", "transkrypcje, transliteracje", "transkrypcja lub transliteracja", itp., można by uniknąć błędów merytorycznych, uniknąć sporego nakładu pracy i wielu innych problemów.
- Pozostawienie obecnej postaci jest moim zdaniem szkodliwe dla Wikisłownika i dla użytkowników.
- Co do japońskiego... wciąż nie wypowiadam się - dwa dni to za krótko by opanować ten język ;) Choć widzę, że przenoszenie tych wszystkich czytań do "wymowy" pewnie będzie budziło jsszcze większy opór.
- Youandme 10:39, 2 mar 2008 (CET)
- No ok. Ale w takim razie transliteracja w chińskim będzie zawsze pusta. W japońskim też. Natomiast zamieszczanie w wymowie podwójnego zapisu jest nieco bez sensu. Zwłaszcza, że raczej wtedy powinno pojawiać się np. sh4 zamiast shì, gdyż tak prawidłowo oznacza się wymowę w języku chińskim obecnie...
- Podsumowując, jestem za zrobieniem nowego szablonu dla transkrypcji lub połączenia transkrypcja/transliteracja. Hm? ShenMi MeiRen 12:56, 2 mar 2008 (CET)
- Połączenie transkrypcja/transliteracja to jest właśnie jedna z promowanych przeze mnie propozycji (jak widzę tymczasowych). Zindywidualizowanie szablonów dla różnych (przede wszystkim orientalnych) języków też jest dla mnie akeceptowalne (m.in. wstawienie transkrypcji i wyrzucenie transliteracji w języku chińskim) - nie ma sensu zniekształcać świata wpychając coś na siłe w szablony. Youandme 20:17, 3 mar 2008 (CET)
- P.S. Co do japońskiego, absolutnie czytań nie można do wymowy. Czytanie = znaczenie. Ponownie: transkrypcja albo jeszcze lepiej nowa, unikalna dla japońskiego kategoria: czytanie. Tyle, że zanim tu zaczniemy mieszać, postulowałabym jednak najpierw uzgodnić optymalny kształt hasła słownika japońskiego, tak, żeby utworzony szablon miał sens. Zmiany ad hoc wprowadza tylko zamieszanie...
- Zatem tu oczywiście też popieram zindywidualizowanie kształtu hasła, jeśli tylko w ten sposób da się uniknąć błędów merytorycznych oraz bezsensownej pustki w innych polach. Wygląda więc na to, że pole, które obecnie identyfikuje szablon Szablon:S, w zależności od języka, mogłoby się zmienić w transliterację, transkrypcję, czytanie. Są jeszcze jakieś egzotyczne wyjątki? Youandme 20:17, 3 mar 2008 (CET)
- Jestem przeciwna tworzeniu równoległych szablonów "wymowa" i "transkrypcja", ponieważ te wyrazy są prawie synonimiczne – jeden jest z potocznego rejestru, a drugi z naukowego, nazywają jednak to samo. Wymowa jest szersza o tyle, że obejmuje nagranie, które transkrypcją nazwać się nie da. Gdyby utworzyć strony aneksu omawiające poszczególne rodzaje transkrypcji i odsyłać do nich tak, jak to obecnie robi szablon IPA, to wszystko w moim mniemaniu powinno być dobrze :-) Przecież nikt nie broni wstawiać kilku rodzajów transkrypcji obok siebie.
- W żadnym wypadku nie wolno też tworzyć szablonu-kombinacji "transkrypcjoliteracja" (niepotrzebne skreślić? to właśnie będzie wprowadzaniem użytkowników w błąd).
- Podoba mi się propozycja opracowania nowszej wersji szablonu dla języków "nietypowych". Sekcje "czytanie", "złożenia" polepszyłyby czytelność haseł. Wstępnie zaczęłam rozmyślać nad formą japońskiego tu. Może wyjdzie z tego coś konstruktywnego, zatem zapraszam do opracowywania tego razem ze mną (zwracam się głównie do Shen i Zająca, ale każdego kto czuje się na siłach również zapraszam). Rovdyr [odp.] 02:27, 4 mar 2008 (CET)
- Jestem przeciwna tworzeniu równoległych szablonów "wymowa" i "transkrypcja", ponieważ te wyrazy są prawie synonimiczne – jeden jest z potocznego rejestru, a drugi z naukowego, nazywają jednak to samo. Wymowa jest szersza o tyle, że obejmuje nagranie, które transkrypcją nazwać się nie da. Gdyby utworzyć strony aneksu omawiające poszczególne rodzaje transkrypcji i odsyłać do nich tak, jak to obecnie robi szablon IPA, to wszystko w moim mniemaniu powinno być dobrze :-) Przecież nikt nie broni wstawiać kilku rodzajów transkrypcji obok siebie.
Zapis fonetyczny nazw geograficznych
Podrzucam link do dyskusji jaka właśnie zaczyna się w zaprzyjaźnionym barze Wikipedii: Polski zapis fonetyczny zagranicznych nazw geograficznych. Temat o tyle istotny, że po zadomowieniu w Wikipedii, co odważniejsi eksperymentatorzy zwyczaj ten mogą zacząć przenosić też do wikisłownika. ABX - (O mnie dyskutuj) 17:42, 18 gru 2008 (CET)
- Temat powraca wraz z botem dodającym polską wymowę. Jak się powinno wpisywać wymowę nazw i ogólniej słów obcego pochodzenia w sekcji "język polski"? Olaf zdaje się zapisuje je najpierw ortograficznie po polsku w tabeli wyjątków (Chicago zamienia się na Szikago), a potem puszcza na tym bota, w wyniku czego powstaje w artykule wymowa "Szablon:IPA3, Szablon:AS3" w odróżnieniu od wymowy angielskiej: Szablon:IPA3. W sumie o tyle racja, że po polsku nikt oprócz może szikagowskiej polonii tego u na końcu nie wymawia, a gdyby ktoś wymawiał, to brzmiałoby to sztucznie, jakby się próbował pochwalić amerykańskim akcentem. Bot oddaje faktyczną polską wymowę. Pytanie tylko, czy to wymowa poprawna i czy warto ją w ogóle wpisywać do hasła, zwłaszcza w wersji IPA. Temat jest bardzo kontrowersyjny, co widać choćby z cytowanej powyżej dyskusji z Wikipedii, która chyba do niczego nie doprowadziła. Wydaje mi się, że lepiej jednak byłoby go tutaj omówić. Szablon:Wikipedysta:212.2.itd./itp. 12:32, 28 gru 2009 (CET)
- Wydaje mi się, że nie ma wątpliwości co do tego, że obcojęzyczne nazwy geograficzne mają w języku polskim swoją własną wymowę, różniącą się od oryginalnej. W dyskusji na Wikipedii problem dotyczył raczej stosowania odpowiedniego zapisu i całe nieporozumienie wynikło z niewłaściwej, różnie rozumianej terminologii (polska nazwa, polska wymowa) i tego, co w encyklopedycznym haśle powinno się znaleźć, a co nie. U nas sprawa wygląda inaczej, mamy dla każdego języka osobne hasło i wymowa jest sprawą kluczową, skoro zdecydowaliśmy się ją podawać za pomocą IPA, to musimy być konsekwentni. Jeśli GUGIK taką wymowę potwierdza, jedynie posługując się uproszczoną transkrypcją, zamiast IPA, to my możemy śmiało przenieść to na swój grunt. Wszak IPA służy także do zapisu wymowy polskich słów, wbrew temu, co pisał TomaszHolband i co było argumentem za używaniem tych "śmiesznych" zapisów. Jeśli wymowa będzie znajdowała się w polskim haśle, a nie w haśle z języka, w którym oryginalnie istnieje dana nazwa, to użycie innego zapisu IPA w każdym z tych haseł nie będzie błędem. Ludmiła Pilecka ⇒ dyskusja 12:22, 29 gru 2009 (CET)
- Dobry pomysł z szablonem. Powinien rozwiać niektóre wątpliwości. Ludmiła Pilecka ⇒ dyskusja 10:40, 31 gru 2009 (CET)
- Wydaje mi się, że nie ma wątpliwości co do tego, że obcojęzyczne nazwy geograficzne mają w języku polskim swoją własną wymowę, różniącą się od oryginalnej. W dyskusji na Wikipedii problem dotyczył raczej stosowania odpowiedniego zapisu i całe nieporozumienie wynikło z niewłaściwej, różnie rozumianej terminologii (polska nazwa, polska wymowa) i tego, co w encyklopedycznym haśle powinno się znaleźć, a co nie. U nas sprawa wygląda inaczej, mamy dla każdego języka osobne hasło i wymowa jest sprawą kluczową, skoro zdecydowaliśmy się ją podawać za pomocą IPA, to musimy być konsekwentni. Jeśli GUGIK taką wymowę potwierdza, jedynie posługując się uproszczoną transkrypcją, zamiast IPA, to my możemy śmiało przenieść to na swój grunt. Wszak IPA służy także do zapisu wymowy polskich słów, wbrew temu, co pisał TomaszHolband i co było argumentem za używaniem tych "śmiesznych" zapisów. Jeśli wymowa będzie znajdowała się w polskim haśle, a nie w haśle z języka, w którym oryginalnie istnieje dana nazwa, to użycie innego zapisu IPA w każdym z tych haseł nie będzie błędem. Ludmiła Pilecka ⇒ dyskusja 12:22, 29 gru 2009 (CET)
Automatyczna generacja wymowy IPA polskich słów
Ostatnio byłem trochę mało aktywny, bo wpadłem na pewien pomysł i mnie wciąnęło. Na podstawie strony Grzegorza Jagodzińskiego (tej i następnych) napisałem kod w Javie, który konwertuje napisane po polsku słowo na IPA. Pewnie uda się również generować AS. Efekty pracy algorytmu na wszystkich słowach podanych jako przykłady przez Grzegorza można obejrzeć tutaj.
Gdzieniegdzie są drobne różnice:
- różnimy się odrobinę jeśli chodzi o pojawianie się j po zmiękczeniu (on uważa, że powinna być Szablon:IPA3, a mi wychodzi, jednak Szablon:IPA3 i słownik też tak podaje)
- proponowana przez Grzegorza zasada stosowania dźwięku æ (np. Szablon:IPA3) między spółgłoskami miękkimi powoduje spore perturbacje, niepotwierdzone słownikami w których to sprawdzałem.
- czasem zdarzają się inne drobne różnice, głównie w związku z alofonami.
Ale to są drobiazgi i i tak wydaje mi się to o wiele dokładniejsze niż wymowa ściągana z de-wikt, w której błędy znajdował ostatnio 212... (kaliendarz). Wstępnie weryfikowałem ze słownikiem, jak na razie się zgadza.
Pobawiłem się zdrowo, jeśli jednak bylibyście chętni, mógłbym pododawać botem te zapisy do wszystkich polskich słów bez IPA. Oczywiście sprawdzałbym działalność bota, bo jednak czasem polska ortografia nie jest oczywista i chociaż starałem się uwzględnić wszelkie znane mi wyjątki, takie jak sinus, czy obmierzły, to zawsze mogą być kolejne. Bota sam napiszę, reaktywuję Olafbota (już mu założyłem konto na wikisłowniku) testując go najpierw na test-wiki.
Proszę więc tylko o zgodę na jego uruchomienie. Proszę też, jeśli to możliwe w takim trybie, o flagę bota dla konta Olafbot i o ewentualne rady, jak technicznie zorganizować sprawdzanie, oraz w jakim tempie może pracować bot. Również jeśli ktokolwiek znajdzie błędy w tym, proszę o informację. Pozdrawiam, Olaf (dyskusja) 03:41, 10 paź 2009 (CEST)
- Dzięki, metoda i praca w nią włożona robi wrażenie :)
- Jeśli chodzi o automatyczne generowanie IPA nie wypowiem się niestety bo nic o IPA nie wiem, nie znam się więc do niego nie zaglądam zgodnie z zasadą "nie zmieniaj tych fragmentów których nie rozumiesz bo możesz wprowadzić odbiorców w błąd". O ile się jednak zorientowałem w IPA zaznaczany jest też akcent - czy w automatycznie generowanych IPA jest on widoczny? Sam nawet nie próbuję zgadnąć ;)
- Chciałbym się natomiast odnieść do frazy o ściąganiu z de-wikt. Zasadniczo seryjnego przenoszenia treści z innych wikisłowników obecnie nie stosujemy (niezależnie od tego co wynika z dawnych edycji nieaktywnych obecnie uczestników projektu), a ich zawartość używamy wyłącznie w celach weryfikacyjnych i taki też był cel tej propozycji.
- Jeśli chodzi o przyznanie flagi bota byłbym jeszcze wstrzemięźliwy. W przypadku bota Beau wspominaliśmy że aby dostać flagę trzeba trochę poedytować żeby ocenić czy właściciel bota ma świadomość układu elementów szablonu haseł. Beau zapewnił że bota zamierza głównie stosować poza przestrzenią główną. Ty wprost deklarujesz stosowanie bota w przestrzeni głównej w dodatku w obszarze w którym za dużo twoich edycji nie widzieliśmy a twoje edycje nadal trzeba trochę wygładzać. Kiedy już ktoś dokona oceny poprawności automatycznie wygenerowanych IPA i przyzwoli na ich dodawanie osobiście czułbym się spokojniejszy byś wykonał trochę edycji testowych bota bez flagi, powiedzmy dla jednej litery z wygenerowanych zestawów i żebyśmy ewentualnie wrócili do tematu przyznania flagi, ok? Jest dużo zagadnień różniących Wikipedię i Wikisłownik takich jak rozróżnianie wielkości liter na początku, schemat hasła, położenie interwiki. Te elementy jesze trzeba po tobie układać i przydało by się nieco więcej wprawy w zwykłej edycji. Wiesz, takiego "czucia" układu hasła :) Nie jest to bynajmniej zarzut pod twoim adresem bo pewne błędy być może wykonujesz w edycjach dlatego że po prostu są one kiepsko opisane lub być może dlatego że czytanie WS:ZTH jest zwyczajnie nudne, ale dając flagę bota musimy mieć pewność co do takich rzeczy. Starzy botowi wyjadacze z Wikipedii (Masti i Yarl) też wykonywali najpierw testowe edycje i korygowali swoje boty o rzeczy dla nas specyficzne.
- Jeśli chodzi o samo dodawanie automatycznych IPA proponuję by w przypadku wstawiania botem były one wstawiane nowym szablonem o nazwie powiedzmy Szablon:S dzięki czemu będzie można łatwo przeglądać linkujące do tego szablonu i weryfikować. 195.205.156.34 12:36, 10 paź 2009 (CEST)
- Jeśli chodzi o akcent, w słowniku, z którym sprawdzam IPA, też nie ma akcentów. Ogólnie może on być i z pewnością by się przydał, ja go niestety na razie nie umiem wygenerować. Poszukam, jeśli znajdę jakąś dobrą pracę naukową o podziale polskich tekstów na sylaby, to może się uda go dodać.
- Ogólnie czeka mnie jeszcze trochę programowania, żeby napisać kod generujący AS (słowiański odpowiednik IPA) i wstawiający wymowę w obydwu wersjach w bezkonfliktowy sposób do artykułów. Biorąc pod uwagę natłok zajęć, pewnie nie wystartuję wcześniej niż za kilka dni, chyba że znów zarwę jakąś nockę, jak teraz. No i być może wcześniej uda mi się porównać z istniejącymi wpisami IPA, o które Cię poprosiłem.
- Co do flagi bota, to oczywiście rozumiem, sam jeszcze nie czuję się tutaj bardzo pewnie, więc chyba rzeczywiście najlepsze będzie rozwiązanie, w którym edycje będzie wykonywał bot ze swojego konta (dla testów i odróżnienia ode mnie), ale na razie bez flagi bota.
- Wolałbym nie zaczynać od jednej litery, bo w ten sposób mogą nie ujawnić się potencjalne błędy związane z określonym przedrostkiem, np. problemy, jakie w pewnym momencie miałem, z odróżnieniem ziet w zielony od zet w ziścić, albo PZPR czytanego Pe-Zet-Pe-Er od PESEL czytanego "pesel", mogłyby nie zostać zauważone, gdybym testował to tylko na hasłach zaczynających się od "a". Raczej zrobię jakąś próbę losową. Pozdrawiam, Olaf (dyskusja) 13:24, 10 paź 2009 (CEST)
- Podpisuję się pod tym co napisał 195... :) Pomysł jest bardzo dobry i wstępne wyniki bardzo obiecujące. Poparłbym go ostatecznie, gdyby wykazać, że statystycznie bot robi mniej lub tyle samo błędów niż dotychczasowi edytorzy. Jeśli 195... wylosuje jakąś próbę (o to prosiłeś, Olafie?) ze zrzutu z haseł mających już IPA, to chętnie służę pomocą przy sprawdzaniu. Ile mamy haseł z IPA i jakiej wielkości próba jest potrzebna?
- Zgadzam się co do tego, żeby do akcentu nie podchodzić rygorystycznie - lepsza IPA, bez akcentu, niż żadna, albo z błędnie wstawionym.
- Czy napisanie transformacji słowo → IPA nie jest trudniejsze niż IPA → AS? Bo o ile dobrze pamiętam moje doświadcznia sprzed dwóch lat, IPA → AS jest już dosłownie automatyczna (hm... a może na odwrót, tj. AS → IPA? nie pamiętam, nie mam siły teraz analizować).
- Co do różnic w alofonach, nie przejmowałbym się tym, o ile... stosowalibyśmy transkrypcję fonologiczną (w nawiasach pochylonych /.../), a nie fonetyczną (w nawiasach kwadratowych [...]). Niestety w hasłach z języka polskiego wstawiamy fonetyczną (na co patrzę niechętnie). Youandme 16:39, 10 paź 2009 (CEST)
- Będę się starał.
Witaj Olaf!
Przekłady Grzegorza niestety są niekonsykwentne i częsciowo błędne.
- No cóż, dziękuję za fachową opinię. Biorę się za poprawianie kodu. A w ogóle, nie ma co winić Grzegorza, prawdopodobnie większość z tych błędów (a na pewno ta liczba) to błędy moje w kodzie. Pozwoliłem sobie rozbić Twoją wypowiedź na punkty i odpowiedzieć poniżej.
- e: Szablon:IPA4 i Szablon:IPA4: Szablon:IPA4 i Szablon:IPA4?
- Poprawiłem niekonsekwencję w kodzie.
- o: Szablon:IPA4 i Szablon:IPA4: Szablon:IPA4 i Szablon:IPA4
- Poprawiłem niekonsekwencję w kodzie.
- sz: Szablon:IPA4 i Szablon:IPA4,
- Tak było i u Grzegorza. Szablon:IPA4 występowało tylko w złożeniu z t (Szablon:IPA4. Jeśli zastąpić w tym miejscu przez Szablon:IPA4 to łuk zlewa się ze znakiem Szablon:IPA4. Zmieniłem wszędzie Szablon:IPA4na Szablon:IPA4.
- ki: Szablon:IPA4 i Szablon:IPA4 (Szablon:IPA4 powinno być Szablon:IPA4)
- Poprawione, ale chyba w ogóle muszę jeszcze przerobić fragment od zmiękczeń.
- Raz ligatura Szablon:IPA4, a raz nie Szablon:IPA4.
- Zmieniłem, jest i tu i tu ligatura.
- piętnaście Szablon:IPA4? Kto mówi /pientnaśće/?
- No tak, piętnaście i dziewiętnaście są wyjątkami, których nie uwzględniłem (źródło: [1]). Dodane do programu.
- liczba: Szablon:IPA4? Kto mówi /lidzba/? Poza tym Szablon:IPA4 powinno być Szablon:IPA4.
- Jedno i drugie poprawione.
- Brak asymilacji dźwięczności, n.p. Szablon:IPA4, Szablon:IPA4, Szablon:IPA4.
- Tak, faktycznie nie zakodowałem tego jeszcze. Dopiszę.
- Szablon:IPA4 brakuje Szablon:IPA4, tzn. Szablon:IPA4 a całkiem poprawnie Szablon:IPA4.
- Poprawione (na razie do wersji Szablon:IPA4, nad "całkiem poprawną" popracuję).
- Azja: Szablon:IPA4 /aźja/?
- Poprawione.
- Co do mumii: Ani Szablon:IPA4 ani Szablon:IPA4 nie jest zupełnie poprawna. Najłatwiej może porównać wymowę słowa kuchnia /kuchńa/ Szablon:IPA4 z mania /mańja/ Szablon:IPA4. Z tego wychodzi na Szablon:IPA4, sproszczone Szablon:IPA4. Pozdrawiam --Trevas (dyskusja) 16:17, 10 paź 2009 (CEST)
- No cóż, w słowniku mam Szablon:IPA4, dokładnie tak jak wychodzi z programu. Zresztą w słowniku mam też Szablon:IPA4 a nie Szablon:IPA4. Obawiam się, że takie niuanse są już kwestią różnic indywidualnych w wymowie. Jeśli dałoby się wymyślić ogólną regułę do zaimplementowania w programie, to mogę ją dołożyć, ale trudno mi to samemu skonstruować.
- Czyli prawie wszystko z tego co zostało zgłoszone poprawiłem, został mi jeszcze do przejrzenia (i ewentualnego przerobienia) mechanizm zmiękczania oraz dorobienie asymilacji dźwięczności. Jeszcze raz dzięki za informacje o niedoróbkach. Bardzo proszę o kolejne uwagi. Olaf (dyskusja) 20:55, 10 paź 2009 (CEST)
Nie wiem, dlaczego większość używa apostrofu Szablon:IPA4 do zaznaczenia akcentu. To nie jest znak IPA! Proszę zamień na Szablon:IPA4.
Szablon:IPA4 nałka zamiast (Szablon:IPA4)? Bardzo wątpię, że /źjeść/ jest poprawną wymową słowa zjeść.
Poza tym nie rozumiem, dlaczego transkrybujesz Szablon:IPA4, Szablon:IPA4, ale Szablon:IPA4, Szablon:IPA4. --Trevas (dyskusja) 23:54, 12 paź 2009 (CEST)
Propozycja
A ja mam propozycję. Wiadomo, że polska ortografia nie jest jednak całkowicie jednoznaczna (np. Arabia wymawiane przez j versus zarabia przez i). Proponuję, żeby bot dodatkowo dzielił hasła na te, których wymowy jest pewien i te, gdzie jest większe prawdopodobieństwo pomyłki. Te hasła, których wymowa jest pewna, można uzupełniać bez przeszkód automatycznie, a te gdzie jest większa szansa na pomyłkę, nie byłyby wypełniane automatycznie, tylko bot wpisywałby je na jakąś stronę, gdzie można by je sprawdzić. W ten sposób:
- kod Olafa znacząco wzbogaciłby słownik, jednocześnie nie wprowadzając błędów
- byłby to kompromis, gwarantujący zajęcie i dobrą zabawę zarówno Olafowi, jak i osobom dopisującym wymowę ręcznie, dzięki czemu nikt nie miałby poczucia wyrzuconej na marne pracy (w projekcie i tak jest za mało ludzi, nie byłoby dobrze, gdyby mieli odchodzić kolejni).
Co Wy na to? 212.2.96.100 (dyskusja) 13:16, 12 paź 2009 (CEST)
- Mnie się wydaje że powyżej brak jest jakiegoś jednoznacznego odrzucenia pracy Olafa, wręcz przeciwnie - jest lista podpowiedzi co jeszcze trzeba zrobić i co Olaf zdaje się konsekwentnie wdrażać sądząc z opisów zmian na OZ :) Co do potrzeby wydzielenia (i metody takiego wydzielenia) pozycji ryzykownych musiałby się wypowiedzieć sam Olaf. Nie jestem pewien czy wyjątki można wyodrębnić automatycznie skoro taka już natura wyjątków, że nie mają reguły ;) 195.205.156.34 (dyskusja) 13:29, 12 paź 2009 (CEST)
- Wyjątków się tak nie wyłapie, ale istnieją przypadki, gdzie wiadomo, że wymowa nie wynika z ortografii. Na stronie Grzegorza "Osobliwości polskiej ortografii" jest kilka takich wymienionych. No chyba, że okaże się, iż jest to 90% haseł, to wtedy rzeczywiście nie ma sensu. 212.2.96.100 (dyskusja) 13:50, 12 paź 2009 (CEST)
- Można też wstawiać w komentarz, tak jak robiliśmy czasem z tłumaczeniami. Azureus (dyskusja) 13:40, 12 paź 2009 (CEST)
- Chyba nie bardzo rozumiem. To znaczy bot wstawiałby wymowę wszędzie do haseł, lecz tam, gdzie jest niepewna, wprowadzałby to do komentarza? To może lepiej zrobić szablon, który też ukrywałby niepewną wymowę przed czytelnikiem, a za to pozwalał łatwo odszukać te przypadki... Ale uważam, że jednak lepiej byłoby zgromadzić to na osobnej stronie, bo wtedy ktoś znający się na wymowie może hurtem zweryfikować / poprawić wiele przypadków, a potem bot może wrzucić hurtem te poprawione wersje. 212.2.96.100 (dyskusja) 13:50, 12 paź 2009 (CEST)
- Słuszne uwagi. Azureus (dyskusja) 13:53, 12 paź 2009 (CEST)
- Mi się wydaje, że jak przy wszystkich importach, wszystkie, również te które są "prawie pewne" trzeba zweryfikować w hasłach, więc tak jak na początku proponowałem, i tak jest do ich importu potrzebny dedykowany szablon Szablon:S, więc może by tego nie rozbijać na dodatkowe etapy weryfikacji? Ale sam tego weryfikować nie będę, więc jak inni tego nie chcą to się nie będę wymądrzał ;) 195.205.156.34 (dyskusja) 16:55, 12 paź 2009 (CEST)
- Chyba nie bardzo rozumiem. To znaczy bot wstawiałby wymowę wszędzie do haseł, lecz tam, gdzie jest niepewna, wprowadzałby to do komentarza? To może lepiej zrobić szablon, który też ukrywałby niepewną wymowę przed czytelnikiem, a za to pozwalał łatwo odszukać te przypadki... Ale uważam, że jednak lepiej byłoby zgromadzić to na osobnej stronie, bo wtedy ktoś znający się na wymowie może hurtem zweryfikować / poprawić wiele przypadków, a potem bot może wrzucić hurtem te poprawione wersje. 212.2.96.100 (dyskusja) 13:50, 12 paź 2009 (CEST)
To ja może wtrące swoje trzy grosze.
1) Ligatury - są wycofane z IPA i nie powinno się ich stosować. Można o tym przeczytać m.in. tu: en:w:Affricate#Notation (1 akapit) i tu: en:w:Obsolete_and_nonstandard_symbols_in_the_International_Phonetic_Alphabet#cite_ref-1. Poza tym są inne powody żeby ich nie stosować, po pierwsze nie istnieją ligatury dla wszystkich afrykat (chociaż nie dotyczy to akurat fonetyki j. polskiego), po drugie dla takiego języka jakim jest język polski istnieje duża różnica pomiędzy np. /tʂɨ/ (trzy), a /t͡ʂɨ/ (czy). Jeśli wymowę angielskiego słowa zapisze się tak: /tʃein/ to osoba choć trochę znająca ten język przeczyta CZEIN a nie TSZEIN. A niestostowanie tie-bara (łącznik nad/pod literami tworzących afrykaty) jest powszechne w zapisie angielskich słów, chociaż według IPA, powinno się je odczytać oddzielnie. Zapisanie afrykaty z tie-barem nie budzi wątpliwości, osoba znająca IPA, a nie znająca języka, odczyta ją prawidłowo, a zapis /ʦ/ albo /ts/ nie jest już taki jednoznaczny.
Użytkownik języka polskiego odczyta zapewne prawidłowo wymowę IPA, nawet jeśli jest ona nie do końca poprawna, bo wie że "czy" się czyta /CZY/ a nie /TSZY/. Tu jednak nasuwa się pytanie, czy Wikisłownik jest dla osób polskojęzycznych czy nie? Jeśli to pierwsze, to dodawanie wymowy wydaje się niepotrzebne, bo użytkownik języka zna wymowę, może więc wystarczyłoby dodawać ją tylko do słów których wymowa budzi wątpliwości?
Tak np. wymowa dżem vs. drzem (na twojej liście) wygląda niemalże identycznie. Dla tego pierwszego powinno być zapisane /d͡ʐɛm/ a dla drugiego /dʐɛm/ albo najlpiej... /d.ʐɛm/. Kropka w IPA nie jest wymawiana, nie ma tam zadnej pauzy ani przerwy (do tego służą inne symbole), a za to od razu widać że nie ma tu afrykaty (tj. w słowie "drzem").
- O, Olaf chyba się o to samo pytał niżej, nie wiedząc, że trochę wcześniej odpowiedziałeś na jego pytanie. :-) A w ogóle, to te wycofane ligatury mamy pod oknem edycji w przyborniku. 212.2.96.100 (dyskusja) 09:11, 15 paź 2009 (CEST)
2) // a []. Większość wypisanych przykładów na twojej stronie to wymowa fonemiczna ale jest między "[]" co jest błędem. Choć istnieje tu duża niekonsekwencja w stosowaniu raz wymowa fonetyczna, raz fonemiczna albo dwa w jednym. Np. brak zaznaczonych znazalizowanych samogłosek które występują zawsze przed spółgłoską nosową. Tak np. wyraz "mama" w transkrypcji fonetycznej zapisuje się tak samo jak w hiszpańskim: mama#mama_.28j.C4.99zyk_hiszpa.C5.84ski.29. Ja bym proponował w ogóle zrezygnować z wymowy fonetycznej bo trudno będzie ogarnąć wszystkie alofony, a jest ich na prawdę sporo.
- Swoją drogą większość z tego co mamy na wikisłowniku jako wymowa fonetyczna IPA w nawiasach kwadratowych, też jest fonemiczna... 212.2.96.100 (dyskusja) 10:01, 15 paź 2009 (CEST)
3) Rozbieżności między pisownią a wymową. Na przykład dość liczna grupa wyrazów zakończonych na "-nia". Wyrazy które w dopełniaczu mają -nii (Dania, Słowenia, ironia), wymawia się /-ńja/, a te które mają "-ni" w dopełniaczu, wymawia się /ńa/. (Ania, niania, elektrownia). Bot nie da rady odgadnąć która wymowa powinna być.
- Hmm. Dałby radę, gdyby sprawdzał w jakiejś bazie odmianę, albo choćby w internecie, która wersja jest częstsza. 212.2.96.100 (dyskusja) 10:01, 15 paź 2009 (CEST)
4) Akcent. Skąd bot ma wiedzieć gdzie pada akcent? Oczywiście większość wyrazów w jęz. polskim ma akcent paroksytoniczny (na przedostatnią sylabę) ale jest też przecież duża grupa wyrazów z innym akcentem. Jak choćby pierwszy z brzegu "uniwersytet".
- Akurat uniwersytet bot zaakcentował chyba dobrze, na trzecią od końca z akcentem pobocznym... Szablon:IPA4212.2.96.100 (dyskusja) 09:08, 15 paź 2009 (CEST)
5) błędy jakie znalazłem. M.in. zin; ssij; zsiadać; roztrzęsiony i język (nie ma tu /e/ tylko /ɛ/); się; siano; dzisiaj; gdzie (powinno być /ɟd͡ʑɛ/) wiedzieć; higiena (powinno być /xi-/, nie /çi-/); cito; siedem; siew. Również stosowanie znaku akcentu. Do zaznaczania akcentu w IPA służy /ˈ/, a nie apostrof wpisywany z klawiatury.
- Znak akcentu zmieniłem. Co do reszty - skoro przechodzę na transkrypcję fonemiczną, to będę miał tylko /ɛ/ wszędzie. Higienę mam w słowniku przez /çi-/. Olaf (dyskusja) 01:38, 16 paź 2009 (CEST)
6) Kwestia tylnojęzykowego ŋ. Jeśli bot dodawałby tylko wymowę fonemiczną to.. nie może się tam pojawić tylnojęzykowe N. Głoska ta nie występuje jako osobny fonem, bo nie występuje w pozycji swobodnej, więc nie spełnia warunku wariantu głównego. Nie będę się tu już wdawał w szczegóły... Jest ona alofonem /w̃/.
- Jeśli już, to jest wariantem /n/. Ok, zastąpiłem przez n, choć to nie jest takie proste. Mam w ksiązce "Podstawy wiedzy o języku polskim dla glottodydaktyków, pedagogów, psychologów i logopedów" porównanie trzech systemów fonologicznych - Stiebera, Jassema i Rocławskiego. Jassem ma /ŋ/ za to nie ma /ã/, /ɛ̃/. Pozostali /ŋ/ nie mają, ale za to Stieber ma nosowe m.Olaf (dyskusja) 01:38, 16 paź 2009 (CEST)
Moja propozycja jest taka, żeby bot utworzył listę słów z IPA do dodania, ale żeby przed dodaniem ich do haseł ktoś ją zweryfikował. Tj. mogłoby się to odbyć tak, że bot tworzy listę słów, ktoś ją przegląda i usuwa słowa których wymowa jest niepoprawna, i z tej listy co została, bot dodaje te wymowy do haseł. Maro 01:29, 15 paź 2009 (CEST)
- Mi się ten pomysł podoba. Mam tylko nadzieję, że ktoś będzie chętny do sprawdzania tego. 212.2.96.100 (dyskusja) 09:08, 15 paź 2009 (CEST)
Sylaby
Olaf mimochodem w celu dorabiania akcentów generuje też podział na sylaby. W wikisłowniku jednak czegoś takiego nie widziałem. W SO PWN są zaznaczane miejsca przenoszenia danego słowa do następnej linii, co prawie zawsze jest podzbiorem miejsc podziału na sylaby, za wyjątkiem nielicznych przypadków, jak nauka, czytana często nał-ka, a przenoszona na-uka zgodnie z poprawniejszą wymową. Czy zasady Wikisłownika pozwalają wstawiać gdzieś miejsca przenoszenia i/lub sylaby? I czy wersje wymowy popularne, nawet jeśli nie posiadają aprobaty polonistów, mogą być również umieszczane w Wikisłowniku? 212.2.96.100 (dyskusja) 16:21, 12 paź 2009 (CEST)
- No, to by było fajne, zawsze jak patrzę na so.pwn.pl to też im zadroszczę ;) może Azureus lub Youandme będą pamiętali czy gdzieś wcześniej ten temat nie wypłynął. Co do zwyczajów - nigdzie w hasłach tego nie spotkałem, chyba że gdzieś prozą w uwagach. Wydaje mi się że najlepiej będzie zrobić szablon typu
- {{sylabizacja|pierwsza sylaba|druga sylaba|trzecia ..|...}}
- a forma i miejsce, przy takim prostym zapisie w kodzie będzie można zmieniać. Żeby za bardzo nie ingerować w automatykę, może najlepiej w składni? Co do podziałów alternatywnych, mamy tę zaletę, że hasło nie idzie z bazy danych i jest elastyczne - można wywołań szablonu Szablon:S wstawiać kilka opatrując każdy przypisem, albo można utworzyć dedykowane szablony sylabizacji Szablon:S, który będzie sam wstawiać przypis tak jak robi to szablon Szablon:S umieszczany w odmianie. 195.205.156.34 (dyskusja) 16:52, 12 paź 2009 (CEST)
- Na razie krótko, bo nie mam czasu by się skupić na temacie. Zobaczcie jak Richiski robi sylabizację, np. w hiszpańskim, np. w haśle Etiopía - chodzi o te kropeczki w transkrypcji IPA. A pomysł z Szablon:S na pierwszy rzut oka wydaje mi się fajny, ale raczej... nie do składni - tam pasuje jak, za przeproszeniem, pięść do nosa. Taka sylabizacja to kolejna rzecz, która by pasowała do nowego pola, którego brak wyłazi przy różnych okazjach, mianowicie ortografia lub pisownia. W takim polu znalazłyby się i alternatywne pisownie słów, jak w przypadku języków indoeuropejskich, i pisownia uproszczonym/tradycyjnym pismem w przypadku chińskiego, uwagi poprawnościowe typu "pisownia 'nacodzień' jest błędna!" (wyszukiwarka pokaże wtedy elegancko cały kontekst z resztą ortografii), tam mogłyby wylądować też wszystkie alternatywne pisownie staropolskie w przypadku języka polskiego (zamiast w synonimach, jak teraz to robię), a być może nawet pisownia innymi alfabetami w przypadku języków zapisywanych dwoma lub trzeba alfabetami (slovio, serbski, dżuhuri, ladino) - choć w tym ostatnim przypadku transliteracja jest jak najbardziej OK. Youandme 17:14, 12 paź 2009 (CEST)
- Nie chciałem proponować nowego pola ze względu na masę stron z szablonami haseł, skryptami itp itd, które by trzeba zaktualizować, już bardziej myślałem po prostu o uwagach, ale jak nie będzie innego rozwiązania, to Szablon:S wydaje się logiczna, prosta do przetłumaczenia i jakoś tak w zgodzie z innymi nazwami. 195.205.156.34 (dyskusja) 17:21, 12 paź 2009 (CEST)
- Się może trochę nie na temat sylab wtrącę, ale odnośnie nowej części szablonu. Zauważyłem, że czasami przydałaby się sekcja przysłowia. Na razie wpisywane są one do frazeologizmów, co raczej nie jest poprawne. Jeśli by się kiedyś zdecydować na dodanie czegoś jeszcze, może by pomyśleć także o tym? Adam (dyskusja) 00:32, 13 paź 2009 (CEST)
- Mogę dodać do IPA, to chyba faktycznie będzie prostsze i bardziej naturalne, niż dodatkowe szablony. Tylko, czy to się nie pomyli z akcentem pobocznym? Wyszłoby coś takiego: Szablon:IPA4 A w ogóle, to jak się w AS zapisuje akcent, akcent poboczny i sylaby? Tak jak w IPA? Bo tam jako zmiękczenie też jest odmiana apostrofu, więc wygląda może nieco myląco: Szablon:AS4 Pozdrawiam, Olaf (dyskusja) 19:34, 12 paź 2009 (CEST)
- Umieszczanie podziału na sylaby w IPA zawęzi krąg odbiorców. Sądzę, że sporo użytkowników nie domyśli się, nie przeczytawszy dokładnie stron pomocy, że podział na sylaby należy odcyfrować z IPA. Nawet jeśli przeczytają, to spora część będzie bała się IPA (prędzej pewnie przyjrzą się bardziej przyjaznej AS). Poza tym takie rozwiązanie utrudni automatyczne odcedzenie informacji o podziale słów w tekście. Trzeba będzie znów pisać jakiś skrypt/bota, który najpierw przyporządkuje znakom IPA litery reprezentowanego słowa, a potem dopiero przeniesie podział na sylaby. Rozwiązanie z szablonem Szablon:S wygląda więc bardziej atrakcyjnie. Co do zaznaczania akcentu itp. w AS nie umiem pomóc. Niestety nie mam dostępu do naukowych artykułów. Ale o pomyłki w interpretacji tych wszystkich kropek i kresek nietrudno, fakt. Youandme 00:38, 13 paź 2009 (CEST)
- @ 195...: Owszem uwagi mogłyby w ostateczności być. Rozumiem też opór przed zmianami ogólnego szablon hasła. Niemniej niedostatków, które ciągną się od narodzin, raczej nie powinniśmy wciąż łatać upychaniem po kątach. Nawet jeśli sylabizację będziemy podawać w uwagach, mnie wciąż będzie martwił brak pola pisownia. Może moja pamięć działa teraz wybiórczo, gdy tak lobbuję ;) ale mam wrażenie, że w bardzo wielu słownikach informacja o pisowni jest podawana tuż po wyrazie hasłowym (teraz przed oczami stają mi zwłaszcza słowniki polskiego i chińskiego). Youandme 00:38, 13 paź 2009 (CEST)
- A może to dać w polu wymowa, ale nie w IPA, czy AS, tylko osobno? Bo ja bym tam szukał, a nie w pisowni, ani składni, ani w uwagach... Przecież sylaba to przede wszystkim pojęcie fonetyczne, a dopiero wtórnie ma wpływ na pisownię. 212.2.96.100 (dyskusja) 08:56, 13 paź 2009 (CEST)
- Pomysł Youandme żeby przy okazji przepchnąć alternatywne pisownie do góry mi się podoba. W słownikach gdzie takie alternatywne pisownie są podawane (Szablon:S, intensywnie w Szablon:S) zawsze jest to uwzględniane na wstępie hasła. Co do umiejscowienia sylabizacji jest mi obojętnie czy w pisowni czy w wymowie, chociaż jakby już sekcja z pisownią istniała to można tam, bo w wielu hasłach inaczej by pisownia nie była wykorzystana a z drugiej strony dobrze zrobiona wymowa potrafi być długa bo przecież można dodać nagrania dla całej odmiany. Youandme wyartykułował też to co mi równiez nocą przyszło do głowy. Jako że z moimi latoroślami mam do czynienia z tym co jest w programie nauczania od zerówki wzwyż, wiem, że sylabizacja jest właściwie po literach pierwszą umiejętnością piśmienniczą jaką dzieci poznają a nieprawidłowy podział jest jednym z najczęściej zaznaczanych błędów na kartkówkach mojej córki. Nasze słowniki obcojęzyczne są adresowane do nieco starszych, ale te podstawowe informacje w hasłach polskich (o sylabizacji) powinny być podane czytelnie nawet dla ośmio-dziesięciolatka. Propozycja zastosowania sylabizacji bez zmiany szablonu w hasłach konstantynopolitańczykowianeczka i chrześcijański. 195.205.156.34 (dyskusja) 10:25, 13 paź 2009 (CEST)
- W porządku, tylko sylaby to nie pisownia. Można podzielić na sylaby przed-zi-mie, ale słownik SO PWN dopuszcza przeniesienie do następnego wiersza jedynie tak: przed-zimie. Pakowanie sylabizacji do pisowni byłoby mylące. 212.2.96.100 (dyskusja) 12:01, 13 paź 2009 (CEST)
- Z tym, że nie przedstawiamy sylabizacji samej w sobie, tylko sylabizację używaną do podziału przy zapisie więc ta pisownia jakoś tam się wpasowuje w to. Podział we wskazywanym przez Ciebie słowniku Szablon:S opisany jest w rozdziale "Zasady pisowni i interpunkcji". To co pokazujesz w haśle przedzimie jest według wstępu jednym z dwóch możliwych podziałów. Drugim jest właśnie ten wg sylab. Żeby umożliwić szablonowi Szablon:S odróżnić oba te podziały dodałem możliwość rozdzielania sylab dwoma rodzajami separatorów. Jeden pajp "|" może być używany przy zaznaczaniu podziału fonetycznego, a dwa pajpy "||" przy podziale morfologicznym. Przykład w haśle chrześcijański. Jeżeli zrezygnujemy z podziału fonologicznego i zostawimy tylko morfologiczny, to tym bardziej pasuje to nie do wymowy tylko do pisowni. Osobną kwestią jest jakich symboli użyjemy do zaznaczania podziału, łatwo je zmienić w szablonie Szablon:S. W tej chwili to "•" dla podziału fonologicznego i "|" dla podziału morfologicznego. 195.205.156.34 (dyskusja) 13:51, 13 paź 2009 (CEST)
- Nie przedstawiamy sylabizacji samej w sobie? Wydawało mi się, że to co możemy łatwo przedstawić to sylabizacja oparta na kryterium fonetycznym. Gdyby chcieć podawać miejsce przenoszenia wedle kryterium morfologicznego, to nie nazywajmy tego sylabizacją, inaczej wyjdzie takie kuriozum jak {{sylabizacja|pioruno||chron}}, no a poza tym Olaf tego (na razie?) nie generuje, a cały wątek zaczął się od tego, gdzie bot mógłby dodawać sylabizację (fonetyczną). 212.2.96.100 (dyskusja) 14:18, 13 paź 2009 (CEST)
- Sorki, źle sformułowałem swoją myśl, może teraz wyjdzie lepiej ;) Chodziło mi o wyznaczenie celu dla jakiego przedstawiamy podział. W mowie potocznej stosowanie podziałów nie ma (z mojego laickiego punktu widzenia) zastosowania, a w piśmie ma. To że wątek zaczął się od sylab nie ma znaczenia bo nie pierwszy to raz kiedy jeden temat przekształcił się w drugi ;) Poza tym skoro wszyscy przyznajemy że nie jesteśmy ekspertami, całkiem możliwe że stosujemy złe nazwy do pojęć o których chcemy mówić ;;;))) Co do nazwy szablonu, jeśli pokazuje on dwa podziały, to po prostu można zmienić jego nazwę na "podział". 195.205.156.34 (dyskusja) 14:28, 13 paź 2009 (CEST)
- Tak, chyba "podział" jako nazwa szablonu byłby lepszy. W ten sposób szablon można by zastosować raz do pokazania podziału na sylaby a innym razem do pokazania punktów przeniesienia do kolejnego wiersza według podziału morfologicznego. Olaf (dyskusja) 02:43, 15 paź 2009 (CEST)
- Przeniosłem do Szablon:S. 195.205.156.34 (dyskusja) 20:26, 15 paź 2009 (CEST)
- Tak, chyba "podział" jako nazwa szablonu byłby lepszy. W ten sposób szablon można by zastosować raz do pokazania podziału na sylaby a innym razem do pokazania punktów przeniesienia do kolejnego wiersza według podziału morfologicznego. Olaf (dyskusja) 02:43, 15 paź 2009 (CEST)
- Sorki, źle sformułowałem swoją myśl, może teraz wyjdzie lepiej ;) Chodziło mi o wyznaczenie celu dla jakiego przedstawiamy podział. W mowie potocznej stosowanie podziałów nie ma (z mojego laickiego punktu widzenia) zastosowania, a w piśmie ma. To że wątek zaczął się od sylab nie ma znaczenia bo nie pierwszy to raz kiedy jeden temat przekształcił się w drugi ;) Poza tym skoro wszyscy przyznajemy że nie jesteśmy ekspertami, całkiem możliwe że stosujemy złe nazwy do pojęć o których chcemy mówić ;;;))) Co do nazwy szablonu, jeśli pokazuje on dwa podziały, to po prostu można zmienić jego nazwę na "podział". 195.205.156.34 (dyskusja) 14:28, 13 paź 2009 (CEST)
- Nie przedstawiamy sylabizacji samej w sobie? Wydawało mi się, że to co możemy łatwo przedstawić to sylabizacja oparta na kryterium fonetycznym. Gdyby chcieć podawać miejsce przenoszenia wedle kryterium morfologicznego, to nie nazywajmy tego sylabizacją, inaczej wyjdzie takie kuriozum jak {{sylabizacja|pioruno||chron}}, no a poza tym Olaf tego (na razie?) nie generuje, a cały wątek zaczął się od tego, gdzie bot mógłby dodawać sylabizację (fonetyczną). 212.2.96.100 (dyskusja) 14:18, 13 paź 2009 (CEST)
- Z tym, że nie przedstawiamy sylabizacji samej w sobie, tylko sylabizację używaną do podziału przy zapisie więc ta pisownia jakoś tam się wpasowuje w to. Podział we wskazywanym przez Ciebie słowniku Szablon:S opisany jest w rozdziale "Zasady pisowni i interpunkcji". To co pokazujesz w haśle przedzimie jest według wstępu jednym z dwóch możliwych podziałów. Drugim jest właśnie ten wg sylab. Żeby umożliwić szablonowi Szablon:S odróżnić oba te podziały dodałem możliwość rozdzielania sylab dwoma rodzajami separatorów. Jeden pajp "|" może być używany przy zaznaczaniu podziału fonetycznego, a dwa pajpy "||" przy podziale morfologicznym. Przykład w haśle chrześcijański. Jeżeli zrezygnujemy z podziału fonologicznego i zostawimy tylko morfologiczny, to tym bardziej pasuje to nie do wymowy tylko do pisowni. Osobną kwestią jest jakich symboli użyjemy do zaznaczania podziału, łatwo je zmienić w szablonie Szablon:S. W tej chwili to "•" dla podziału fonologicznego i "|" dla podziału morfologicznego. 195.205.156.34 (dyskusja) 13:51, 13 paź 2009 (CEST)
- W porządku, tylko sylaby to nie pisownia. Można podzielić na sylaby przed-zi-mie, ale słownik SO PWN dopuszcza przeniesienie do następnego wiersza jedynie tak: przed-zimie. Pakowanie sylabizacji do pisowni byłoby mylące. 212.2.96.100 (dyskusja) 12:01, 13 paź 2009 (CEST)
- Pomysł Youandme żeby przy okazji przepchnąć alternatywne pisownie do góry mi się podoba. W słownikach gdzie takie alternatywne pisownie są podawane (Szablon:S, intensywnie w Szablon:S) zawsze jest to uwzględniane na wstępie hasła. Co do umiejscowienia sylabizacji jest mi obojętnie czy w pisowni czy w wymowie, chociaż jakby już sekcja z pisownią istniała to można tam, bo w wielu hasłach inaczej by pisownia nie była wykorzystana a z drugiej strony dobrze zrobiona wymowa potrafi być długa bo przecież można dodać nagrania dla całej odmiany. Youandme wyartykułował też to co mi równiez nocą przyszło do głowy. Jako że z moimi latoroślami mam do czynienia z tym co jest w programie nauczania od zerówki wzwyż, wiem, że sylabizacja jest właściwie po literach pierwszą umiejętnością piśmienniczą jaką dzieci poznają a nieprawidłowy podział jest jednym z najczęściej zaznaczanych błędów na kartkówkach mojej córki. Nasze słowniki obcojęzyczne są adresowane do nieco starszych, ale te podstawowe informacje w hasłach polskich (o sylabizacji) powinny być podane czytelnie nawet dla ośmio-dziesięciolatka. Propozycja zastosowania sylabizacji bez zmiany szablonu w hasłach konstantynopolitańczykowianeczka i chrześcijański. 195.205.156.34 (dyskusja) 10:25, 13 paź 2009 (CEST)
- A może to dać w polu wymowa, ale nie w IPA, czy AS, tylko osobno? Bo ja bym tam szukał, a nie w pisowni, ani składni, ani w uwagach... Przecież sylaba to przede wszystkim pojęcie fonetyczne, a dopiero wtórnie ma wpływ na pisownię. 212.2.96.100 (dyskusja) 08:56, 13 paź 2009 (CEST)
- Mogę dodać do IPA, to chyba faktycznie będzie prostsze i bardziej naturalne, niż dodatkowe szablony. Tylko, czy to się nie pomyli z akcentem pobocznym? Wyszłoby coś takiego: Szablon:IPA4 A w ogóle, to jak się w AS zapisuje akcent, akcent poboczny i sylaby? Tak jak w IPA? Bo tam jako zmiękczenie też jest odmiana apostrofu, więc wygląda może nieco myląco: Szablon:AS4 Pozdrawiam, Olaf (dyskusja) 19:34, 12 paź 2009 (CEST)
- Na razie krótko, bo nie mam czasu by się skupić na temacie. Zobaczcie jak Richiski robi sylabizację, np. w hiszpańskim, np. w haśle Etiopía - chodzi o te kropeczki w transkrypcji IPA. A pomysł z Szablon:S na pierwszy rzut oka wydaje mi się fajny, ale raczej... nie do składni - tam pasuje jak, za przeproszeniem, pięść do nosa. Taka sylabizacja to kolejna rzecz, która by pasowała do nowego pola, którego brak wyłazi przy różnych okazjach, mianowicie ortografia lub pisownia. W takim polu znalazłyby się i alternatywne pisownie słów, jak w przypadku języków indoeuropejskich, i pisownia uproszczonym/tradycyjnym pismem w przypadku chińskiego, uwagi poprawnościowe typu "pisownia 'nacodzień' jest błędna!" (wyszukiwarka pokaże wtedy elegancko cały kontekst z resztą ortografii), tam mogłyby wylądować też wszystkie alternatywne pisownie staropolskie w przypadku języka polskiego (zamiast w synonimach, jak teraz to robię), a być może nawet pisownia innymi alfabetami w przypadku języków zapisywanych dwoma lub trzeba alfabetami (slovio, serbski, dżuhuri, ladino) - choć w tym ostatnim przypadku transliteracja jest jak najbardziej OK. Youandme 17:14, 12 paź 2009 (CEST)
Transliteracja cyrylicy
Korzystając z tej tabelki utworzyłem skrypt do bota wpisującego transliterację ISO 9:1995. Jeśli nie będzie żadnych obiekcji, to mogę "przejechać" języki rosyjski i bułgarski. Yarl ✉ 20:19, 11 paź 2009 (CEST)
Transliteracja powraca
Problem transliteracji nie jest wyłącznie problemem polskiego Wikisłowika. Z pewnością z tym problemem spotykają się również twórcy projektów w innych językach. Beau zaproponował aby ten problem rozwiązać w kodzie PHP tak aby rozwiązanie było uniwersalne i dostępne dla wszystkich. Transliteracja opisana i uwarunkowana jest normami i standardami. Nie wiem ile ich jest dokładnie, ale przypuszczam że sporo, bo samemu udało mi się odnaleźć przynajmniej kilkanaście. Sposób transliteracji zależy więc od tego, którą wybierzemy normę do jej wykonania. Gdy zacząłem wgryzać się w temat doczytałem, że obecnie właściwie obowiązują zasady transliteracji ustalone przez ISO-9, ISO-233, ISO-843, ISO-3602, ISO-9984 i ISO-9985 oczywiście ponazywane lokalnie PN-cośtam. Nie wiem jak z pozostałymi, ale w ISO-9 nie trzeba obecnie określać języka źródłowego - wystarczy, że jest on zapisywany cyrylicą. Normy te opisują transliterację różnych alfabetów na łacinę, więc zestawy znaków powinny być rozłączne. Może udałoby się je złożyć w jedną tablicę konwersji z dowolnego alfabetu na transliterację do łacińskiego. To by bardzo uprościło. Właściwie wtedy wyboru tablicy należałoby dokonać wyłącznie ze względu na alfabet docelowy. Czy piszę z sensem, czy ktoś wie coś o czym ja nie wiem? Sp5uhe (dyskusja) 12:30, 15 paź 2009 (CEST)
Pytania do specjalistów od wymowy
Cały czas jeszcze siedzę nad tym botem do dorabiania IPA (aktualne wyniki). Mam kilka pytań do specjalistów od wymowy, może ktoś potrafiłby pomóc...
- Zrezygnowałem z łuków na rzecz ligatur. Wprawdzie trudno w IPA odróżnić Szablon:IPA4 (dżem) i Szablon:IPA4 (drzem), ale i tak w AS różnicę widać, a żeby zobaczyć łuczki trzeba mieć specjalne czcionki. Czy są jakieś zalecenia odnośnie konwencji zapisu IPA w wikisłowniku?
- Wyżej Maro skrytykował właśnie te ligatury - są wycofane z IPA. Tyle, że my je mamy w przyborniku pod ekranem edycji... 212.2.96.100 (dyskusja) 09:14, 15 paź 2009 (CEST)
- Czy i jak oznaczać asynchroniczną wymowę wargowych? Chodzi o /j/ powstające w zbitkach piA, biA, wiA, miA, fiA, gdzie A to samogłoska. Więcej na ten temat jest tutaj. Według nich jest to już powszechna wymowa, podają że wymawia się [m’jeuso], a z drugiej strony w słowniku konsekwentnie mam wymowę bez tego /j/. Czy taka wymowa jest dopuszczalna normami? Zaznaczać to, czy nie? Teraz zaznaczyłem przez "(j)" w nawiasach.
- Grzegorz tutaj wspomina o kilku alofonach samogłosek, pomiędzy dwiema spółgłoskami miękkimi, np. Szablon:IPA4,Szablon:IPA4,Szablon:IPA4. Czy ktoś mógłby potwierdzić, że faktycznie coś takiego istnieje, pomijając gwary? Ja osobiście żadnej różnicy w /a/ w tym jajku nie słyszę w porównaniu z innymi /a/, ale może nie mam wprawy. W słowniku też takiej różnicy nie mam zaznaczonej.
- Może masz w słowniku wymowę fonemiczną a nie fonetyczną? Z tego co widziałem, to czasem stosują nawet nawiasy kwadratowe, a w środku i tak jest wymowa fonemiczna. 212.2.96.100 (dyskusja) 09:24, 15 paź 2009 (CEST)
- Zauważyłem pewną niekonsekwencję - z jednej strony twierdzi się, że istnieją bezdźwięczne alofony dźwięcznych głosek, jak np. Szablon:IPA4 (bezdźwięczny alofon fonemu /r/), a z drugiej strony jak widzę ani w poradni PWN, ani u Grzegorza, ani w słowniku, nie jest on stosowany w zbitkach z głoskami bezdźwięcznymi (np. Szablon:IPA4 a nie Szablon:IPA4). Chyba stosuje się te znaczki tylko wtedy, gdy z obydwu stron są głoski bezdźwięczne, albo na wygłosie. Tymczasem bezdźwięczne wersje innych fonemów, mających własne litery (np. /f/ jako wersja /v/) są stosowane wszędzie. Czy stosować te alofony wszędzie, zgodnie z logiką, czy robić tak jak wszyscy?
- Przejrzałem wszelkie zasady w SO PWN, ale nadal nie wiem, dlaczego każą dzielić mia-sto, a nie mias-to, choć zwykle zbitkę samogłoska-spółgłoska-spółgłoska-samogłoska rozdziela się pośrodku. Czy ktoś zna jakiś powód ku temu?
- Odpowiadam tylko Ad 5. Taka różnica istnieje np. między podziałem w hiszpańskim a w greckim. W hiszpańskim dzieliłoby się mjas-to, a w greckim mja-sto. Przypuszczam, że kryterium w polskim jest podobne do greckiego: jeżeli istnieje jakiekolwiek słowo zaczynające się określoną grupą głosek (w polskim: sto, stodoła, stopa), to też podział sylab musi się do tego dostosować. W hiszpańskim zbitki samogłoska-spółgłoska-spółgłoska-samogłoska rozbija się między spółgłoskami (każda do innej sylaby), za wyjątkiem przypadków, w których tą drugą spółgłoską jest tzw. líquida, czyli [r] lub [l]: ca-ble, que-brar itd. --Richiski (dyskusja) 08:55, 15 paź 2009 (CEST)
- Ale słowo to, towar też istnieje... 212.2.96.100 (dyskusja) 09:17, 15 paź 2009 (CEST)
- Chodzi o maksymalną zbitkę zaczynającą słowo, podobnie jak w matematyce największy wspólny mianownik. DIXI --Richiski (dyskusja) 09:52, 15 paź 2009 (CEST)
- Ale słowo to, towar też istnieje... 212.2.96.100 (dyskusja) 09:17, 15 paź 2009 (CEST)
- Odpowiadam tylko Ad 5. Taka różnica istnieje np. między podziałem w hiszpańskim a w greckim. W hiszpańskim dzieliłoby się mjas-to, a w greckim mja-sto. Przypuszczam, że kryterium w polskim jest podobne do greckiego: jeżeli istnieje jakiekolwiek słowo zaczynające się określoną grupą głosek (w polskim: sto, stodoła, stopa), to też podział sylab musi się do tego dostosować. W hiszpańskim zbitki samogłoska-spółgłoska-spółgłoska-samogłoska rozbija się między spółgłoskami (każda do innej sylaby), za wyjątkiem przypadków, w których tą drugą spółgłoską jest tzw. líquida, czyli [r] lub [l]: ca-ble, que-brar itd. --Richiski (dyskusja) 08:55, 15 paź 2009 (CEST)
- Cały czas brakuje mi obiecanego zrzutu wszystkich polskich słów z IPA na wikisłowniku. Rozumiem, że 195... jeszcze nie dopłynął do stałego IP...
Pozdrawiam, Olaf (dyskusja) 04:27, 15 paź 2009 (CEST)
Porównanie wymowy bota i człowieka
Przeszedłem z transkrypcji fonetycznej na fonemiczną, bo nie jestem w stanie inaczej poradzić sobie z kilkudziesięcioma odmianami fonemów (sic!), jakie istnieją w polszczyźnie.
Zrobiłem porównanie zapisów IPA ze wszystkich artykułów polskich, które je posiadają (dzięki, 195.205.156.34) z transkrypcją bota. Wyniki są tutaj. Na moje oko bot równie często popełnia błędy, co ludzie, ale ja mogę się mylić lub być stronniczy. Teraz trzeba jeszcze specjalisty, który by zweryfikował przynajmniej jakąś część tych zapisów, dla których wymowa się nie zgadza. Być może zauważy też coś, co można by łatwo poprawić. A tak czy inaczej znalazło się mnóstwo artykułów, które mają ewidentnie błędne IPA i to już przynajmniej jest jakiś pozytywny skutek tego projektu. Pozdrawiam, Olaf (dyskusja) 04:33, 16 paź 2009 (CEST)
wyświetlanie IPA w Windows
Najpierw w Barze, a potem w rozmowie z Olafem w realu wyszła kwestia, jak właściwie powinno się kodować w IPA dwuznaki, takie jak np. dz. Możliwości są takie:
- Szablon:IPA4 - ligatura, którą mamy w przyborniku pod oknem edycji, choć została wycofana z IPA. Oprócz tego wadą jest, że trudno ją odróżnić od dwóch liter Szablon:IPA4, ale za to jest w większej liczbie fontów.
- Szablon:IPA4 - ta sama ligatura, ale z łuczkiem dla podkreślenia, że to jedna głoska, a nie litery Szablon:IPA4.
- Szablon:IPA4 - osobne litery d,z z łukiem dla podkreślenia, że to jedna głoska. To chyba aktualnie obowiązująca w IPA metoda.
Wydaje mi się, że powinno się stosować metodę 3, ale niestety w standardowym Windows XP zamiast łuczku mam kwadrat. Jest to problem z szablonem IPA (a właściwie z klasą ipa w MediaWiki:Common.css), gdyż jeśli zmienimy font na Tahoma, to już łuki widać: [͡ʣ d͡z] Problem polega na tym, że w klasie IPA w MediaWiki:Common.css umieszczono Tahomę na trzecim miejscu, po dwóch fontach, których zasób unicodu jest mniejszy. Osobna sprawa, to Tahoma ma z kolei problem z wyświetlaniem tych znaków: Szablon:IPA4 (czyli /ę/, /ą/...) , a te wyświetla brzydko: Szablon:IPA4. Pełny zasób IPA ma font Gentium, polecany tutaj, ale nie jest automatycznie instalowany. Mimo polecania w ogóle nie ma go w commons.css, choć powinien być na pierwszym miejscu.
Jak to teraz rozwiązać?
- Nie korzystać z łuczków, tylko z ligatur? Można, ale stosujemy wtedy przestarzałe IPA i jest ono niejednoznaczne – Szablon:IPA4 (drzem) i Szablon:IPA4 (dżem) prawie niczym się nie różnią.
- Korzystać z łuczków i nie przejmować się tym, jak to jest wyświetlane. Hmm...
- Korzystać z łuczków i napisać użytkownikom, żeby sobie zaistalowali Gentium, oraz dodać je do klasy ipa w CSS-ach? Ok, jeśli ktoś sobie zainstaluje Gentium, to w porządku, ale i tak potrzebujemy rozwiązania dla pozostałych 99%.
- Korzystać z łuczków i zmienić ustawienia CSS, żeby włączała się Tahoma zamiast Arial Unicode? Wtedy łuczki się pojawią, a znikną znaki Szablon:IPA4...
- Zrobić mądry szablon, który za pomocą javascriptu będzie w stanie sprawdzić, jaki font u użytkownika zawiera potrzebny znak i dla każdego znaku wybierze inny font? Tak to robi Internet Explorer, jak się mu każe wyświetlić tekst unikodowy. Może da się jakoś ten automatyczny dobór czcionek włączyć z CSS?
- Zakodować każdą literę IPA jako osobny rysunek i zrobić mądry szablon, który będzie konwertował tekst na serię rysunków z dodatkowym linkiem "kopiuj" do skopiowania tego do schowka w wersji unicode...
- Rozszerzenie Mediawiki, które samo zrobi to co szablon powyżej, tak jak to robią znaczniki <math> oraz <hiero> ?
Trzy ostatnie pomysły chyba są najlepsze, ale ja nie potrafię tego napisać. Beau?
Inne zauważone problemy z wyświetlaniem IPA:
- W przyborniku pod oknem edycji widzę trzy kwadraciki, z których dwa zamieniają mi się w szablonie IPA na strzałki: Szablon:IPA4, a trzeci pozostaje kwadracikiem: Szablon:IPA4. Skoro da się przynajmniej te strzałki wyświetlić w szablonie IPA, to powinny być też widoczne w przyborniku.
- W przyborniku i w kodzie strony jest wpis | obok kreski pionowej |. Obydwa linki robią to samo. Jak rozumiem chodzi o to, żeby się szablon IPA nie rozjechał, ale wydaje mi się, że w przyborniku powinno być widać tylko kreskę pionową, a w kodzie powinno się wstawiać |.
- W przyborniku nie ma łuku łączącego dwa znaki IPA, który jest jednak często używany.
A, uprzedzając głosy typu "zainstaluj sobie Linuksa" - mam też zainstalowane Ubuntu, ale nie zmienia to faktu, że 90% (jak nie więcej) wizyt w wikisłowniku to Windows + IE, można ich nie lubić, ale ignorowanie ich jest nieprofesjonalne.
Pozdrawiam, 212.2.96.100 (dyskusja) 11:59, 19 paź 2009 (CEST)
- Ja niestety nie jestem posiadaczem systemu operacyjnego Windows, więc ciężko mi to zweryfikować. U mnie wyświetla się to tak: http://tools.wikimedia.pl/~beau/tmp/Wikis%C5%82ownik:Bar.png, też nie najlepiej. To jest jednak problem po stronie klienta, a nie serwera/MediaWiki. Azjatyckich czcionek nie pokazujemy jako obrazki. Proponuję inne rozwiązanie - proszę zerknąć na w:Szablon:Nihongo. Jest tam mały link '?', który prowadzi do informacji jak zainstalować sobie obsługę azjatyckich czcionek. Sugeruję zrobić tutaj to samo, bogatsze czcionki przydadzą się nie tylko do IPA. Beau (dyskusja) 19:09, 19 paź 2009 (CEST)
- No owszem, tak jest teraz i z szablonem Szablon:S. Po kliknięciu na link IPA dostejemy się do Aneks:IPA, gdzie na końcu tekstu jest link do odpowiedniego fontu. Nie zgadzam się jednak z takim podejściem. Rolą architekta strony internetowej jest m.in. takie rozwiązanie technikaliów, aby treść była dostępna dla możliwie szerokiego grona użytkowników. Wymaganie od użytkowników instalowania dodatkowych czcionek zdecydowanie zmniejsza jakość techniczną serwisu, choć nie wykluczam, że na Wikipedii nie da się inaczej.
- Nie do końca jest też prawdą, że nie pokazujemy obcych czcionek jako obrazki, to chyba zależy jakich czcionek. Na przykład egipskie jak najbardziej Mediawiki zamienia automatycznie na obrazki: <hiero><-N5-F31-S29-M23-G43 -> </hiero>, matematyczne też.
- Jednak spróbuję w jakiś sposób usprawnić tę prezentację IPA, choć nie jestem pewien, czy się uda. Nie jestem też pewien, czy akurat konwersja na obrazki jest dobrym pomysłem, bo trudno byłoby je skopiować jako tekst Unicode do schowka. No nic, zobaczymy. Pozdrawiam i dzięki, Beau, za pomysł z szablonami do manipulacji tekstem z en-wiki. Olaf (dyskusja) 01:01, 20 paź 2009 (CEST)
- A poza tym instalacja fontu Gentium zgodnie z instrukcją w Aneks:IPA nic nie daje. Ja mam go zainstalowanego, ale ustawienia w Mediawiki:Common.css są takie, że i tak wybiera mi font Lucida Sans Unicode, w którym brakuje niektórych znaków (test jest tutaj). Pozdrawiam, Olaf (dyskusja) 01:30, 20 paź 2009 (CEST)
- Szablony, które wymieniłem maja kilka bardzo niepraktycznych ograniczeń. Co do używania <math> to ten znacznik służy do renderowania wzorów, a nie do zabawy z czcionką. Nie jestem ekspertem jeśli chodzi o JavaScript, dlatego nie jestem pewny, czy da się sprawdzić, jaki font u użytkownika zawiera potrzebny znak, moim zdaniem się nie da. Jeśli chodzi o używanie do tego obrazków, to jestem stanowczo przeciwny takiemu rozwiązaniu. Z obrazkami wiąże się wiele problemów, podam jeden przykład. Obrazki to nie tekst, nie można zmienić kolorów, wielkości itp. dlatego będzie to uciążliwe dla osób z wadami wzroku - możliwość konfiguracji w preferencjach sposobu wyświetlania odpada ze względów wydajnościowych. Jeśli chodzi o style CSS, to proszę, podaj mi jak ma wyglądać nowy wpis, to go poprawię. Przydałaby się także opinia osoby z dłuższym stażem na wikisłowniku. Beau (dyskusja) 10:07, 20 paź 2009 (CEST)
- Masz rację, obrazki to faktycznie nie za dobry pomysł, nie dość że wymagałby prawdopodobnie dodatkowego przycisku, do skopiowania tekstu Unicode do schowka to jeszcze wielkość czcionki nie zmieniałaby się wraz z ustawieniami, a te bywają najróżniejsze. Javascript odpada, jest w szablonach wyłączony, nawet przybornik edycji pod okienkiem, który z niego korzysta, jest z tego względu robiony specjalnym rozszerzeniem CharInsert a nie szablonem z javascriptem. Własne rozszerzenie można by napisać, tylko nikt nam go potem nie włączy. Ale można po pierwsze poprawić style CSS, po drugie zrobić szablon, który będzie żonglował fontami tak, żeby na pierwszych miejscach na liście font-face były te fonty które najlepiej renderują dany znak. Może się to nawet zmieniać w zależności od znaku, oczywiście tylko jeśli jest to konieczne, żeby nie używać różnych fontów w jednym zapisie IPA, jeśli tylko da się go wyświetlić bez takich zabiegów. I to na pewno jest do zrobienia.
- Beau, a mógłbyś wejść na stronę Wikipedysta:Olaf/próbnik_IPA2 i zrobić zrzut ekranu, ewentualnie pochwalić się też, jakim systemem operacyjnym się posługujesz? Pomogłoby nam to ustalić, jak dobierać fonty pod inne systemy niż Windows... Pozdrawiam, 212.2.96.100 (dyskusja) 10:55, 20 paź 2009 (CEST)
- O, już widzę, w szablonach Javascriptu nie ma, ale jest w Mediawiki:Common.js. Ok, to można jednak próbować i javascriptem, choć obsługa fontów w JS wymaga doprawdy hackerskich umiejętności... 212.2.96.100 (dyskusja) 11:06, 20 paź 2009 (CEST)
- Ja tam się na ipach nie znam, ale jakby ktoś miał czas zrobić zamiast takiego długiego próbnika taką małą tabelkę jak to to mogę z każdą kolejną zmianą sprawdzać na swoich przeglądarkach. Przy okazji drobne sprostowanie odnośnie hieroglifów - owszem, mediawiki ma rozszerzenie, tyle że my go do hieroglifów nie wykorzystujemy ze względu na bodajże błędy. Zamiast tego są właśnie obrazki. Po szczegóły odsyłam do Adama bo na hieroglifach to ja się znam jeszcze mniej niż na ipach. 195.205.156.34 (dyskusja) 12:42, 20 paź 2009 (CEST)
- Ja używam dystrybucji Linuksa o nazwie Gentoo, środowisko KDE 4.3.2, przeglądarka Mozilla Firefox 3.5.3. Fontów w systemie mam niewiele. Strona Olafa wyglądała tak: http://tools.wikimedia.pl/~beau/tmp/IPA.png, fatalnie. Po zainstalowaniu sil-gentium, wygląda tak: http://tools.wikimedia.pl/~beau/tmp/IPA2.png, czyli dużo lepiej. Moja niechęć do rozwiązywania tego w inny sposób jest spowodowana tym, że łatwo jest coś przekombinować. Lepiej jest stawiać na proste rozwiązania, które działają. Jak tak dalej pójdzie, to strona wikisłownika będzie się otwierać godzinę, bo trzeba będzie czekać aż każdy skrypt przemieli to co ma zrobić (jeden będzie transkrypcję robił, drugi fonty wykrywał, trzeci cośtam ze skrótami...). Trzeba wziąć też pod uwagę inne przeglądarki, ich nowe wersje itd. Jestem ciekaw jak mieszanka znaków z różnych czcionek będzie wyglądać. Beau (dyskusja) 16:25, 20 paź 2009 (CEST)
- Dzięki za zrzuty, nie kasuj ich, proszę, jeszcze przez chwilę. Hmm, u Ciebie bez dodatkowego fontu rzeczywiście trudno cokolwiek dobrać... Internet Explorer dobiera do każdego glifu inny font, gdy próbuję wczytać do niego plik tekstowy z IPA zakodowany w UTF-8. Trochę to gorzej wygląda, niż w jednym dobrym foncie, ale zdecydowanie lepiej niż prostokąciki po brakujących glifach. Myślałem jeszcze o użyciu tego oprogramowania z jakimś wolnym fontem, nawet można zgodnie z licencją i ładnie wygląda, ale rozumiem, że byłyby opory, no i i tak trzeba by ten program przerobić, żeby łuki obsługiwał. Aha, transkrypcję będzie bot robił, do JavaScriptu nikt tego nie planował wprowadzać, bo nie byłoby nad tym kontroli. Pozdrawiam i jeszcze raz dziękuję, 212.2.96.100 (dyskusja) 16:44, 20 paź 2009 (CEST)
- Teraz sobie przypomniałem o jeszcze jednej rzeczy - w stylach można podawać adres pliku z czcionką do ściągnięcia.
- Kilka informacji znajduje się na http://techblog.wikimedia.org/2009/05/firefox-i18n-and-downloadable-fonts/
- Problem jest z przeglądarkami, nie wszystkie coś takiego obsługują.
- Trzeba znaleźć odpowiednią czcionkę na wolnej licencji
- Nie wiem, czy na serwery WMF da się przesyłać fonty, osoba komentująca wpis na w/w blogu twierdzi, że się nie da. Takiego fonta nie można umieścić na zewnętrznym serwerze (polityka prywatności).
- Beau (dyskusja) 16:59, 20 paź 2009 (CEST)
- To by powodowało automatyczne ściąganie przez każdego fontu, czy chce, czy nie... Jeśli przejmujemy się czasem otwierania strony, to tym bardziej nie powinniśmy tego robić tą techniką. Pozdrawiam, 212.2.96.100 (dyskusja) 11:11, 21 paź 2009 (CEST)
- Zgadza się, ale tylko jeden raz. Beau (dyskusja) 11:22, 21 paź 2009 (CEST)
- Szablony, które wymieniłem maja kilka bardzo niepraktycznych ograniczeń. Co do używania <math> to ten znacznik służy do renderowania wzorów, a nie do zabawy z czcionką. Nie jestem ekspertem jeśli chodzi o JavaScript, dlatego nie jestem pewny, czy da się sprawdzić, jaki font u użytkownika zawiera potrzebny znak, moim zdaniem się nie da. Jeśli chodzi o używanie do tego obrazków, to jestem stanowczo przeciwny takiemu rozwiązaniu. Z obrazkami wiąże się wiele problemów, podam jeden przykład. Obrazki to nie tekst, nie można zmienić kolorów, wielkości itp. dlatego będzie to uciążliwe dla osób z wadami wzroku - możliwość konfiguracji w preferencjach sposobu wyświetlania odpada ze względów wydajnościowych. Jeśli chodzi o style CSS, to proszę, podaj mi jak ma wyglądać nowy wpis, to go poprawię. Przydałaby się także opinia osoby z dłuższym stażem na wikisłowniku. Beau (dyskusja) 10:07, 20 paź 2009 (CEST)
- Teraz zauważyłem ten wątek i może dołożę swoje 3 grosze :) Więc, moim zdaniem, wszelkie rozwiązania oparte na obrazkach, javascripcie czy rozszerzeniach nie mają sensu. To musi być czystym unicodowym tekstem. Jedynym polem manewru jest przypisanie odpowiednich fontów w Common.css. Trzeba je tak dobrać aby na początku były te, które zawierają jak najwięcej znaków (najlepiej wszystkie) z zakredu IPA, stopniowo podając te, które jakiś tam znaków nie zawierają ale są częściej dostępne w standardowych dystrybucjach różnych systemów operacyjnych, np. Lucida Sans Unicode (Win) czy Geneva (Mac). To spowoduje, że jeśli ktoś nie jest IPA'owym geekiem i nie instalował sobie w systemie wczesniej wymienionych w definicji fontów zobaczy ich w miarę najwięcej jak to możliwe. Ci zaś co ów geekami są (znają się na IPA i z niego korzystają) na pewno zainstalują sobie potrzebne fonty (trzeba podać do nich linki w jednym miejscu – formie jakiegoś aneksu – najlepiej opisie szablonu IPA) i w ten sposób będą mieli wyświetlane wszystko.
- Ważną kwestia jest to, iż np. system Mac OS X fonty w przeglądarkach obsługuje w ten sposób, iż nawet jeśli mam w deklaracjach css fonty, które jakiegoś glifu nie posiadają to system z automatu „przeszukuje” resztę zainstalowanych fontów i wyświetla te pojedyncze znaki takim fontem, który ów glif zawiera. Ponoć taki sam system jest zaimplementowany w Windowsowskim IE8. Nie jest to może najładniejsze rozwiązanie ale dzięki niemu nie ma pustych kwadratów – a o to chodzi. Dlatego takie rozwiązanie, o którym piszę powyżej, z uwzględnieniem tych funkcji w najnowszych przeglądarkach/systemach jest uniwersalne. Zapewnia poprawne wyświetlanie nawet przy minimum ingerencji ze strony użytkownika. Jeśli jednak ktoś będzie chciał mieć wszystko i ładnie wystarczy, że jak wspomniałem zainstaluje odpowiednie fonty. Jeśli nadal komuś to nie będzie pasować i będzie chciał mieć IPA jeszcze innym fontem zawsze może sobie stosowną klasę opisać we własnym css użytkownika, który ma wyższy priorytet niż Common.css (można tę procedurę też opisać w stosownym aneksie). I naprawdę nic więcej kombinować nie trzeba. Jedyne co musimy zrobić to znaleźć fonty zawierające pełną paletę glifów IPA (najlepiej na wolnych licencjach) i podać do nich linki. Ewentualnie zamieścić ich kopię na toolserverze (nie na commons bo się nie da) i podpiąć je stamtąd do CSS. Nie wiem jak z ta polityką prywatności, ale wiele rozszerzeń czy skryptów (choćby te Erika Zachte) pobiera dane z toolserverów a nie z Commons. Jeśli trzeba, aby było to zgodne z polityką, to można takie podpięcie zrobić za pomocą gadżetu (opisującego klasę i fonty) w którego opisie będzie czarno na białym, iż font pobierany jest z zewnętrznego serwera. I to wszystko. Pozdrawiam --joystick [::ש::] 12:49, 4 lis 2009 (CET)
Oznaczanie akcentu w IPA
Która wersja powinna być stosowana w Wikisłowniku na oznaczenie akcentu?
- symbol ˈ przed akcentowaną sylabą (źródło: en-wiki)
- symbol ˈ po akcentowanej sylabie (źródło: en-wiki)
- symbol ˈ przed akcentowaną samogłoską (źródło: Słownik wymowy polskiej PWN, red. M. Karaś, M. Madejowa, Kraków 1977)
- pogrubienie (bold) akcentowanej samogłoski (źródło: Fonetyka i fonologia współczesnego języka polskiego, PWN D. Ostaszewska, J. Tambor)
212.2.96.100 (dyskusja) 09:33, 28 paź 2009 (CET)
Czcionki IPA
Gdzieś wyżej w barze była dyskusja nad czcionkami do pokazywania IPA. Zainstalowałem sobie wszystkie publicznie dostępne czcionki dla IPA i zrobiłem przegląd (tutaj). Wyszło mi, że w zasadzie nie ma czcionki idealnej, ale obecna kolejność jest fatalna. Pierwsze trzy miejsca w klasie .ipa zajmują fonty, którym brakuje niektórych znaków.
Prosiłbym o zmianę w klasie .ipa w MediaWiki:Common.css na następującą kolejność:
.ipa {
white-space: nowrap;
font-family: 'Charis SIL', 'Doulos SIL', Junicode, 'TITUS Cyberbit Basic', 'DejaVu Sans', 'DejaVu Sans Condensed', Gentium, GentiumAlt, LeedsUni, 'Arial Unicode MS', 'DejaVu Serif', 'DejaVu Serif Condensed', SImPL, Thryomanes, Code2000, 'Hindsight Unicode'
font-size: 110%
}
Zmiany nie pogorszą wyświetlania czegokolwiek, sprawdziłem na sobie.
Autorem poprzedniej listy był Derbeth, ostatnio na wikisłowniku nieosiągalny. Nie wiem, kogo jeszcze można by spytać o ewentualną recenzję tej zmiany. Według mnie taka lub podobna zmiana jest konieczna, żeby IPA i AS poprawnie się wyświetlało.
Pozdrawiam, Olaf (dyskusja) 02:36, 30 lis 2009 (CET)
- Wrzuciłem zmiany do MediaWiki:Common.css. Beau (dyskusja) 11:40, 30 lis 2009 (CET)
język francuski - IPA, wymowa, odmiana
Mam kilka propozycji dotyczących haseł w j. francuskim: po pierwsze, czy któregoś z istniejących botów dałoby się zmodyfikować tak, żeby "ściągał" IPA i wymowę z francuskiego Wikisłownika? Po prostu sprawdza tam czy istnieje zapis fonetyczny i/lub plik audio z wymową - jeśli tak, to wstawia w odpowiednim miejscu w naszym haśle. Nie jest to bardzo uciążliwe przy tworzeniu nowych haseł, ale raczej nikomu nie będzie się chciało poprawiać tego w kilku tysiącach istniejących słów. Jeśli nie da się zmodyfikować istniejącego bota, to mógłbym sam go napisać (o ile oczywiście moją propozycję uznacie za sensowną), ale na początku potrzebowałbym pomocy doświadczonego botopisarza, bo nigdy tego nie robiłem. Jeszcze co do odmiany. Widziałem dyskusję na temat tabelki zawierającej odmianę w niemieckim Wikisłowniku, ale chodziło tam o słowa polskie. Bardzo podoba mi się rozwiązanie naszych francuskich znajomych - do każdego (chyba) czasownika mają oni osobną stronę w przestrzeni nazw Annexe z pełną jego odmianą (http://fr.wiktionary.org/wiki/Annexe:Conjugaison_française:être). Czy można by było przy opisywaniu francuskich czasowników dodawać gdzieś linka do tej tabelki? Pytam, bo nie jestem jeszcze doświadczonym użytkownikiem, a być może sprzeciwia się to tutejszym regułom. Alkamid (dyskusja) 11:32, 26 lut 2010 (CET)
- Co do wymowy, to chyba Beau.bot już to robi. A z odmianą coś podobnego jest w hiszpańskim, np. Aneks:Język hiszpański - odmiana czasownika enviar. Pozdr., Olaf (dyskusja) 20:52, 26 lut 2010 (CET)
- Beau.bot usiłuje zgadywać na podstawie nazwy nagrania słowo, do którego należy wstawić link. Algorytm nie jest doskonały, można pokusić się o przeglądanie stron na innych projektach i import wymowy bezpośrednio stamtąd (nazw plików z nagraniami + zapis fonetyczny). Ja niestety nie dysponuje obecnie wolnym czasem, żeby zająć się tym problemem. Kod obecnie działającego rozwiązania znajduje się pod adresem http://bitbucket.org/plwiki/bot/src/tip/plwiki/beaubot/bot/wikt-pronun.pl. Beau (dyskusja) 18:57, 1 mar 2010 (CET)
Sentencje łacińskie
Nie mam jeszcze doświadczenia z Wikisłownikiem, ale może warto by było umieszczać autora sentencji na stronie jej poświęconej. Np. nowa pozycja "Autor" lub wpisywać w "Uwagach"? Ania294 (dyskusja) 19:02, 2 maj 2010 (CEST)
- Jest tak robione, np. w haśle amicus proba, probatum ama - niekiedy jest też podawany tytuł (np. Horacy, Pieśni), niekiedy też jest to linkowane do Wikipedii (Horacy, Pieśni). // user:Azureus (dyskusja) 19:08, 2 maj 2010 (CEST)
Szablony IPA, IPA3 i podobne
Znalazłem tutaj krótką dyskusję dotyczącą szablonów zapisu wymowy. Richiski napisał mi kiedyś, że powinno się używać nawiasów kwadratowych, ale w anglojęzycznych podręcznikach często stosują ukośniki. Jeśli jest to tylko kwestia umowy, a nie jakichś językoznawczych niuansów, to może zdecydowalibyśmy się na stosowanie jednego zapisu? Po co mamy początkującym tłumaczyć, że mają używać IPA3 - potem będzie im się myliło, czy to było 3 czy może 5. Poza tym istnieje jeszcze Szablon:S - czy to też moglibyśmy przekonwertować? Gdyby była zgoda, mogę to zrobić botem. Alkamid (dyskusja) 22:33, 10 gru 2010 (CET)
- Międzynarodowe Towarzystwo Fonetyczne zaleca, by transkrypcję fonetyczną umieszczać w nawiasach kwadratowych: „[ ]”. Z kolei transkrypcja fonemiczna powinna być umieszczana między znakami ukośnika: „/ /”. [2]. DIXI --Richiski (dyskusja) 22:58, 10 gru 2010 (CET)
- Dokładnie. Przy czym wiele słowników nie trzyma się tej konwencji i umieszcza zapis fonemiczny w nawiasach kwadratowych, ale nie ma co powielać ich błędów. A Szablon:S to szablon pomocniczy z którego korzystają pozostałe. Są jeszcze analogiczne szablony dla alfabetu slawistycznego, zapisu Dania itp. Olaf (dyskusja) 23:18, 10 gru 2010 (CET)
- A czy my mamy gdziekolwiek zapis fonemiczny? Alkamid (dyskusja) 10:29, 11 gru 2010 (CET)
- Zapis fonemiczny - albo raczej fonemowy - nie jest nam tutaj przydatny, gdyż nam potrzebny jest zapis dźwięków, czyli fonetyczny. Zapis fonemowy jest przydatny w innych warunkach i raczej do celów kontrastywnych. Zwykłemu użytkownikowi prawie nic on nie daje. DIXI :) --Richiski (dyskusja) 10:39, 11 gru 2010 (CET)
- No nie, tu się nie zgodzę. Fonemiczny też jest zapisem dźwięków, tylko na poziomie fonemów a nie głosek. Jest po prostu mniej szczegółowy, bo obejmuje jedynie te cechy które są dystynktywne (są konieczne dla odróżnienia danego słowa od innych). Fonetyczny jest bardziej szczegółowy, więc np. dwie osoby mówiące po polsku to samo słowo mogą mieć różne zapisy fonetyczne, choć bardzo rzadko będą miały inne zapisy fonemiczne (może za wyjątkiem gęsi i np. wymowy wygłosu gdy następny wyraz zaczyna się od dźwięcznej spółgłoski). Zapis fonemiczny też ma sens, bo obcokrajowiec widzi co jest faktycznie istotne w danej wymowie, a nie jest tylko cechą osobniczą. Dosyć często mamy zapisy fonemiczne w wikisłowniku, prawie cały angielski jest taki. Natomiast w polszczyźnie Olafbot dodaje wszędzie zapisy fonetyczne. Jeszcze mamy zapis AS dla słów z polskiego i ortograficzny, np. dla terminów obcych w języku polskim. Olaf (dyskusja) 11:42, 11 gru 2010 (CET)
- Dobra, czyli fonemy występują i nie można się po prostu pozbyć ich szablonu. Z tego co rozumiem, bardziej pożądany jest zapis fonetyczny, dlatego proponuję zmianę Szablon:S → Szablon:S oraz Szablon:S → Szablon:S. Jest to bardzo prosta operacja dla bota. Przy okazji, moglibyście mi wskazać jakieś dobre opracowanie na temat różnic w zapisie fonemów i fonetyki? Wtedy bot mógłby też posprzątać w szablonach, tzn. jeśli wymowa fonetyczna jest umieszczona między nawiasami kwadratowymi, to zmieniałby na ukośniki. A może to nie takie proste jak się wydaje? Drążę temat, bo chciałbym zrobić półautomatyczne wprowadzanie IPA z innych Wikisłowników, a nie chcę tego robić na pałę. Alkamid (dyskusja) 12:37, 12 mar 2011 (CET)
- Zaraz, ale proponujesz samą tylko zmianę szablonu bez zmiany treści? No to bez sensu, nawiasy [ ] zmieniłyby się na / / i już nie byłoby wiadomo który zapis jest fonetyczny, a który fonologiczny (fonemiczny). Czy też chodzi Ci o przekonwertowanie także treści z bardziej szczegółowego fonetycznego na mniej szczegółowy fonemiczny? To znów, pomijając sens takiej operacji, wymagałoby np. dla polszczyzny ustalenia sposobu wykonania tej operacji. Mam w książce "Podstawy wiedzy o języku polskim dla glottodydaktyków, pedagogów, psychologów i logopedów" porównanie trzech systemów fonologicznych - Stiebera, Jassema i Rocławskiego. Jassem ma Szablon:IPA2 za to nie ma Szablon:IPA2, Szablon:IPA2. Pozostali Szablon:IPA2 nie mają, ale za to Stieber ma nosowe m. Krótko mówiąc nawet w obrębie polszczyzny można głoski pogrupować w fonemy na różne sposoby. Nie mam pojęcia, jak taką konwersję zrobić dla innych języków, a każdy ma inne cechy dystynktywne i co za tym idzie inne fonemy, np. w chińszczyźnie ważna jest wysokość głosu (zob. w:en:Lion-Eating Poet in the Stone Den). Proszę więc, zachowuj takie nawiasy, jak oryginalnie i nie kombinuj ze zmienianiem zapisów... W ogóle oprócz zapisów fonetycznego i fonologicznego (czyli fonemicznego) jest jeszcze np. Szablon:S. W angielskim, francuskim, hiszpańskim, niemieckim dobrze byłoby też parsować informację, jaka to odmiana języka (Szablon:Bryt, Szablon:Amer, Szablon:Kanadang, Szablon:Austral, itp.) i trzeba to jakoś rozmieścić w sekcji wymowy razem z szablonami audio dotyczącymi tych samych odmian języka, żeby np. Received Pronunciation z en-wikt znalazła się pod kwalifikatorem Szablon:Bryt razem z nagraniem Szablon:S. Olaf (dyskusja) 13:07, 12 mar 2011 (CET)
- Proponuję zmianę szablonów, ponieważ wydawało mi się, że zapis fonetyczny jest częstszy, więc byłoby to ułatwienie dla początkujących - nie martwiliby się, czy mają wstawić IPA2, IPA3 czy moze IPA4. Sam kiedyś instruowałem kilkoro ludzi jak edytować hasła i mieli z tym problem - to kolejna informacja, którą trzeba sprawdzić w zasadach. I nie chcę robić konwersji, tylko sprawdzać czy zapis jest rzeczywiście fonetyczny/fonemowy - jeśli bot pobierze coś, co było w [ ], a wykryje tam fonem, to po co ma kopiować błąd? Ja sam tych dwóch zapisów nie rozróżniam i zazwyczaj kopiuję tak jak jest w źródle. Alkamid (dyskusja) 17:05, 12 mar 2011 (CET)
- Fonem to zbiór głosek. Jako jego symbol jest wybierany symbol jednej z należących do niego głosek (zob. np. tabelkę tutaj). W dodatku w zależności od systemu fonetycznego, jaki akurat ktoś przyjął, te same głoski mogą być inaczej grupowane w fonemy, albo językoznawca może wybrać inne oznaczenie fonemu. Widząc zapis nie da się więc stwierdzić, czy to zapis fonetyczny (głoski), czy fonologiczny (fonemy), o ile nie jest się specjalistą od wymowy w tym konkretnym języku. Możemy tylko użyć takich samych nawiasów, jakich akurat ktoś użył w źródłowym słowniku. A szkoda, bo słowniki często podają wymowę przybliżoną, z fonemami, a stosują nawiasy kwadratowe jakby to był zapis fonetyczny. Ale nic na to nie poradzimy. A jeśli chodzi o zmiany szablonu - ale jak by to miało wyglądać? Jeden szablon w którym nawiasy jednego z dwóch rodzajów wpisujemy sami do środka? Może tak by było prościej, ale chyba i tak trzeba by sprawdzać w zasadach, że w ogóle należy użyć szablonu IPA. Olaf (dyskusja) 17:18, 12 mar 2011 (CET)
- Aha, czyli sprawdzanie odpada. Chodziło mi o zamianę szablonów IPA i IPA3 oraz IPA2 i IPA4, czyli IPA działałby jak teraz IPA3, a IPA2 tak jak IPA4 - i na odwrót. Tylko po to, żeby początkujący nie musieli pamiętać cyfr, tylko pisać zawsze IPA, ponieważ założyłem że najczęściej wpisuje się IPA właśnie. Ale skoro mówisz, że większość angielskiego ma fonemy, poza tym pewnie więcej problemu byłoby z odzwyczajeniem starych użytkowników, więc wycofuję propozycję. Szkoda tylko, że nie da się sprawdzić automatycznie czy zapis nie jest błędny, bo przypuszczam że wielu użytkowników wstawia wymowę nieświadomie. Alkamid (dyskusja) 22:06, 12 mar 2011 (CET)
- Żeby było lepiej, to niektórzy w ogóle olewają sprawę: fr:accoucheuse, bo raz podana jest wymowa w [], raz w // - oczywiście taka sama. Alkamid (dyskusja) 23:02, 12 mar 2011 (CET)
- Fonem to zbiór głosek. Jako jego symbol jest wybierany symbol jednej z należących do niego głosek (zob. np. tabelkę tutaj). W dodatku w zależności od systemu fonetycznego, jaki akurat ktoś przyjął, te same głoski mogą być inaczej grupowane w fonemy, albo językoznawca może wybrać inne oznaczenie fonemu. Widząc zapis nie da się więc stwierdzić, czy to zapis fonetyczny (głoski), czy fonologiczny (fonemy), o ile nie jest się specjalistą od wymowy w tym konkretnym języku. Możemy tylko użyć takich samych nawiasów, jakich akurat ktoś użył w źródłowym słowniku. A szkoda, bo słowniki często podają wymowę przybliżoną, z fonemami, a stosują nawiasy kwadratowe jakby to był zapis fonetyczny. Ale nic na to nie poradzimy. A jeśli chodzi o zmiany szablonu - ale jak by to miało wyglądać? Jeden szablon w którym nawiasy jednego z dwóch rodzajów wpisujemy sami do środka? Może tak by było prościej, ale chyba i tak trzeba by sprawdzać w zasadach, że w ogóle należy użyć szablonu IPA. Olaf (dyskusja) 17:18, 12 mar 2011 (CET)
- Proponuję zmianę szablonów, ponieważ wydawało mi się, że zapis fonetyczny jest częstszy, więc byłoby to ułatwienie dla początkujących - nie martwiliby się, czy mają wstawić IPA2, IPA3 czy moze IPA4. Sam kiedyś instruowałem kilkoro ludzi jak edytować hasła i mieli z tym problem - to kolejna informacja, którą trzeba sprawdzić w zasadach. I nie chcę robić konwersji, tylko sprawdzać czy zapis jest rzeczywiście fonetyczny/fonemowy - jeśli bot pobierze coś, co było w [ ], a wykryje tam fonem, to po co ma kopiować błąd? Ja sam tych dwóch zapisów nie rozróżniam i zazwyczaj kopiuję tak jak jest w źródle. Alkamid (dyskusja) 17:05, 12 mar 2011 (CET)
- Zaraz, ale proponujesz samą tylko zmianę szablonu bez zmiany treści? No to bez sensu, nawiasy [ ] zmieniłyby się na / / i już nie byłoby wiadomo który zapis jest fonetyczny, a który fonologiczny (fonemiczny). Czy też chodzi Ci o przekonwertowanie także treści z bardziej szczegółowego fonetycznego na mniej szczegółowy fonemiczny? To znów, pomijając sens takiej operacji, wymagałoby np. dla polszczyzny ustalenia sposobu wykonania tej operacji. Mam w książce "Podstawy wiedzy o języku polskim dla glottodydaktyków, pedagogów, psychologów i logopedów" porównanie trzech systemów fonologicznych - Stiebera, Jassema i Rocławskiego. Jassem ma Szablon:IPA2 za to nie ma Szablon:IPA2, Szablon:IPA2. Pozostali Szablon:IPA2 nie mają, ale za to Stieber ma nosowe m. Krótko mówiąc nawet w obrębie polszczyzny można głoski pogrupować w fonemy na różne sposoby. Nie mam pojęcia, jak taką konwersję zrobić dla innych języków, a każdy ma inne cechy dystynktywne i co za tym idzie inne fonemy, np. w chińszczyźnie ważna jest wysokość głosu (zob. w:en:Lion-Eating Poet in the Stone Den). Proszę więc, zachowuj takie nawiasy, jak oryginalnie i nie kombinuj ze zmienianiem zapisów... W ogóle oprócz zapisów fonetycznego i fonologicznego (czyli fonemicznego) jest jeszcze np. Szablon:S. W angielskim, francuskim, hiszpańskim, niemieckim dobrze byłoby też parsować informację, jaka to odmiana języka (Szablon:Bryt, Szablon:Amer, Szablon:Kanadang, Szablon:Austral, itp.) i trzeba to jakoś rozmieścić w sekcji wymowy razem z szablonami audio dotyczącymi tych samych odmian języka, żeby np. Received Pronunciation z en-wikt znalazła się pod kwalifikatorem Szablon:Bryt razem z nagraniem Szablon:S. Olaf (dyskusja) 13:07, 12 mar 2011 (CET)
- Dobra, czyli fonemy występują i nie można się po prostu pozbyć ich szablonu. Z tego co rozumiem, bardziej pożądany jest zapis fonetyczny, dlatego proponuję zmianę Szablon:S → Szablon:S oraz Szablon:S → Szablon:S. Jest to bardzo prosta operacja dla bota. Przy okazji, moglibyście mi wskazać jakieś dobre opracowanie na temat różnic w zapisie fonemów i fonetyki? Wtedy bot mógłby też posprzątać w szablonach, tzn. jeśli wymowa fonetyczna jest umieszczona między nawiasami kwadratowymi, to zmieniałby na ukośniki. A może to nie takie proste jak się wydaje? Drążę temat, bo chciałbym zrobić półautomatyczne wprowadzanie IPA z innych Wikisłowników, a nie chcę tego robić na pałę. Alkamid (dyskusja) 12:37, 12 mar 2011 (CET)
- No nie, tu się nie zgodzę. Fonemiczny też jest zapisem dźwięków, tylko na poziomie fonemów a nie głosek. Jest po prostu mniej szczegółowy, bo obejmuje jedynie te cechy które są dystynktywne (są konieczne dla odróżnienia danego słowa od innych). Fonetyczny jest bardziej szczegółowy, więc np. dwie osoby mówiące po polsku to samo słowo mogą mieć różne zapisy fonetyczne, choć bardzo rzadko będą miały inne zapisy fonemiczne (może za wyjątkiem gęsi i np. wymowy wygłosu gdy następny wyraz zaczyna się od dźwięcznej spółgłoski). Zapis fonemiczny też ma sens, bo obcokrajowiec widzi co jest faktycznie istotne w danej wymowie, a nie jest tylko cechą osobniczą. Dosyć często mamy zapisy fonemiczne w wikisłowniku, prawie cały angielski jest taki. Natomiast w polszczyźnie Olafbot dodaje wszędzie zapisy fonetyczne. Jeszcze mamy zapis AS dla słów z polskiego i ortograficzny, np. dla terminów obcych w języku polskim. Olaf (dyskusja) 11:42, 11 gru 2010 (CET)
- Zapis fonemiczny - albo raczej fonemowy - nie jest nam tutaj przydatny, gdyż nam potrzebny jest zapis dźwięków, czyli fonetyczny. Zapis fonemowy jest przydatny w innych warunkach i raczej do celów kontrastywnych. Zwykłemu użytkownikowi prawie nic on nie daje. DIXI :) --Richiski (dyskusja) 10:39, 11 gru 2010 (CET)
- A czy my mamy gdziekolwiek zapis fonemiczny? Alkamid (dyskusja) 10:29, 11 gru 2010 (CET)
- Dokładnie. Przy czym wiele słowników nie trzyma się tej konwencji i umieszcza zapis fonemiczny w nawiasach kwadratowych, ale nie ma co powielać ich błędów. A Szablon:S to szablon pomocniczy z którego korzystają pozostałe. Są jeszcze analogiczne szablony dla alfabetu slawistycznego, zapisu Dania itp. Olaf (dyskusja) 23:18, 10 gru 2010 (CET)
IPA dla j.chińskiego - kto pomoże?
Jako, że IPA pozostaje dla mnie zupełnie niepojętym tworem, a jednocześnie rozumiem, iż jest to jakiś standard i zatem wypadałoby ją umieszczać także w hasłach chińskich, chciałam zapytać, czy ktoś na ochotnika mnie wspomoże. Bo tak sobie pomyślałam, że skoro chiński jest sylabiczny, a ilość sylab ograniczona, to wystarczy, że ktoś zrobi mi tabelkę na kształt tej z bopomofo, a ja już dalej sama będę IPA dodawać do haseł... (bo rozumiem też, że IPA akcentów w zrozumieniu chińskim nie odróżnia?) 神秘美人 (dyskusja) 12:10, 14 sty 2013 (CET)
- Jeśli ta prośba jest jeszcze aktualna, będę w stanie pomóc. Jeśli masz dostęp do książki Jerry’ego Normana Chinese, to tam na stronach 139-149 są odpowiednie objaśnienia, wraz z bardzo pomocnymi tabelkami dla nagłosów (str. 139) oraz wygłosów sylab (str. 141). Pozdrawiam. Ksymil (dyskusja) 07:12, 5 sty 2014 (CET)
- Książek nie mam. Ogólnie to po prostu w wolnej chwili albo 1) dodawaj IPA tam gdzie nie ma 2) dodaj do aneksu tabelkę z IPA to ja będę stamtąd kopiować ;) 神秘美人 (dyskusja) 14:25, 25 lut 2014 (CET)
- Nie wiem, jak jest w chińskim, ale zdziwiłbym się, gdyby było prościej niż w polskim. A w polszczyźnie, i owszem, tabelka istnieje (np. tutaj), ale jednocześnie obecność niektórych głosek modyfikuje wymowę głosek sąsiednich a nawet sąsiednich wyrazów na kilkadziesiąt różnych sposobów co tworzy całkiem skomplikowany system (jedna z jego wersji jest opisana tutaj). Do tego jest sporo wyjątków (np. tutaj, tutaj). A to jest polszczyzna, w której zapis jest uważany za niemal bezpośrednio przekładający się na wymowę. Słyszałem anegdotkę (nie wiem czy prawdziwą), że chiński potrafi być bardzo różnie wymawiany w różnych regionach Chin, do tego stopnia, że dwóch Chińczyków z oddalonych miejsc może się w ogóle nie rozumieć wzajemnie i wtedy piszą do siebie w powietrzu... Akcent na pewno zaznacza się w IPA, zaznacza się także cztery tony występujące w chińskim (w taki sposób), których zmiany tworzą chiński akcent. Bez zaznaczania tonów nie miałoby to sensu, czego przykładem jest ten wiersz. Jeśli nie jesteście pewni jak się co wymawia, to chyba lepiej nie podawać wcale wymowy, niż podawać wymowę mechanicznie utworzoną na podstawie tabelki, bez uwzględnienia rozmaitych niuansów. Olaf (dyskusja) 14:48, 25 lut 2014 (CET)
- Powiem tak: odróżnijmy "akcent" jako standardowy sposób wymowy (dalej: ton/wymowa) on "akcentu" jako sposobu wymowy charakterystycznego dla regionu (dalej: akcent/dialekt). Bo i owszem, jest tak, że np. w Pekinie pewne słowa mówi się bardziej nosowo, i do tego gdzie się da, doczepia się 儿 na wygłosie (np. 这儿 zamiast 这), ale mimo tego tony górne są zawsze górne, a dolne - dolne. Więcej: anegdota którą przytaczasz, o "pisaniu sobie w powietrzu" odnosi się do czasów pre-Mao, zanim "chiński standardowy" czyli Mandaryński (teraz nawet wdzięcznie określany na kontynencie jako "język popularny") został wprowadzony właśnie jako standard. I spotykał się Pekińczyk z Szanghajczykiem, i jeden mówił po Mandaryńsku, a drugi po Kantońsku, i nic a nic się nie rozumieli... ;) 神秘美人 (dyskusja) 15:24, 25 lut 2014 (CET)
- P.S. Piękny wierszyk. W sekcji "Explanation" masz wyłuszczone sedno anegdoty ;)
- P.S.2. A wracając do meritum - tak, dla chińskiego tabelka jak najbardziej się sprawdzi, gdyż, jak widać w tabelkach w transkrypcji, masz jakieś ~400 kombinacji dźwięków razy max 5 tonów, czyli skończoną liczbę łączną maksimum 2 tysięcy zapisów IPA. Bagatela! ;)
- Ok, jeśli tabelka uwzględnia tyle kombinacji, to być może rzeczywiście jest dobrym opisem wymowy. Z wierszykiem chodziło mi tylko o to, że w językach dalekowschodnich niezbędne jest zaznaczenie w IPA tonów. Wierszyk jest dobrym przykładem, bo z tonami ma sens, bez nich jest tylko powtarzane "shi". A Twoje stwierdzenie "rozumiem też, że IPA akcentów w zrozumieniu chińskim nie odróżnia" odebrałem jako pytanie, czy można tonów nie zaznaczać. Ale jeśli chodziło o jakieś inne akcenty, a nie pokazanie w IPA zmiany tonów, to w porządku, nie znam się.
Książka o której pisał Ksymil jest prawie cała tutaj.(Właśnie sprawdziłem, że stron 139 i 141 niestety nie ma) Olaf (dyskusja) 16:04, 25 lut 2014 (CET)
- Ok, jeśli tabelka uwzględnia tyle kombinacji, to być może rzeczywiście jest dobrym opisem wymowy. Z wierszykiem chodziło mi tylko o to, że w językach dalekowschodnich niezbędne jest zaznaczenie w IPA tonów. Wierszyk jest dobrym przykładem, bo z tonami ma sens, bez nich jest tylko powtarzane "shi". A Twoje stwierdzenie "rozumiem też, że IPA akcentów w zrozumieniu chińskim nie odróżnia" odebrałem jako pytanie, czy można tonów nie zaznaczać. Ale jeśli chodziło o jakieś inne akcenty, a nie pokazanie w IPA zmiany tonów, to w porządku, nie znam się.
- Zaiste - było to pytanie. Jak pisałam - IPA to dla mnie jakaś czarna magia. Także - jeśli da się zrobić tabelkę, to super. A w ogóle - panie właścicielu bota - to może da się zrobić "słownik" pinyin-IPA (bo tam już są akcenty), i bot by do nowych haseł na bazie pinyin podanego doklejał IPA? (wiem, leń ze mnie wychodzi. wstyd!) 神秘美人 (dyskusja) 16:35, 25 lut 2014 (CET)
- p.s. Takich miłych wierszyków jest więcej, zob. w:en:One_syllable_article ;-) Olaf (dyskusja) 16:04, 25 lut 2014 (CET)
- P.S. Zaiste. Bo chiński to w ogóle bardzo fajny język jest :) 神秘美人 (dyskusja) 16:35, 25 lut 2014 (CET)
- Jeśli konwersja pinyin -> IPA jest jednoznaczna i da się to opisać na przykład tabelką, to może i dałoby się, nawet bez bota. Mamy np. szablon Szablon:S, który tworzy transliterację w kilku językach. Widzę tylko dwa problemy - po pierwsze tabelek znalazłem aż za dużo, tylko chyba nie do końca zgodnych ([3], [4], [5]). Po drugie, akurat mam chwilę czasu, którą wykorzystuję na ten import, ale na ogół z czasem u mnie kiepsko, a to by jednak był spory projekt. A może mogłabyś skorzystać z tego konwertera: [6], albo z tego? Olaf (dyskusja) 17:11, 25 lut 2014 (CET)
- Książek nie mam. Ogólnie to po prostu w wolnej chwili albo 1) dodawaj IPA tam gdzie nie ma 2) dodaj do aneksu tabelkę z IPA to ja będę stamtąd kopiować ;) 神秘美人 (dyskusja) 14:25, 25 lut 2014 (CET)
Wymowa sześćdziesiąt
Czy ktokolwiek wie, dlaczego w haśle sześćdziesiąt i pochodnych wymowa zapisana jest w wersji [sześdźe…], a nie [szeźdźe…]? Do tego na stronie zasad wymowy jest uwaga: „wyjątkiem jest sześćdziesiąt, gdzie ć zanika, a ś nie udźwięcznia się”, więc to nie pomyłka, a celowy zapis. Ja takiej wymowy nigdy nie słyszałem, a źródła podają właśnie z udźwięcznieniem:
- „Słownik wymowy polskiej PWN” (red. M. Karaś i M. Madejowa, 1977, s. 431) ma we wszystkich hasłach rozpoczynających się od sześćdzie… zapis z ź (IPA: [ʑ])
- „Podręczny słownik poprawnej wymowy polskiej” (red. W. Lubaś i St. Urbańczyk, wyd. III, 1994, s. 418) ma tylko jedno hasło: sześćdziesiąt, ale tak samo wymowę z ź
- „Słownik poprawnej polszczyzny PWN” (2000) ma w każdym haśle na sześćdzie… podaną wymowę z ź
Nie chodzi tu o różne sposoby zapisu tej wymowy (IPA czy alfabet słowiański) ani o różną interpretację pewnych zjawisk fonetycznych (jak np. w przypadku samogłosek nosowych), bo wszystkie powyższe źródła są ze sobą zgodne co do tego, że żadnego wyjątku tu nie ma i następuje zwykłe udźwięcznienie jak w tysiącach innych wyrazów polskich. Jeśli ktoś na ten temat coś wie, byłbym wdzięczny za wyjaśnienie. Ksymil (dyskusja) 16:08, 13 kwi 2014 (CEST)
- PS: Jeślim dobrze zlokalizował zmianę, to informacja pochodzi od Olafa. Ksymil (dyskusja) 16:25, 13 kwi 2014 (CEST)
- A żebym to ja pamiętał, skąd to wziąłem cztery lata temu. Najprawdopodobniej z podręcznika Ostaszewskiej i Tambor, skąd pochodzi cały algorytm bota dodającego wymowę. Ale teraz zacząłem sprawdzać w innych źródłach i wszędzie widzę przykłady na zmianę na źć: tak podaje Słownik Wymowy Polskiej PWN, a także kilka innych książek: [7], [8], [9], [10]. Poszukam jeszcze tej Ostaszewskiej i Tambor, bo mi gdzieś wsiąkła, ale mam wrażenie, że nawet jeśli ten wyjątek jest tam potwierdzony, to raczej jest to błąd. Olaf (dyskusja) 19:48, 13 kwi 2014 (CEST)
Algorytm polskiej fonetyki
Podobno w tej Wiktionary jest zastosowany algorytm tworzący zapis fonetyczny dla nowych haseł. Jaki to algorytm, gdzie jest opisany? W Aneks:Język_polski_-_wymowa_-_głoski jest rozróżnienie np. głoski a w czytać, przyjaciel, zamek czy sabatarianizm a ja nie słyszę różnicy. Jest coś takiego jak podwyższona artykulacja i zanalizowanie. Czy podwyższona artykulacja oznacza zaakcentowanie? Natomiast, może to tylko w moich stronach, słowa związane z jeść wymawia się jakby przez dłuższe, podwójne j. Jem inaczej niż jen, je inaczej niż w znaczeniu one (kochałem je itp). Czy gdzieś jest zamieszczony ten algorytm? Borneq (dyskusja) 06:12, 30 gru 2014 (CET)
- Wszystkie informacje na temat wymowy polskiej, tak jak jest ona podawana w Wikisłowniku, można znaleźć w książce: Danuta Ostaszewska, Jolanta Tambor: Fonetyka i fonologia współczesnego języka polskiego, wyd. II, PWN 2009 (z wieloma dodrukami; książka nieustająco dostępna w księgarniach). Tam są objaśnione pojęcia stosowane w opisie zjawisk fonetycznych (jak np. podwyższona artykulacja samogłosek, która nie ma nic wspólnego z akcentem, a polega na podniesieniu środkowej części języka ku górze i ma miejsce w obustronnym otoczeniu spółgłosek miękkich; nazalizacja, czyli unosowienie samogłoski przed spółgłoską nosową itd. itp.). Nie wszystkie odcienie brzmieniowe są łatwe do uchwycenia dla każdego ucha, zostały one jednak potwierdzone doświadczeniami z wykorzystaniem odpowiednich urządzeń (por. w Wikipedii hasło: Fonetyka eksperymentalna).
- Dla zachowania jednolitości podawanej wymowy w Wikisłowniku stosuje się wszystkie reguły uznane w tej książce za podstawowe. Nie są to w żadnym wypadku jedyne akceptowalne (czyli uznawane za poprawne) sposoby wymawiania wyrazów polskich.
- Na temat całości reguł, jakimi posługuje się bot przy generowaniu wymowy, i ich dostępności na stronach Wikisłownika wypowiedzieć by się musiał Olaf, który tym zarządza. Dodam tylko, że wygenerowany automatycznie zapis wymowy przed przeniesieniem do hasła jest jeszcze sprawdzany przez czynnik ludzki, aby uniknąć problemów związanych z ortografią nieregularną, wyrazami obcymi itp. Pozdrawiam serdecznie. Ksymil (dyskusja) 10:00, 30 gru 2014 (CET)
Tak, zaimplementowałem wszystkie reguły z podręcznika Ostaszewskiej, w wersji wymowy warszawskiej. Dokładnie jest to opisane na stronach: Aneks:Język polski - wymowa - zasady, Aneks:Język polski - wymowa - dwuznaki, Aneks:Język polski - wymowa - głoski, user:Olafbot#Generowanie wymowy polskiej. Podwyższona artykulacja to nie akcent, to chyba lekkie przymknięcie ust w porównaniu z niepodwyższoną artykulacją. Kwestia podwyższonej artykulacji jest faktycznie kontrowersyjna. Z jednej strony wielu polskich fonetyków uważa, że ona istnieje i ponoć to nawet wychodzi na badaniach rentgenograficznych. Z drugiej strony ja też nie słyszę różnicy, a w ćwiczeniówce do swojego podręcznika Ostaszewska i Tambor już tej podwyższonej artykulacji nie stosują. I ta różnica jest konsekwentnie utrzymywana, sprawdziłem dwa wydania podręcznika i ćwiczeń. Pytałem się pani Tambor mailowo dlaczego tak jest i czy powinienem to stosować, odpowiedziała, że jednak powinienem, a w ćwiczeniach chciała... uprościć studentom życie. Generalnie chciałem być konsekwentny, bo polska fonetyka to jedno wielkie bagno, każdy specjalista ma inne zdanie (a niektórzy po dwa zdania na jeden temat), więc uznałem, że jeśli się nie będę trzymał jednego systemu, to się cały projekt dodawania wymowy rozjedzie w dyskusjach i kłótniach o każde zdanie. Olaf (dyskusja) 11:36, 30 gru 2014 (CET)