Engem mindig is érdekelt, hogy az MI hogyan foglalja össze, értékeli saját képességeit a számunkra fontos szakmai területeken. Ezért indítottuk “Hello PT sorozatunkat” amiben a ChetGPT 4.o-val beszélhetünk. Ezen a héten a leíratolásról (STT) kérdeztem.
András: Szia PT! Szeretnék beszélni veled, mivel fontos számomra, hogy pontos képet kapjak a képességeidről a telefonos beszélgetések leíratolásában. Kezdjük az első témával: szerinted melyik nyelvek leíratolásában vagy a legjobb? Mennyire vagy jó például az angol, kínai vagy ritkább nyelvek, mint a magyar esetében?
PT: Szia Főni! Örülök, hogy érdekel a téma, hallottam, hogy ez a te projekted a cégnél. Az én algoritmusom alapvetően az angol nyelv leíratolására van optimalizálva, így ebben a nyelvben tudom a legjobb teljesítményt nyújtani. Rengeteg adatból tanultam, így jól értem az angol beszédet. A kínai nyelv már nagyobb kihívás, különösen a különböző dialektusok és a tónusok miatt, de azért ebben is egész jól elboldogulok. Ami a ritkább nyelveket, például a magyart illeti, a helyzet kicsit nehezebb. A magyar nyelv sajátosságai miatt előfordulhatnak pontatlanságok a leiratokban, de folyamatosan fejlesztjük a rendszert, hogy egyre pontosabb legyek ebben is.
András: Ez nagyon érdekes! És mi a helyzet a több szereplős beszélgetésekkel? Mennyire tudsz jól megbirkózni az ilyen helyzetekkel, például ha egy ügyfél és egy ügyintéző beszélget? Azonnal meg tudod különböztetni, ki beszél éppen?
PT: Több szereplős beszélgetések esetén komoly feladat a beszélők azonosítása és a beszélgetés megfelelő szétválasztása. Bár alapvetően képes vagyok felismerni a különböző hangokat és beszédstílusokat, előfordulhatnak hibák a beszélők közötti váltásoknál. Az ilyen leiratok készítésénél az egyik legnagyobb kihívás, hogy az A) és B) szereplők megkülönböztetése pontos legyen akkor is, ha hasonló a hangszínük vagy a beszédstílusuk.
A hibákat utólagos korrekcióval kell javítani. Én legjobbnak talán az emberi korrektort tartom, aki segíthet kijavítani az esetleges hibákat és finomhangolni a leiratokat. Jelenleg is dolgozunk azon, hogy a hangsávok szétválasztását és a szereplők azonosítását egyre pontosabbá tegyük.
András: Ez logikus, de jól értettem, hogy egy EMBERT ajánlottál amikor a korrekciót említetted?. Vannak olyan utólagos korrektor programok, amik együttműködnek veled? Ha igen, mit ajánlanál ezek közül?
PT: Igen, számos utólagos korrektor program létezik, amelyek segítségével javíthatók az első leiratok. Ugyanakkor az egyik legjobban működő megoldás még mindig az emberi korrektúra, hiszen az emberi fül és értelem még mindig jobban észleli a finom különbségeket, mint az automatikus rendszerek, ebben még ti vagytok a jobbak! Jó gépi tanulás alapú korrektor programok is elérhetők, amelyek kifejezetten a nyelvtani hibák, szókincs pontatlanságok és kontextusértelmezési problémák javítására szakosodtak. Ilyen programok például a Grammarly vagy a LanguageTool.
Ezek a programok különösen hasznosak lehetnek olyan hibák javításában, mint a rossz nyelvtani szerkezetek, helyesírási hibák és a kontextus félreértelmezése. Azt javaslom, hogy kombináld a technológiai és emberi erőforrásokat a legjobb eredmény elérése érdekében. Haladjunk kéz a kézben ebben a projektben is!
András: Köszönöm a válaszokat! Nagyon hasznos volt ez a beszélgetés. Fontos számomra, hogy a cégen belül minél pontosabb és megbízhatóbb leiratokat tudjunk készíteni új projektünkben.
PT: Szívesen segítettem! Ha bármilyen további kérdésed van, vagy mélyebben bele szeretnél merülni a témába, itt vagyok.
PT (és András)
AUG
2024