Kommentarer til <i>Film og TV: Rippe og OCR'e dvd-undertekster</i>Kommentarer til Film og TV: Rippe og OCR'e dvd-undertekster Tilbage til Hovedsiden

Gå tilbage til Film og TV


KOMMENTARER (22)

n/a12Næste side
1:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen Rippe og OCR'e dvd-undertekster   13. mar 2012 00:51
I stedet for de grimme bitmap-undertekster, som dvd'er har, kunne jeg godt tænke mig at OCR'e dem og smide dem på som AppleTV-kompatible undertekster, der så bliver renderet i en fin font.

Googlede lidt på det, og det er åbenbart ikke noget, man gør ret meget. Kan kun finde frem til subrip fra 2006 og til Windows[1]. Findes der noget til Mac, eller findes der overhovedet noget ud over subrip?

[1] Det er ikke en deal-breaker, men jeg ville nu gerne slippe for at fyre op for en virtuel maskine for at løse opgaven.
Svar: #2
 
2:   odin Geek Culture-skribent. Klik for at læse mere om Anders Petersen @1   13. mar 2012 07:38
Tag det fra en der roder meget med den slags: Forget it.
Man skulle tro OCR-software i vore dage nærmest var en fejlfri størrelse der ville være i stand til at processere noget så tydeligt som DVD-subs, men det man kan hente eller købe sig til som almindelig forbruger er vitterligt til at lukke op og skide i. Det tager mig typisk en time at OCR'e DVD-subs på en spillefilm. Et par minutter til OCR-processen og resten af tiden med at rette fejl. Jeg bruger normalt SubEdits indbyggede engine. Ikke fordi den er den bedste - den er nogenlunde jævnbyrdig med alle andre - men fordi dens editeringsfaciliteter er bedre end de fleste. Og det er dem man kommer til at spendere det meste af tiden med. Jeg tvivler meget stærkt på at situationen er anderledes på Mac.
Svar: #3 Opdateret: 13. mar 2012  
 
3:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen @2   13. mar 2012 10:42
Tak for input. Er det den her DVDSubEdit, du bruger?
Svar: #4
 
4:   odin Geek Culture-skribent. Klik for at læse mere om Anders Petersen @3   13. mar 2012 11:12
Nej, det er ikke den. Sorry - den jeg bruger hedder egentlig SubtitleEdit. Det er bare den eksekvérbare fil der hedder SubEdit. Det er denneher.
Jeg har brugt 4-5 forskellige gennem årene, men SubtitleEdit er altid den jeg er vendt tilbage til. Også fordi den tilbyder live preview og er god til at justere timingen af subs ud fra to referencepunkter i videomaterialet. OCR bruger jeg af gode grunde kun når jeg ikke er i stand til at finde præfabrikerede .SRT subs på nettet som jeg selv kan tilpasse.

Hvis du vil prøve dig frem, er VideoHelp som altid dit one-stop for en udtømmende liste af værktøjer. Mængden af Mac-værktøjer i listen er dog ikke opløftende.
Svar: #5 #7 Opdateret: 13. mar 2012  
 
5:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen @4   13. mar 2012 16:28
OCR bruger jeg af gode grunde kun når jeg ikke er i stand til at finde præfabrikerede .SRT subs på nettet som jeg selv kan tilpasse.

Kan du anbefale gode sites til undertekster? Indtil videre har jeg haft de bedste resultater med subscene, men selv dér er der godtnok langt mellem snapsene. Engelske tekster er som regel okay, men danske tekster ser ud til at være skrevet af folk, der i deres fritid sælger ødelagte iPhones.
Svar: #6 Opdateret: 13. mar 2012  
 
6:   jacob_tf @5   13. mar 2012 17:37
Her plejer jeg selv at lede, men du har helt ret i, at danske undertekster oftest er elendigt oversat af folk eller en engelsk .srt fil der har været gennem Google translate. Står der et R ved bør de dog være retail, altså taget fra den udgave man kan købe i butikkerne.
Svar: #9
 
7:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen @4   13. mar 2012 20:52
den jeg bruger hedder egentlig SubtitleEdit.

Har prøvet det nu, og den fungerer virkelig godt. Tesseract OCR (som de selv siger er "one of the most accurate open source OCR engines available") kombineret med dansk ordbog og en indbygget logik, der sørger for at "jegvil" bliver til "jeg vil", så ud til at danne en ret perfekt .srt-fil udfra den dvd, jeg rippede. Nu har jeg ikke set filmen og dermed nærlæst teksterne, men det, jeg skimmede under processen, så rigtig godt ud.

Problemet er, at man er nødt til at rippe dvd'en for at SubtitleEdit kan pille underteksterne ud. Det er en kæmpe tidsrøver.

Forsøgte mig med AnyDVD som ser ud til at være gudeværktøjet til den slags ting, og det ser ud til at fungere nogenlunde med at SubtitleEdit kan få direkte fat i VOB'erne uden jeg skal rippe skidtet først. Jeg er udfordret i øjeblikket med at ting konstant hænger, men jeg er begyndt at hælde til at min test-dvd er noget ulden i kanten.

Hvis jeg køber en licens til AnyDVD, kan jeg så installere den på flere pc'er, eller bliver den bundet til én pc?
Svar: #8
 
8:   odin Geek Culture-skribent. Klik for at læse mere om Anders Petersen @7   13. mar 2012 23:48
Så snart du fyrer op for din film med den friskbagte .SRT-sub vil du opdage, at dine l'er er blevet til 1-taller eller brackets, at o'er er blevet til et eller andet mærkeligt specialtegn, der er mellemrum efter første ciffer i alle tal som begynder med 1 og en masse andre ting. For nogle er det sikkert ligegyldigt, men det hiver mig desværre ud af filmen, når jeg får en ny fejl serveret en gang i minuttet.

Til gengæld er SubtitleEdit rigtig fed til at fjerne visse OCR-fejl (dog langt fra alle) og tekst for hørehæmmede. Der er simpelthen to funktioner i drop-down menuen der hedder henholdsvis "remove common errors" og "remove subs for hearing impaired". Ét klik og så er dén ged barberet.

Hvad angår subs online, bruger jeg også selv SubScene mest. Her i hytten har vi vænnet os til engelske subs, men på danske/svenske/norske film er det naturligvis ikke en mulighed, da det bare bliver ... mærkeligt. Jeg har enkelte alternativer til SubScene, men de har mindre indhold, dårligere kvalitetssikring og sværere at navigere rundt i. Ligesom du er selv er kommet frem til, er det også min erfaring, at danske subs er sjældne og ofte venstrehåndsarbejde.

AnyDVD er jeg flittig bruger af, men jeg har faktisk ikke undersøgt om jeg kan installere min ene licens på flere maskiner. Jeg kan checke det i weekenden hvis det er.
Svar: #13 Opdateret: 13. mar 2012  
 
9:   Dslacker @6   14. mar 2012 00:11
Hovhov - Jeg har da bidraget med en 10-15 subs i tidens løb og har sågu aldrig brugt google translate. Typisk er det når jeg har ventet over et år på en dansk srt på en film som fortjente nogle ordentlige tekster... (eks The good girl og Never Let Me Go) - Mit foretrukne redskab har alle dage været en gammel svend der hedder subtitletool, der har kunnet det nødvendige uden dikkedarer. Det er dog primært et redigeringsværktøj og ikke en egentlig ripper.
Svar: #10 Opdateret: 14. mar 2012  
 
10:   odin Geek Culture-skribent. Klik for at læse mere om Anders Petersen @9   14. mar 2012 07:11
Bruger du samme værktøj til timing, eller genbruger du bare tidskoderne fra en eksisterende sub?
Svar: #11
 
11:   Dslacker skal udfyldes   14. mar 2012 08:45
@10 Oftest det sidste, men den er også god til at rette timing, hvis den sub jeg bruger som udgangspunkt ikke passer til versionen af filmen...
Svar: #12 Opdateret: 14. mar 2012  
 
12:   odin Geek Culture-skribent. Klik for at læse mere om Anders Petersen @11   14. mar 2012 09:57
Det med at strække en sub så den passer, det kan de fleste værktøjer. Det jeg var lidt mere nysgerrig på er hvad du gør når du starter fra bunden. Jeg kender nemlig ikke noget godt værktøj til at time subs med. Det skal jo gerne være noget med et live video preview vindue og finmasket scrubbing-kontrol med lyd.
Svar: #17
 
13:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen @8   14. mar 2012 10:49
Så snart du fyrer op for din film med den friskbagte .SRT-sub vil du opdage, at dine l'er er blevet til 1-taller eller brackets, at o'er er blevet til et eller andet mærkeligt specialtegn, der er mellemrum efter første ciffer i alle tal som begynder med 1 og en masse andre ting.

Så den i går (kanon film: Frankenstein meets The Wolf Man!), og der var kun to fejl: Et "jeg" var blevet til "199" (jeg mistænker dvd-underteksterne for faktisk også at have den fejl), og to ord var i et tilfælde blevet skrevet sammen til ét. Resten var fejlfrit.

Til gengæld er SubtitleEdit rigtig fed til at fjerne visse OCR-fejl (dog langt fra alle) og tekst for hørehæmmede. Der er simpelthen to funktioner i drop-down menuen der hedder henholdsvis "remove common errors" og "remove subs for hearing impaired". Ét klik og så er dén ged barberet.

Blander du ikke applikationerne sammen nu? Du knapper findes, så vidt jeg ved, kun i SubRip. Og den laver netop enormt mange fejl med at bytte 1-taller og l'er ud. SubtitleEdit gør ikke.

AnyDVD er jeg flittig bruger af, men jeg har faktisk ikke undersøgt om jeg kan installere min ene licens på flere maskiner. Jeg kan checke det i weekenden hvis det er.

Det må du godt - den er ret pebret, og det vil i givet fald være HD-udgaven, jeg går efter (til €79. Yikes.)
Svar: #14 #15 Opdateret: 14. mar 2012  
 
14:   Hambone Geek Culture-skribent. Klik for at læse mere om Henrik Schmidt @13   14. mar 2012 11:52
Jeg kan checke det i weekenden hvis det er.

Det behøver du ikke. Man kan sagtens installere den på flere pc'er med den samme licens.

Ikke at jeg personligt har gjort det, naturligvis...
Svar: #16
 
15:   odin Geek Culture-skribent. Klik for at læse mere om Anders Petersen @13   14. mar 2012 12:10
"Så den i går (kanon film: Frankenstein meets The Wolf Man!), og der var kun to fejl"

Awesome! Dejligt at vide at det kun er min track record der har været elendig. Så er der håb endnu.

"Blander du ikke applikationerne sammen nu? Du knapper findes, så vidt jeg ved, kun i SubRip."

Nope, de findes i SubtitleEdit. Jeg bruger ikke SubRip, så jeg blander ikke applikationerne sammen. Prøv at starte SubtitleEdit og tryk på Tools-dropdownmenuen. Her ser du "Fix common errors" og "Remove text for hearing impaired". De har sågar shortcuts.
  Opdateret: 14. mar 2012  
 
16:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen @14   14. mar 2012 15:41
Det behøver du ikke. Man kan sagtens installere den på flere pc'er med den samme licens.

Dejligt.

Ikke at jeg personligt har gjort det, naturligvis...

Det behøver der jo ikke være noget forkert i, med mindre de specifikt i licensen nævner at den givne licens kun er til afvikling på én maskine. Mange licenser i dag er "family packs", fordi folk som regel har en del pc'er i husstanden efterhånden. Og til €79 ville jeg fandme mene, at man har lov til at køre den på revl og krat inden for hjemmets fire vægge.

Jeg har heller ikke brug for at have den på flere pc'er på samme tid, men jeg får nok brug for at flytte licensen til en anden pc, og så ville det være surt, hvis den var låst til en specifik installation.
 
 
17:   Dslacker @12   14. mar 2012 16:55
Jeg har en, der hedder SubtitleWorkshop, men indrømmet så er det ikke noget jeg gør så meget i. Hvis man skal gøre det helt fra bunden med timing og det hele, så bliver det arbejde... Den slags koster lidt for meget tid :-)
 
 
18:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen Status   15. mar 2012 09:35
Tror jeg går tilbage til Odins originale forslag: Forget it.

Prøvede med Star Trek: First Contact i går, og normalt ville processen involvere et par klik i Handbrake og så ellers bare vente til skidtet er færdigt.

Vil jeg have pæne undertekster, er jeg nødt til først at rippe filmen til disk (40 minutter), derefter rippe undertekster ud af vob'erne (20 minutter) og derefter se SubtitleEdit gå ned med en .Net-fejl. Kastede SubRip efter den i stedet, men dens OCR er latterlig dårlig, så selvom jeg fik genereret redigerbare undertekster, skulle jeg bruge så meget tid på at løbe dem igennem og rette fejl, at den aften så var gået.

Så: Fuck it, jeg kører med bitmap-undertekster.
Svar: #19
 
19:   goth Geek Culture-skribent. Klik for at læse mere om Stig H. Jacobsen @18   18. mar 2012 20:52
Jeg er skuffet, Lars. Hvad blev der af "Fuck det, jeg koder det selv"?
Svar: #20
 
20:   ljorg Geek Culture-skribent. Klik for at læse mere om Lars Jørgensen @19   19. mar 2012 15:36
Efter man har rundet 40 og er blevet gift, har "fritid" fået en helt anden betydning. Travlhed på jobbet (af den gode slags, skal det siges) betyder også, at min fritid mest er dedikeret til at slappe af og nyde livet.
 
 





n/a12Næste side

SKRIV EN KOMMENTAR 

Du skal være logget ind for at kunne sende kommentarer. Gå til login-siden og klar detaljerne dér eller login med Facebook.


Blue soldier #1: "We need you to help us kill all the red soldiers."
Medic: "Even if my orders didn't prohibit me from doing that, I still wouldn't. I'm a conscientous objector."
Blue soldier #1: A what?"
Medic: "A pacifist".
Blue soldier #2: "You're the thing that babies suck on."
Blue Soldier #1: "That's a pedofile, dumbass."
-- Red vs Blue