Få de daglige nyheder fra Version2 og Ingeniøren. Læs mere om nyhedsbrevene her.

close
Ved at tilmelde dig accepterer du vores Brugerbetingelser, og du accepterer, at Teknologiens Mediehus og IDA-gruppen lejlighedsvis kan kontakte dig om arrangementer, analyser, nyheder, job og tilbud m.m. via telefon og e-mail. I nyhedsbreve, e-mails fra Teknologiens Mediehus kan der forefindes markedsføring fra samarbejdspartnere.
phloggen

Nok at læse

Jeg er ved at overgive mig til eBook fænomenet.

Det hjælper gevaldigt at jeg har kunnet stoppe alt det her:

Illustration: Privatfoto

Ned på den her:

Fra 1922 til 1983 udgav Bell Labs ialt ca. 95.000 sider i deres Bell Systems Technical Journal, den første side så således ud:

Det første trin var naturligvis at nogen scannede alle disse sider ind og lagde dem frit tilgængeligt på nettet hvor jeg kunne få fingrene i dem.

Det har Alcatel-Lucent sørget for og jeg er dem dybt taknemmelige.

(NB: Pas på med det link, man kan fortabe sig i timevis på ingen tid!)

Desværre passer formatet elendigt til Kobo'ens skærm.

For det første er den dejligt store margin man brugte for 100 år siden, af hensyn til fedtede fingre og sølvfisk, spild af det begrænsede skærmareal.

For det andet er siden, efter beskæring, stadig for høj til skærmen, hvad enten man vender den i høj- eller bred-format.

En af mine computere har stået og tygget sig igennem alle 46 GB pdf filer og har ombrudt dem så de passer til lavformat, nu ser første side således ud:

De små sorte mærker i kanten markerer hvor blankt papir er elimineret, således at læseren har en chance for at spotte det, hvis noget skulle være gået galt undervejs.

500 liniers python kode, kunne klare opgaven, der viste sig at være meget simpel:

Hver side læses ind og segmenteres i skiver adskilt af tydelige hvide mellemrum.

For hver af disse skiver fastslås derefter mindste og størte x-koordinat.

Disse trimmede bidder fyldes i en kø og hver gang der er materiale nok til en hel skærmfuld til Kobo'en, produceres en sådan.

Som regel er der mere end rigeligt til en skærmfuld og derfor prøves den bid der rager ud for neden er tekst der kan skæres over imellem to linier.

Her var jeg nødt til at tage hensyn til sider der ikke var scannet helt vinkelret, men selv det tog ikke mere end 20 linier, når man først har sine primitiver på plads.

Derefter var det bare at vente et par dage på at computeren havde tygget sig igennem de 46 GB.

Efter ombrydningen er der 172.000 sider, som er reduceret til de 16 gråtoner Kobo'en kan, fylder det hele nu kun 12 GB, hvilket er fyldt på at 16GB SD kort til 300kr fra den lokale elektronikpusher.

Selv hvis 90% af indholdet er totalt gabende kedsommeligt, kommer jeg aldrig til at kede mig i et fly eller en lufthavn igen...

Lad os lege "gæt et årstal", slå selv efter i index'et når I har gættet årstallet for flg teknologiske gennembrud:

  • FET-transistoren

  • Første "T1" digitale telefon-forbindelse

  • Første telefonsamtale, hele vejen rundt om jorden

  • Første solcelle

  • Første mikrobølgeforbindelse

  • Første mobiltelefon

  • Første Reed-relæ

  • Første koaxial-kabel

phk

PS: Jeg har kastet koden op på GitHub: bsdphk/BSTJ_reformat

Poul-Henning Kamp er selvstændig open source-softwareudvikler. Han skriver blandt andet om politik, hysteri, spin, monopoler, frihedskampe gør-det-selv-teknologi og humor.
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først

Er koden noget du vil dele? Jeg har også en del pdf'er med rigelig margen som jeg gerne vil have ned på en eLæser.

  • 0
  • 0

Mere af den slags, der bliver hårdt brug for den slags små værktøjer i 'fremtiden'.

Jeg har selv forlovet mig med en kindle Paperwhite, Livet bliver aldrig det samme igen ;o)

  • 0
  • 0

Tænker på at de "kun" har leveret 95.000 sider på 61 år.
Måske vi skulle bruge al vores it og teknik til at begrænse informationsmængden, så det kun var det væsentlige der blev bevaret. I modsat fald drukner det i mængden af uvæsentligt/gentagelser.
Desværre har jeg ikke løsningen, og rapporten om det vil sikkert fylde væsentligt mere.
Som et skrækeksempel kan man tage den danske grundlov kontra EU's grundlov.

  • 0
  • 0

I lyset af hvor lidt det fylder fysisk og i lyset af at man idag kan lave fornuftige søgemekanismer, så skal man være yderst forsigtig med at dømme noget ude fordi man i egen kontekst ikke finder det relevant.

  • 0
  • 0

I lyset af hvor lidt det fylder fysisk og i lyset af at man idag kan lave fornuftige søgemekanismer, så skal man være yderst forsigtig med at dømme noget ude fordi man i egen kontekst ikke finder det relevant.

Start hellere med at rydde ud i noget af alt det hø der er publiceret på IEEE, så, langt senere, kan Bell System Technical Journal stå for tur. Der er så meget guld og grundlæggende arbejde indenfor filterteknik, regulering og meget andet beskrevet der.

  • 0
  • 0

Det er et fikst lille program, du har fået lavet her.

En ting undrer mig dog: Nogle af de centrerede linjer er bevaret som centrerede linjer, mens andre er rykket til venstre. Hvad skyldes forskellen?

  • 0
  • 0

Det er et fikst lille program, du har fået lavet her.

En ting undrer mig dog: Nogle af de centrerede linjer er bevaret som centrerede linjer, mens andre er rykket til venstre. Hvad skyldes forskellen?

Det er et heuristisk valg: Hvis jeg har horizontal plads til at bevare den oprindelige placering, gør jeg det, hvis ikke, bliver det en venstre placering.

Ideen er at holde "captions" under illustrationer på plads, hvor muligt.

Snavs på siden kommer temmelig ofte på tværs desværre, specielt i de ældste årgange.

Jeg lavede nogle forsøg hvor jeg skruede noget op for metoderne og det kan gøres langt bedre, hvis man brænder mere CPU af på at segmentere, klassificere og detektere.

Men mit ambitionsniveau var bare at det skulle være læseligt, hvis der er noget jeg er i tvivl om, kan jeg checke original PDF'en hjemme på min laptop.

  • 0
  • 0
Bidrag med din viden – log ind og deltag i debatten