Picture

Torben Z.

Indlæg: 705

PB  Hjemmeside

Tidsskrifter som pdf-fil og søgning....

Hej Lars.

I din tekst vedr. tidsskrifter i det netop oprettede bibliotek faldt jeg over dette:

Tidsskrifterne findes somme tider kun som f.eks. en PDF-fil, men med tiden vil de enkelte artikler bliver oversat til almindelig tekst, så man kan søge på indholdet på linie med alt andet indhold på Sporskiftet.

Hvorfor "oversætte" de enkelte artikler til almindelig tekst ?

Når jeg har åbnet en pdf-fil og derefter højreklikker i denne, så kan jeg ved at vælge <Søg efter> eller blot <CTRL +F> åbne en dialogboks øverst til højre på skærmen hvor jeg kan indtaste mit søgeord.
Jeg kan også højreklikke i pdf-filen og vælge <Vis knapper i navigationsrude>, som på sin vis er et bedre valg med flere muligheder.

 

 

__________________

 

Med modelbanehilsen
Torben Z.
http://www.danskmodel.dk
- info om danske producenter af modeltog og modelhuse, arkiv med gamle kataloger mv., Lego og Pilot modelbiler, litteraturliste, nyhedsomtaler mv.
- besøg "Arkivet" med mange informationer om danske produkter i form annoncer/brochurer/kataloger  - tag en tur "Down memory Lane".

Like 0 kan lide
Top

Picture

Lars Skjærlund

Rødovre

Webmaster

Indlæg: 3.423

PB  Blog  Hjemmeside

Da' Torben.

Torben Z. skrev:
Når jeg har åbnet en pdf-fil og derefter højreklikker i denne, så kan jeg ved at vælge <Søg efter> eller blot <CTRL +F> åbne en dialogboks øverst til højre på skærmen hvor jeg kan indtaste mit søgeord.
Jeg kan også højreklikke i pdf-filen og vælge <Vis knapper i navigationsrude>, som på sin vis er et bedre valg med flere muligheder.

Din teknik fungerer naturligvis ganske glimrende - men du har en række implicitte forudsætninger:

Først og fremmest skal man være i besiddelse af den pågældende PDF-fil - hvis man ikke har fundet den endnu og endnu mindre downloadet den, er det jo svært at åbne den. Smile

For det andet kan du kun søge i een PDF-fil: Hvis du ikke ved, hvilken fil der har det ønskede indhold, er det måske ikke så brugbart.

Endeligt skulle det jo gerne være sådan, at man kan finde indholdet på Sporskiftet - uanset, om det findes i et forumindlæg eller en PDF-fil. Sagt med andre ord skal man gerne kunne søge på tværs af indholdstyper, og det er der vist ikke mange PDF-læsere, der kan.

Hverken Drupal eller Google indekserer attachments som de PDF-filer, der i øjeblikket udgør Mosebanen på Sporskiftet; der findes dog en række Drupal moduler, der kan - dem er jeg i gang med at studere. Hvis du derfor søger på Sporskiftet eller Google efter f.eks. "godsvogne påskrifter", vil du ikke finde frem til den fine artikel om emnet, der findes i Mosebanen 39.

Bliver artiklen derimod omsat til regulær tekst, vil såvel Sporskiftet som Google kunne finde den uden problemer, og man kan hurtigt læse den - uden at skulle downloade en hel PDF-fil først. På den måde bliver artiklen langt mere tilgængelig - og dermed mere brugbar (efter min mening).

__________________

MVH
Lars

Like 1 kan lide
Top

Picture

Lars Skjærlund

Rødovre

Webmaster

Indlæg: 3.423

PB  Blog  Hjemmeside

Jeg glemte det næsten - men her er et udmærket eksempel på, hvad jeg mener:

Billede

Google finder artiklen om Kosørebanen - men kun, fordi jeg har taget ordet med i den indholdsfortegnelse, der er skrevet som normal tekst. Googles søgning er ikke fortsat ned i selve PDF-filen, så alle de ord, der kun findes i PDFen, kan ikke søges.

Iøvrigt er det lidt imponerende, så hurtigt Google kan reagere: Jeg lagde Mosebanen ind natten mellem fredag og lørdag, og allerede søndag formiddag kunne jeg lave ovenstående søgning. Hvis nogen er interesserede, skyldes det, at Sporskiftet benytter en sitemap fil - og nok også, at denne mere eller mindre direkte link til Google efterhånden har oparbejdet en høj grad af troværdighed.

__________________

MVH
Lars

Like 0 kan lide
Top

Picture

Torben Z.

Indlæg: 705

PB  Hjemmeside

Lars Skjærlund skrev:

Hverken Drupal eller Google indekserer attachments som de PDF-filer, der i øjeblikket udgør Mosebanen på Sporskiftet; der findes dog en række Drupal moduler, der kan - dem er jeg i gang med at studere. Hvis du derfor søger på Sporskiftet eller Google efter f.eks. "godsvogne påskrifter", vil du ikke finde frem til den fine artikel om emnet, der findes i Mosebanen 39.

Bliver artiklen derimod omsat til regulær tekst, vil såvel Sporskiftet som Google kunne finde den uden problemer, og man kan hurtigt læse den - uden at skulle downloade en hel PDF-fil først. På den måde bliver artiklen langt mere tilgængelig - og dermed mere brugbar (efter min mening).

OK Lars,
pointen er fattet mht. tekstkonverteringen.

Mht. intern søgning på Sporskiftet har du så overvejet en avanceret søgning i Biblioteks- / Forum- / Wiki-delen ?
Ikke alle brugere er lige skarpe til at definere søgeordene/-kriterierne, så i værste fald kommer der ret så mange resultater tilbage, at det ligefrem bliver uoverskueligt (eller ret så tidskrævende) at gennemlæse disse.

Nu har du jo lavet en glimrende indholdsfortegnelse ud for hvert nr. af Mosebanen, men hvad med en angivelse af år samt måned / kvartal for udgivelsen af en bog eller et tidsskrift ?

__________________

 

Med modelbanehilsen
Torben Z.
http://www.danskmodel.dk
- info om danske producenter af modeltog og modelhuse, arkiv med gamle kataloger mv., Lego og Pilot modelbiler, litteraturliste, nyhedsomtaler mv.
- besøg "Arkivet" med mange informationer om danske produkter i form annoncer/brochurer/kataloger  - tag en tur "Down memory Lane".

Like 0 kan lide
Top

Picture

Lars Skjærlund

Rødovre

Webmaster

Indlæg: 3.423

PB  Blog  Hjemmeside

Da' Torben.

Torben Z. skrev:
Mht. intern søgning på Sporskiftet har du så overvejet en avanceret søgning i Biblioteks- / Forum- / Wiki-delen ?

Er den der ikke allerede? Godt nok ikke i søgeboksen i venstre spalte - den har jeg forsøgt at holde simpel - men hvis du søger og finder ud af, at du får for mange resultater, skal du blot klikke på linket "Avanceret søgning" øverst på resultatsiden, så kan du med et enkelt klik med musen afgrænse din søgning til f.eks. wikien.

Citat:
Nu har du jo lavet en glimrende indholdsfortegnelse ud for hvert nr. af Mosebanen, men hvad med en angivelse af år samt måned / kvartal for udgivelsen af en bog eller et tidsskrift ?

Det var lidt en quick'n'dirty løsning - men indtil videre skulle jeg mene, at såvel måned som årstal fremgår af det billede af forsiden, der findes for hvert enkelt nummer af Mosebanen?

Når jeg begynder at gøre den maskinlæsbar, regner jeg også med at lave en mængde metadata - f.eks. har jeg også bedt Flemming hjælpe med at identificere skribenterne af de enkelte artikler. Så langt er vi bare ikke nået endnu.

Iøvrigt: Sporskiftets webcrawler brokker sig en del over, at det RSS feed, du annoncerer i headeren på Dansk i Model, ikke fungerer?

__________________

MVH
Lars

Like 0 kan lide
Top

Picture

Torben Z.

Indlæg: 705

PB  Hjemmeside

Hej Lars.

Lars Skjærlund skrev:

Da' Torben.

Torben Z. skrev:
Mht. intern søgning på Sporskiftet har du så overvejet en avanceret søgning i Biblioteks- / Forum- / Wiki-delen ?

Er den der ikke allerede? Godt nok ikke i søgeboksen i venstre spalte - den har jeg forsøgt at holde simpel - men hvis du søger og finder ud af, at du får for mange resultater, skal du blot klikke på linket "Avanceret søgning" øverst på resultatsiden, så kan du med et enkelt klik med musen afgrænse din søgning til f.eks. wikien.

OK, den mulighed er på plads Smile
Da jeg ikke bruger søgefacilitetten særlig ofte, har jeg desværre overset dette.

 

Lars Skjærlund skrev:

Torben Z. skrev:

Nu har du jo lavet en glimrende indholdsfortegnelse ud for hvert nr. af Mosebanen, men hvad med en angivelse af år samt måned / kvartal for udgivelsen af en bog eller et tidsskrift ?

Det var lidt en quick'n'dirty løsning - men indtil videre skulle jeg mene, at såvel måned som årstal fremgår af det billede af forsiden, der findes for hvert enkelt nummer af Mosebanen?

 Jo, og den virker fint.
MEN, det var nu den første side med oplistningen af alle numrene af Mosebanen, som jeg havde i tankerne.

 

Lars Skjærlund skrev:

Iøvrigt: Sporskiftets webcrawler brokker sig en del over, at det RSS feed, du annoncerer i headeren på Dansk i Model, ikke fungerer?

Bukker og takker.
Det skulle ikke genere nu - der var en kodelinie, som jeg havde glemt at slette Sad(
Indtil videre undlader jeg RSS-feed.

__________________

 

Med modelbanehilsen
Torben Z.
http://www.danskmodel.dk
- info om danske producenter af modeltog og modelhuse, arkiv med gamle kataloger mv., Lego og Pilot modelbiler, litteraturliste, nyhedsomtaler mv.
- besøg "Arkivet" med mange informationer om danske produkter i form annoncer/brochurer/kataloger  - tag en tur "Down memory Lane".

Like 0 kan lide
Top

Kommentarvisning

Vælg din foretrukne kommentarvisning og klik på "Gem indstillinger" for at aktivere dit valg.