Multimodal RAG · Gemini Embedding

Gjør PDF-manualene til en ekspert som svarerpå sekunder.

Vi bygde en AI-agent som leser PDF-manualer slik du gjør — tekst og bilder sammen. Spør hva som helst, og få tilbake det nøyaktige diagrammet og bruksanvisningen du trenger. På sekunder.

Demonstrert med tekniske veiledninger fra Takprodusentenes Forskningsgruppe (TPF)

Video: Gemini Multimodal Embeddings — Google

> FØR OG ETTER

Fra 200 sider med blaing (og scrolling)til svar på sekunder.

Tekniske manualer er fulle av verdifull kunnskap — men ingen finner frem. Vi endret det.

Før

Manuelt søk i PDF-er

Bla gjennom hundrevis av sider for å finne riktig diagram eller bruksanvisning.

Kapittel 3: Dampsperre og vindsperres. 14-27
Kapittel 5: Gjennomføringer i taks. 28-41
Kapittel 7: Beslag og innfestings. 42-55
Kapittel 9: Slukdetaljers. 56-69
Kapittel 11: Branntekniske kravs. 70-83
Kapittel 14: Vedlikeholdsrutiners. 84-97
15-30 minper søk
200+ siderå bla gjennom
Etter

AI-drevet søk med diagrammer

Still et spørsmål i naturlig språk — få tilbake presist svar med riktig diagram.

Hvordan monterer man innstikksluk?

Figur 10: Innstikksluk med sveisbar flens

Takbelegg legges inn på innstikkslukets kappe og sveises til denne. Fall 1:40 mot sluk...

TPF Nr.9 — side 20
3 sekunderresponstid
Diagram inkludert

> Slik fungerer det

Fra PDF til presist svar — automatisk.

Hele flyten fra opplasting av manualer til ferdig svar med diagram — visualisert steg for steg.

PDF-manualer

TPF Nr.6

Branntekniske løsninger

53s

TPF Nr.9

Flate, kompakte tak

30s

TPF Nr.10

Grønne tak

25s

Gemini Embedding 2

tekst · bilder · 3072 dim

Semantisk søk

cosine similarity

Gemini Vision

diagram-cropping

rag-agentSVAR

SPØRSMÅL

"Hvordan monterer man innstikksluk?"

Figur 10 — Innstikksluk med sveisbar flens

Kilde: TPF Nr.9, side 20

> DEMO

Et visuelt og presist svar.

Et reelt eksempel testet med TPF sine tekniske veiledninger for taktekking. Spørsmålet, søket, og svaret — alt automatisk.

1

1. Takentreprenør stiller spørsmål

Hvordan utfører man innstikksluk med sveisbar flens på kompakt tak?

2

2. Agenten finner relevant data

Cosine similarity: 0.84 — TPF Nr.9, side 20, Figur 10

3

3. Gemini Vision cropper diagrammet

Identifiserer og klipper ut kun Figur 10 fra PDF-siden

Strukturert svar

Oppsummering: Innstikksluk med sveisbar flens monteres ved å legge takbelegget inn på slukets kappe og sveise det fast.

Utførelse:

  1. Legg fall 1:40 mot sluk i begge retninger
  2. Monter innstikksluk med tetting til avløpsrør med gummiring
  3. Monter mansjett rundt gjennomføringen
  4. Legg takbelegg inn på innstikkslukets kappe og sveis
  5. Monter slukrist på toppen
Kilde: TPF Nr.9 — Flate, kompakte tak, side 20
Manual AIRAG Agent
Hvordan monterer man innstikksluk med sveisbar flens?
Figur 10: Innstikksluk med sveisbar flensScore: 0.84
Figur 10: Innstikksluk med sveisbar flens. Det croppede diagrammet viser tverrsnitt av innstikksluk med flens, kappe, slukrist, mansjett og avløpsrør med fall 1:40.
TPF Nr.9Flate, kompakte tak — Utforming og materialvalgSide 20

> HVA GJØR DETTE MULIG

Ikke bare tekst —hele dokumentet.

Tradisjonell dokumentsøk forstår bare tekst. Vår løsning forstår sammenhengen mellom tekst, bilder og diagrammer — og returnerer nøyaktig det du trenger.

Multimodal Embedding

AI-en leser tekst og bilder sammen — akkurat som du gjør. Den forstår at et diagram hører til teksten over, og lagrer denne sammenhengen i en vektordatabase med 3072 dimensjoner.

Gemini Embedding 23072 dimtekst + bilde

Diagram-gjenkjenning

Gemini Vision skanner hver PDF-side og identifiserer tverrsnitt-tegninger, detaljtegninger, tabeller og koblingsskjemaer. Den vet forskjellen på en figur og en tekst-blokk.

Gemini Flash Visionbounding boxesauto-detect

Smart Cropping

I stedet for å returnere hele PDF-siden, klipper agenten ut nøyaktig det diagrammet som er relevant for spørsmålet. Resultatet er et skarpt, rent utklipp med figurhenvisning.

PyMuPDF2x oppløsningpresist utklipp

Strukturerte svar

Svaret er ikke bare et bilde — det inkluderer en oppsummering, steg-for-steg utførelse, viktige krav med mål og standarder, og kildehenvisning til eksakt manual og side.

oppsummeringsteg-for-stegkilde-referanse

> BRANSJER

Overalt der folk leteri PDF-er.

Har dere manualer og håndbøker som bare lever i PDF-er? Da sitter dere på en gullgruve av kunnskap som kan "oppgraderes".

Bygg og anlegg

Maskinhåndbøker, HMS-prosedyrer, tekniske tegninger

Tenk deg at en kranfører trenger monteringsanvisningen for en spesifikk kran-konfigurasjon. I dag blar de gjennom en 400-siders PDF. Med vår løsning skriver de spørsmålet og får tilbake riktig diagram med monteringsprosedyre — på sekunder.

Shipping og maritim

Vedlikeholdsmanualer, utstyrsspesifikasjoner, sjekklister

En maskinist om bord skal bytte en ventil på hjelpemotoren. I stedet for å lete i mapper med vedlikeholdsmanualer, søker de opp ventiltypen og får tilbake eksplodert-tegning med steg-for-steg-instruksjoner.

Industri og produksjon

Driftsinstrukser, tekniske spesifikasjoner, prosedyrer

Operatører på en produksjonslinje trenger å finne riktig innstilling for en maskin. I stedet for å ringe leverandøren eller bla i ringpermer, får de svaret umiddelbart — med koblingsskjema og parameterinnstillinger.

Helse og medisin

Prosedyrehåndbøker, retningslinjer, protokoller

En sykepleier trenger prosedyren for en spesifikk medisinsk inngrep. I stedet for å lete i flere håndbøker, søker de opp prosedyren og får tilbake steg-for-steg-anvisning med relevante illustrasjoner.

> RESULTATER

Tallene fra vårproof of concept.

Testet med 3 TPF-manualer (108 sider, 451 data-segmenter). Gemini Embedding håndterer norsk fagterminologi som dampsperre, gjennomføring, sluk og beslag uten problemer.

0+

Manualer prosessert i proof of concept

3 sek

Gjennomsnittlig responstid fra spørsmål til svar

0.84

Høyeste cosine similarity score ved søk

Dager

Ikke måneder — fra PDF-er til produksjonsklar løsning

Embedding

gemini-embedding-001

3072 dimensjoner, stabil med norsk fagterminologi

Generering

gemini-2.0-flash

Rask, god på norsk, strukturerte svar

Vision / Cropping

gemini-2.0-flash + PyMuPDF

2x oppløsning for skarpe diagram-utklipp

> PROSESSEN

Fra PDF til produksjonpå under 2 uker.

Vi setter opp hele løsningen — fra opplasting av manualer til ferdig søke-app med diagram-utklipp. Dere trenger bare å levere PDF-ene.

Steg 1Dag 1-2

Last opp manualene

Vi mottar PDF-biblioteket deres og kartlegger innholdstyper — tekst, diagrammer, tabeller, bilder. Ingen omformatering nødvendig.

Steg 2Dag 3-5

Prosessering og embedding

Gemini Embedding 2 chunker og embedder alt — tekst og bilder sammen. Hvert dokument deles opp i semantiske blokker med 800 tegns overlapp.

Steg 3Dag 6-8

Testing og validering

Vi tester søkeresultater mot reelle brukerspørsmål fra deres hverdag. Similarity scores valideres, og diagram-cropping finjusteres.

Steg 4Dag 9-10

App-integrasjon

Søkegrensesnittet tilpasses deres arbeidsflyt — web-app, intern portal, eller API-integrasjon mot eksisterende systemer.

Steg 5Dag 11+

Lansering og opplæring

Produksjonsklar løsning med opplæring av nøkkelpersoner. Løpende support og mulighet for utvidelse med flere dokumenter.

> Kalkulator

Beregn hvor mye tid dere kaster bort på å lete i PDF-er.

Fyll ut kalkulatoren og få en skreddersydd potensialrapport tilsendt på e-post — med konkrete besparelsesestimater og anbefalinger for deres situasjon.

Vi sender en skreddersydd rapport til din e-post. Ingen spam, ingen forpliktelser.