Kunstig intelligens (KI)

 (1950-tallet): teorien om og utviklingen av datasystemer som er i stand til å utføre oppgaver som normalt krever menneskelig intelligens, for eksempel visuell persepsjon, talegjenkjenning, beslutningstaking og oversetting av språk

KI-definisjon

Maskinlæring 

(1990-tallet): en undergruppe av kunstig intelligens og informatikk der algoritmemodeller trenes til å lære av eksisterende data for å ta avgjørelser eller komme med prediksjoner

maskinlæring

Dyplæring

(2010-tallet): en maskinlæringsteknikk som bruker lag av nevrale nettverk til å behandle data og ta avgjørelser

dyplæring

Generativ KI 

en type KI-teknologi som bruker algoritmemodeller til å lage nytt skriftlig, visuelt og auditivt innhold når den får servert forespørsler eller eksisterende data

generativ

Generative AI in a Nutshell - how to survive and thrive in the age of AI

Covers questions like What is generative AI, how does it work, how do I use it, what are some of the risks & limitations. Also covers things like autonomous agents, the role of us humans, prompt engineering tips, AI-powered product development, origin of ChatGPT, different types of models, and some tips about mindset around this whole thing.

Hvordan definere en ledetekst (prompt) i KI (AI)

I sammenheng med AI refererer en "ledetekst" vanligvis til en inngang eller instruksjon gitt til en modell, og fremkaller en bestemt utgang eller respons. Her er en mer detaljert oversikt:

Innledende instruksjon: På sitt mest grunnleggende nivå er en ledetekst en innledende instruksjon eller spørring som gis til AI. Når du for eksempel skriver inn et spørsmål eller en uttalelse i en chatbot, er det din ledetekst til systemet.

Opplæringsfasen: I opplæringsfasen av maskinlæringsmodeller kan en ledetekst være inngangsdatapunktet som modellen prøver å forutsi eller generere en utgang for. For eksempel, i veiledet læring, er inngangsdataene (eller "ledeteksten") sammenkoblet med ønsket utdata (eller "etikett").

Finjustering eller overføringslæring: I modeller som GPT-3 eller GPT-4 av OpenAI, etter den første opplæringen på en enorm mengde data, kan de finjusteres på spesifikke oppgaver ved hjelp av ledetekster. For eksempel kan modellen gis en rekke spørsmål (ledetekster) og svar for å tilpasse den til en bestemt spørsmål og svar-oppgave.

Interaktive systemer: I samtalebasert AI eller andre interaktive systemer er brukerens inndata på hvert trinn en melding som styrer AIs påfølgende svar.

Veiledet utgang: Ledetekster kan også brukes til å veilede utdataene fra generative modeller. For eksempel, når du genererer bilder eller musikk, kan en beskrivende ledetekst veilede AI til å produsere en bestemt type bilde eller melodi.

Tilbakemeldingsmekanisme: I noen AI-systemer kan svaret på en ledetekst brukes som tilbakemelding for å justere systemets oppførsel. Hvis systemets svar ikke er som ønsket, kan ledeteksten endres eller avklares for å få et bedre resultat.

I hovedsak fungerer en ledetekst som en måte å kommunisere med eller veilede AI-modellen for å oppnå ønsket utdata eller oppførsel.

prompt

Hva er et token i sammenheng med kunstig intelligens?

I sammenheng med kunstig intelligens (AI) og naturlig språkbehandling (NLP), refererer et token vanligvis til en enkelt tekstenhet som systemet leser. Her er en oversikt over hva et token er og dets relevans:

1) Grunnleggende definisjon: Et token er et stykke av en helhet, så et token kan være et ord, men det kan også være et skilletegn, eller til og med et tall. For eksempel vil setningen "Jeg elsker KI!" bli delt inn i fire tokens: "I", "love", "KI" og "!".

2) Tokenisering: Dette er prosessen med å konvertere en tekst til tokens. Det er et av de første trinnene i mange NLP-oppgaver. Ulike språk og oppgaver kan kreve forskjellige tokeniseringsteknikker. Det er for eksempel vanlig å tokenisere engelsk tekst med mellomrom og skilletegn, men denne tilnærmingen vil ikke fungere like effektivt for språk som kinesisk, som ikke bruker mellomrom mellom ord.

3) Relevans i dyp læring: I modeller som transformatorer, som inkluderer de populære BERT- og GPT-arkitekturene, mates tokens inn i modellen som inngang. Hvert token blir representert som en vektor (ofte ved hjelp av innebygging som Word2Vec eller GloVe), og modellen behandler disse vektorene for å utføre oppgaver som tekstklassifisering, generering, oversettelse og mer.

4) Tokengrenser: Noen dype læringsmodeller har en maksimal tokengrense for behandling. For eksempel har den opprinnelige BERT-modellen en maksimal tokengrense på 512. Dette betyr at hvis et dokument har mer enn 512 tokens, må det avkortes, deles eller på annen måte behandles for å passe innenfor denne grensen.

5) Tokens i API-kall: Når du bruker skybaserte AI-tjenester, kan begrepet «token» også referere til tekstenhetene du blir belastet for. For eksempel, hvis en API har en grense på 10 000 tokens per samtale, og du sender inn en tekst med 1 000 tokens, blir du belastet for disse 1 000 tokens.

6) Autentiseringstoken: Utenfor NLP-konteksten, i programvareutvikling og API-bruk, kan et "token" også referere til et autentiseringstoken. Dette er et stykke data som brukes til å autentisere en bruker eller et system og gi dem tilgang til en tjeneste.

Oppsummert refererer begrepet "token" i AI vanligvis til individuelle tekstenheter, men den nøyaktige betydningen kan variere avhengig av konteksten.

NLP: Natural Language Processing
NLP står for Natural Language Processing og er en gren av kunstig intelligens (AI) som fokuserer på å lære datamaskiner å forstå menneskelig språk. NLP-teknologi gjør det mulig for datamaskiner å analysere, tolke og generere menneskelig språk. Dette kan omfatte alt fra å oversette tekst til å gjenkjenne talekommandoer og føre samtaler med mennesker

API: Application Program Interface
API står for Application Programming Interface og er en kode som brukes for å utveksle data mellom to forskjellige systemer eller applikasjoner. I kunstig intelligens (AI) kan API-er brukes til å koble sammen forskjellige tjenester og systemer, slik at de kan kommunisere med hverandre og utveksle data. Dette kan omfatte alt fra å hente data fra en database til å sende forespørsler til en maskinlæringsmodell

tokens