Illustrationsbilder. (Shutterstock/Pixabay)

Nya AI-racet: Kan mindre modeller prata mänskligare?

Av Olivia Wikström
Publicerad 31 maj 2023, 09:36

Skulle AI-chattbotar som Chat GPT och Bard låta mer människolika i sitt språk om de kunde färre ord? Det är från den frågan som projektet BabyLM Challenge utgår, skriver New York Times.

En ung grupp akademiker har bett forskarteam att skapa fungerande språkmodeller baserade på mindre information än en tiotusendedel av de största modellerna. Tanken är att de ska bli mindre – men också mer tillgängliga.

– Vi utmanar människor att tänka smått och fokusera mer på att bygga effektiva system som fler personer kan använda, säger Johns Hopkins-forskaren Aaron Mueller som är en av organisatörerna.

Utmanar idén om att stora språkmodeller hela tiden förbättras av mer data

NY Times · Ofta betalvägg

BabyLM Challenge

bakgrund · babylm.github.io

Är stora språkmodell fel för kodning? (22 maj)

www.infoworld.com

bakgrund

Language model

Wikipedia (en)

A language model is a probability distribution over sequences of words. Given any sequence of words of length m, a language model assigns a probability P ( w 1 , … , w m ) {\displaystyle P(w_{1},\ldots ,w_{m})} to the whole sequence. Language models generate probabilities by training on text corpora in one or many languages. Given that languages can be used to express an infinite variety of valid sentences (the property of digital infinity), language modeling faces the problem of assigning non-zero probabilities to linguistically valid sequences that may never be encountered in the training data. Several modelling approaches have been designed to surmount this problem, such as applying the Markov assumption or using neural architectures such as recurrent neural networks or transformers. Language models are useful for a variety of problems in computational linguistics; from initial applications in speech recognition to ensure nonsensical (i.e. low-probability) word sequences are not predicted, to wider use in machine translation (e.g. scoring candidate translations), natural language generation (generating more human-like text), part-of-speech tagging, parsing, optical character recognition, handwriting recognition, grammar induction, information retrieval, and other applications. Language models are used in information retrieval in the query likelihood model. There, a separate language model is associated with each document in a collection. Documents are ranked based on the probability of the query Q {\displaystyle Q} in the document's language model M d {\displaystyle M_{d}} : P ( Q ∣ M d ) {\displaystyle P(Q\mid M_{d})} . Commonly, the unigram language model is used for this purpose. Since 2018, large language models (LLMs) consisting of deep neural networks with billions of trainable parameters, trained on massive datasets of unlabelled text, have demonstrated impressive results on a wide variety of natural language processing tasks. This development has led to a shift in research focus toward the use of general-purpose LLMs.

Omni är politiskt obundna och oberoende. Vi strävar efter att ge fler perspektiv på nyheterna. Har du frågor eller synpunkter kring vår rapportering? Kontakta redaktionen

Klarnas AI-giv mjuknar: ”Viktigt att det finns en människa”

Klarnas jakt på att kapa kostnader som påskyndats med hjälp av AI ”har gått för långt”. Det säger vd Sebastian Siemiatkowski enligt Bloomberg. Vd:n planerar nu en sällsynt räd för att locka fler att arbeta för företaget.

8 maj, 12:21

Open AI vill snabba på godkännande av nya läkemedel

Open AI har träffat den amerikanska läkemedelsmyndigheten FDA för att diskutera hur AI kan användas för att effektivisera granskningen av nya läkemedel, rapporterar Wired.

8 maj, 11:40

De tjänar pengar på att lura äldre med AI-skräp

AI-genererade recept, fejkade bloggare och bluffbilder på växter – så har den självutnämnde SEO-experten Jesse Cunningham byggt sin lukrativa ”skräpfabrik” på Facebook och Pinterest, rapporterar Futurism.

8 maj, 10:46

Källor: Trump ska skrota Bidens chiprestriktioner

Trumpadministrationen planerar att slopa Bidens AI-relaterade exportrestriktioner för chip, säger källor till Bloomberg. Åtgärden är del av ett större arbete med att omforma USA:s halvledarpolitik, som fått kritik från teknikjättar som Nvidia och utländska regeringar.

7 maj, 22:06

Joe Biden talar vid det första spadtaget för en ny Intel-fabrik i New Albany, Ohio.

Utvecklingen av AI Forskning & vetenskap Artificiell intelligens Data, it & högteknologi Chat GPT