Hackare är helvetna intresserade av att förbättra AI

GettyImages 1314526623 1f12aee34ef84815b5a3e3beb7fbe4d2

Viktiga takeaways

Ett nytt kollektiv av utvecklare bygger AI-modeller med öppen källkod.
Gruppen använder massiva språkutbildningsmodeller som den kommer att släppa under öppna licenser.

AI med öppen källkod kan hjälpa till att göra den nya teknikens potentiellt förändrande kraft mindre benägen för fördomar och fel.

Det finns mycket forskning om artificiell intelligens av stora företag (AI), men en onlinegrupp vill demokratisera processen. EleutherAI är ett nyligen bildat kollektiv av frivilliga forskare, ingenjörer och utvecklare med fokus på öppen källkod AI-forskning. Organisationen använder kodbaserna GPT-Neo och GPT-NeoX för att träna massiva språkmodeller som den planerar att släppa under öppna licenser. «Data med öppen källkod gynnar forskare eftersom forskare har fler gratisresurser att använda för att träna modeller och slutföra forskning,» sa Edward Cui, vd för AI-företaget Graviti, till Lifewire i en e-postintervju. Hans företag är inte involverat i EueutherAI. «Vi vet att mängder av AI-projekt hölls uppe av en allmän brist på högkvalitativ data från verkliga användningsfall, så det är viktigt att etablera vägledning som säkerställer datakvalitet, med hjälp av det deltagande samhället.»

Det här är vägen

Början av EleutherAI var ödmjuk. Förra året namngav en oberoende AI-forskare Connor Leahy postade följande meddelande på en Discord-server: «Hey guys lets [SIC] ge OpenAI en chans för pengarna som på den goda tiden.» Och så bildades gruppen. Den har nu hundratals bidragsgivare som lägger upp sin kod på onlineprogramvaran GitHub. Open-sourcing AI-insatser är inte nya. Faktum är att Airbnbs Airflow-plattform för arbetsflödeshantering och Lyfts dataupptäckningsmotor är resultatet av att använda verktyg med öppen källkod för att göra det möjligt för datateam att arbeta bättre med data, påpekade Ali Rehman, projektledare för mjukvaruföretaget CloudiTwins i en e-postintervju med Lifewire «Precis som revolutionen med öppen källkod har lett till en omvandling av mjukvaruutveckling, så har den också drivit utvecklingen och demokratiseringen av datavetenskap och artificiell intelligens», sa Rehman. «Öppen källkod har blivit en avgörande möjliggörare för företagsdata vetenskapliga lösningar, där majoriteten av datavetare använder verktyg med öppen källkod.»

Öppna dörren

Att utveckla AI med öppen källkod kan bidra till att göra den potentiella spelförändrande kraften hos den nya tekniken mindre benägen för fördomar och fel, hävdar vissa observatörer. AI-forskning sker nu främst i det fria, med nästan alla företag, forskningslabb och universitet som presenterar sina resultat omedelbart i vetenskapliga publikationer, berättade Kush Varshney, en AI-forskare vid IBM, till Lifewire i en e-postintervju. «Denna öppna gemenskap är viktig, eftersom den ger ökade nivåer av kontroller och balanser för att säkerställa att AI undersöks, skapas, distribueras och tillämpas på ett ansvarsfullt sätt,» tillade Varshney. «Detta är särskilt kritiskt i situationer där dessa system kan påverka livet för våra mest sårbara medlemmar av samhället. Denna öppenhet gäller inte bara för generell maskininlärning och djupinlärningsalgoritmer utan också element av pålitlig AI.» Rehman sa att en av de kritiska skillnaderna mellan proprietär och öppen programvara är flexibilitet och anpassning. Proprietär AI-forskning kommer att ha problem med säkerhet, uppdateringar och optimeringar.

«Detta beror på att det community-baserade tillvägagångssättet med öppen källkod får värdefull input från tusentals branschexperter som identifierar potentiella säkerhetsbrister som sedan åtgärdas snabbare,» tillade Rehman. «Samhällets samförstånd innebär att kvalitet garanteras och nya möjligheter lättare identifieras.» En annan fråga är att proprietär AI-forskning inte kommer att vara interoperabel, vilket innebär att den inte kan fungera med olika dataformat och sannolikt kommer att ha leverantörslåsning, vilket hindrar företag från att testa och prova programvaran innan de bestämmer sig för en lösning, sa Rehman. Men inte alla aspekter av AI-forskning behöver vara öppen källkod, sa Chris Kent, VD för det medicinska AI-företaget Reveal Surgical, till Lifewire i en e-postintervju. «Det är viktigt att skydda de ekonomiska incitamenten som driver den kommersiella utvecklingen av nyckelapplikationer för AI», sa han. Men forskning om AI behöver en robust öppen källkodskomponent, sa Kent. Han tillade att öppen källkod arbetar för att bygga förtroende och använda datauppsättningar som inte är eller bör kontrolleras av enskilda institutioner eller företag. «Ett tillvägagångssätt med öppen källkod är det bästa sättet att identifiera och kompensera för underliggande fördomar som kan finnas i träningsuppsättningar och kommer att leda till mer holistiska, kreativa och pålitliga tillämpningar av AI,» sa Kent.