Le Sara Vispoel, Brad Bolender, Teàrlach Foster, Jesse Hamer, Sierra Magnotta, agus Safat Siddiqui

Ro-ràdh

Anns na mìosan a dh’ fhalbh, tha sinn air ùidh fhaicinn ann am modalan cànain mòra (LLMn) leithid GPT-4 agus mar a tha Finetune a’ cleachdadh an teicneòlais. Tha a h-uile duine a’ cumail sùil: sgiobaidhean stèidhichte a’ feuchainn ri teicneòlas a tha a’ tighinn am bàrr a dhearbhadh, companaidhean tòiseachaidh ag èirigh a’ coimhead ri rannsachadh a thionndadh gu toraidhean cruth-atharrachail, agus gnìomhaichean itealaich air an oidhche a’ coimhead ri boc sgiobalta a dhèanamh anns an luaith òir seo. Ach, leis an spreadhadh inntinneach seo, tha sinn cuideachd a’ faicinn spreadhadh de mhì-chinnt. Tha daoine a’ faighneachd: “Ciamar a stiùireas mi an talamh ùr seo?”, “Dè a bu chòir dhomh a bhith a’ coimhead a-mach? ”, “Ciamar a gheibh mi fìor luach bhon atharrachadh paradigm teicneòlasach seo?”

An dèidh a bhith ag obair le LLMn fada ron hype, bu mhath leinn beagan soilleireachd a thabhann. Tha sinn air faicinn cho cumhachdach sa dh’ fhaodas innealan a bhith ag amalachadh an teicneòlais seo. Tro ro-thrèanadh air milleanan de dhuilleagan teacsa gus ceanglaichean bun-bheachdail iom-fhillte ionnsachadh, a bharrachd air stiùireadh a bharrachd, nas granular (tro dhòighean leithid “gleusadh grinn”, “ionnsachadh neartachaidh air fios air ais bho dhaoine”, agus “innleadaireachd sgiobalta”), faodaidh modalan cruth-atharrachaidh a bhith feumail airson gach seòrsa gnìomh. Ach is e an rud a tha gu tric na iongnadh dha daoine a tha a’ tighinn a-steach don fhànais nach eil e furasta LLMn a dhèanamh feumail airson fìor obair a dhèanamh, gu sònraichte ann an raointean far a bheil càileachd a’ cunntadh .

Dòigh-obrach prionnsapal

Aig Finetune, airson grunn bhliadhnaichean tha sinn air LLMn a luathachadh gus cur ri gineadh susbaint ar com-pàirtichean agus sruthan-obrach tagadh. Tro na com-pàirteachasan sin, agus tro na leasanan cruaidh a thig an cois eòlas san t-saoghal fhìor, tha sinn air faighinn a-mach gu bheil an teicneòlas as motha a’ toirt buaidh nuair a thèid a chur còmhla ri frèam prionnsapal. Tha e cudromach a bhith ga dhèanamh ceart , seach a bhith ga dhèanamh gu sgiobalta .

Carson nach dèan thu dìreach an dòigh fhurasta? Uill, abair gu bheil thu dìreach ag iarraidh air GPT-4 sonnet ùr “Shakespearean” a sgrìobhadh, no ceist deuchainn a sgrìobhadh air cuspair sònraichte. Aig a 'chiad sealladh, bidh coltas gu tric air an toradh iomchaidh. Ach cuimhnich: tha na modailean sin ag obair mar luchd-brathaidh sgileil. Coimhead seachad air uachdar an sonnet sin agus chì thu cridhe lag: tha a 'mhòr-chuid de chreideasan, inntinn agus beachd bunaiteach Shakespeare air am fàgail gu tur. Mar an ceudna, dèan sgrùdadh air a’ cheist deuchainn sin agus chì thu prìomh chùisean: cha deach aire sam bith a thoirt do thogail bunaiteach sam bith, no ciamar a dh’ fhaodadh duine an àrainn a shampallachadh gus taic a thoirt do cho-dhùnaidhean comais , no adhbhar sam bith a bhith a’ stiùireadh na deuchainn. Gu h-iomlan, chan eil èifeachd psychometric ann!

Gus dligheachd a thogail a-steach agus a h-uile càil eile a tha proifeiseantaich sa ghnìomhachas againn ag iarraidh, feumaidh aon a dhol nas fhaide na am modail cànain amh tro synthesis eadar saidheans tomhais & ionnsachadh, psychometrics, agus AI .

Seo cuid de na prìomh phrionnsabalan a thaobh cò ris a tha an synthesis sin coltach:

  1. Dealbhadh airson an t-sruth-obrach, chan ann airson an AI
  2. Ionad an duine anns an lùb
  3. Tog earbsa tro fhollaiseachd

Dealbhadh airson an t-sruth-obrach, chan ann airson an AI

Chan eil e gu leòr ach LLM fhilleadh a-steach do thagradh: feumaidh am fòcas a bhith air na h-innealan AI a thoirt don neach-cleachdaidh as fheàrr a bheir taic don obair aca. Bi faiceallach mu sholaraichean aig a bheil aonachadh le aon mhodail sònraichte, agus faigh a-mach feadhainn a chumas suas ri adhartas AI, gu sònraichte le bhith LLM-agnostic . Às deidh na h-uile, bidh modalan sònraichte a ’tighinn agus a’ falbh: bha an latha aig GPT-3 sa ghrèin agus an uairsin b ’e seann ad a bh’ ann. An-diugh tha beairteas de roghainnean ann, gach cuid ainmeil mar GPT-4 agus Claude, agus nach eil cho aithnichte leithid GPT-NeoX , FLAN , agus modalan le deagh ghleus.

Is e am miann seo a bhith ag amas air an t-sruth-obrach as coireach aig Finetune, tha sinn air a bhith a’ dealbhadh mhodalan AI gus freagairt air an obair a dh’ fheumas iad gus taic a thoirt. Cho luath ‘s a thòisicheas sinn ag obair le neach-ceannach, bidh an sgioba Tomhais againn a’ tional prìomh stuthan gus cunntas a thoirt, eagrachadh agus prìomhachas a thoirt do na prìomh thogalaichean airson am measaidhean agus na pàtrain dealbhaidh a tha riatanach airson an tomhas. Bidh seo a’ leantainn gu seata structaraichte de shònrachaidhean deuchainn is nithean, a’ toirt cothrom don luchd-saidheans AI againn seo a thoirt a-steach don phròiseas leasachaidh modail. Mus tèid a leigeil ma sgaoil, bidh na sgiobaidhean Tomhais & AI a’ dol tro ghrunn ath-aithrisean de ghealltanas càileachd gus dearbhadh gu bheil toraidhean a’ mhodail a’ dèanamh deuchainn air na togalaichean ceart aig na h- ìrean iomchaidh de iom-fhillteachd inntinneil , agus gu bheil na nithean a’ cumail ris an dà chuid stiùireadh sgrìobhaidh deuchainn agus na cleachdaidhean as fheàrr ann am measadh .

Ionad an duine anns an lùb

Ged a tha mòran a’ pàigheadh seirbheis bilean gu luach cuir a-steach luchd-cleachdaidh, chan eil mòran a’ fuireach sin a-mach. Bu chòir eòlaichean cuspair (SMEn) a bhith nan com-pàirtichean co-ionann ann an leasachadh mhodail, còmhla ri luchd-saidheans dàta agus luchd-ùidh eile. Cuideachd, cha bu chòir don dearbhadh stad aig cleachdadh. Bidh LLMn mar GPT-4 a’ stad air ionnsachadh às deidh an trèanadh tùsail aca, agus mar sin feumaidh luchd-leasachaidh thagraidhean dòighean a leasachadh gus smachd a thoirt don neach-cleachdaidh agus cumail suas ri feumalachdan an luchd-cleachdaidh. Fiù ‘s a-muigh san raon, bu chòir modalan AI a bhith a’ faighinn leasachaidhean leantainneach, gus dèanamh cinnteach gu bheil an neach-cleachdaidh an-còmhnaidh ann an cathair an draibhear.

Mar eisimpleir, bidh fios air ais bho SMEn gar cuideachadh gus faighinn a-mach dè na togalaichean a bu chòir a thomhas le susbaint a ghineadh le AI, dè na pàirtean den t-susbaint as motha a dh’ fheumas iad cuideachadh leis, dè a tha ann an càileachd àrd, agus mar a leasaicheas am modail thar ùine. Bidh sinn a’ coinneachadh gu cunbhalach ri teachdaichean tro bhith a’ togail mhodail gus beachdachadh air adhartas agus raointean airson leasachadh agus gus fios air ais bho SMEan iarraidh. Cuideachd, le feart ris an can sinn Learn , bidh e comasach do SMEn na stuthan as fheàrr a ghineadh le AI a chomharrachadh, gan toirt air ais don chuibhle fèin-leasachaidh AI. An àite a bhith a’ fàs sean, tro fhios air ais bho SME faodaidh na modailean agad fàs nas fheàrr thar ùine.

Tog earbsa tro fhollaiseachd

Às aonais follaiseachd, ciamar a gheibh thu earbsa ann an toradh LLM? Tha na modailean sin gu tric neo-shoilleir agus buailteach a bhith a’ dèanamh aithrisean meallta misneachail. Bu chòir comasan in-thogail a bhith aig inneal sam bith le taic LLM gus toraidhean a’ mhodail a lorg air ais gu stòr earbsach. A bharrachd air an sin, tha an fheum air earbsa a’ dol nas fhaide na earbsa san t-siostam AI, a’ toirt a-steach earbsa ann an tèarainteachd dàta agus prìobhaideachd.

Tha an earbsa seo air a bhith gu math cudromach dhuinn. Airson Generate, bhrosnaich e sinn gus feartan a thogail leithid sgrùdadh fiosrachaidh le taic AI agus an comas gineadh a dhèanamh gu dìreach bho stuthan fiosrachaidh. Mar an ceudna, air an toradh tagadh AI againn, Catalog, bha againn ri dòighean a leasachadh airson gum biodh na siostaman AI againn a’ dèanamh cho-dhùnaidhean tagaidh gu rianail agus le mìneachaidhean, a’ toirt a-steach briseadh sìos Feallsanachd agus Sgòr Catalog. Dìreach mar a bu chòir dha SME daonna earbsach a bhios a’ sònrachadh taga a bhith comasach air am pròiseas smaoineachaidh air cùl a’ cho-dhùnaidh a mhìneachadh, mar sin bu chòir siostam AI earbsach a bhith ann cuideachd. A thaobh tèarainteachd dàta & prìobhaideachd, tha na modailean a bhios sinn a’ leasachadh air an dealachadh a rèir gach neach-ceannach agus chan eil iad air an gleusadh ach air an dàta bhon neach-ceannach sin. San dòigh sin, faodaidh na modailean ionnsachadh taobh a-staigh agus taobh a-muigh mar a bhios neach-ceannach sònraichte a’ dèanamh an cuid obrach, gun eagal a bhith orra aoidionachd.

Co-dhùnadh

A bharrachd air na leasachaidhean càileachdail iongantach a tha air a bhith aig LLMn anns na mìosan a chaidh seachad, tha na leasachaidhean air ruigsinneachd air a bhith a cheart cho iongantach. Tha sinn air a dhol a-steach do àm far nach eil eòlas AI a-nis na bhacadh air faighinn a-steach airson eadar-obrachadh le LLMn. Thuirt sin, tha an eadar-dhealachadh eadar a bhith ag eadar-obrachadh le LLM agus a bhith a’ togail toradh càileachd le LLM cho mòr ris an eadar-dhealachadh eadar pana-fhrithealaidh a bhith agad agus a bhith a’ lìbhrigeadh eòlas ithe 5-rionnag aig sgèile: chan eil an tè mu dheireadh comasach ach le sgioba de dh’ obair shònraichte. eòlaichean a’ cur an gnìomh dealbhadh prionnsapal stèidhichte air eòlas luchd-cleachdaidh.

Aig Finetune, tha sinn a’ moladh trì prionnsapalan sìmplidh - ach, tha sinn a’ creidsinn, riatanach - ris am bu chòir toraidhean sam bith - chan e dìreach Generate or Catalogue - cumail riutha ma tha iad airson cumhachd LLMn a luathachadh gu h-èifeachdach. Le bhith a’ dealbhadh airson an t-sruth-obrach, an àite an AI , bidh aon a’ dèanamh cinnteach gu bheil càileachd eòlas an neach-cleachdaidh air a phrìomhachadh os cionn margaidheachd ge bith dè an LLM a thachras aig a bheil hype air an latha shònraichte sin. Le bhith ag amas air an duine anns an lùb , tha aon ag aideachadh, ge bith dè an cumhachd a th’ aig an LLM sònraichte, gu bheil feum air eòlas SME an-còmhnaidh gus LLMn a luathachadh aig sgèile. Le bhith a’ togail earbsa tro fhollaiseachd , tha aon a’ nochdadh spèis don neach-ceannach le bhith a’ cur cuideam air follaiseachd an dà chuid ann an co-dhùnadh LLM agus tèarainteachd dàta. Fo gach aon de na prionnsapalan sin tha prìomh chuspair: gu bheil LLM - mar mhodail AI sam bith - na inneal. Aig Finetune, tha sinn moiteil chan e a-mhàin ar n-eòlas ann an AI agus Tomhas, ach cuideachd den eòlas faisg air trì bliadhna againn ann a bhith a’ faighinn buannachd às na h-innealan AI cumhachdach sin gus eòlas cleachdaiche àrd-inbhe a lìbhrigeadh: fear air a dhealbhadh gus àrdachadh , seach a bhith na àite, eòlas ar luchd-cleachdaidh.