Le Teàrlach Foster

Aig Finetune, tha sinn a’ togail fhuasglaidhean AI gus dèiligeadh ri cuid de na duilgheadasan as dùbhlanaiche ann an teicneòlas foghlaim, a’ gabhail a-steach gineadh susbaint fèin-ghluasadach agus seòrsachadh agus molaidhean ghoireasan ionnsachaidh le cumhachd AI. Leis gu bheil an cuspair a dh’ fheumas ar n-innealan a làimhseachadh raointean bho K-12 tro leasachadh luchd-obrach, tha sinn a’ tasgadh gu mòr ann an dòighean a leigeas leinn farsaingeachd agus doimhneachd na tha na modailean againn a’ còmhdach a mheudachadh. Is e prìomh phàirtean den dòigh-obrach seo dòighean sùbailte gus lìonraidhean neural sònraichte a thrèanadh ann an raointean far nach eil modalan coitcheann gu leòr. Anns a’ phost bhlog seo, bu mhath leam beagan den turas againn a roinn a’ sgrùdadh nan dòighean sin.

gleusadh grinn

Tha mion-sgrùdadh àbhaisteach de mhodalan cànain neural a’ toirt a-steach a bhith a’ dèanamh an fheum as fheàrr de na paramadairean trèanaidh aca uile aig an aon àm, a dh’ fhaodas ruith gu mòran bhilleanan airson lìonraidhean leithid GPT-J. Aig lannan mar seo, tha an dà chuid na pròiseasan mion-gleusaidh agus co-dhùnaidh neo-shònraichte, agus mar sin tha e duilich an cleachdadh gu farsaing. Anns na sgrùdaidhean againn fhìn, bha coltas ann gun robh grunn phrìomh chùisean a’ tighinn am bàrr:

  • Tha dìreach a bhith a’ ruith nam modalan cruth-atharrachaidh sin mu thràth a’ brùthadh suas an-aghaidh crìochan cuimhne GPU (VRAM), agus aig àm gleusadh grinn tha dàimh dhìreach eadar an àireamh de pharamadairean a thathas ag ùrachadh agus an ìre de chuimhne a bharrachd a thathas ag ithe.
  • Le bhith ag atharrachadh a h-uile paramadair san lìonra, dh’ fhaodadh gun tèid dragh a chuir air an t-sruth fiosrachaidh a chaidh ionnsachadh rè ro-thrèanadh, a dh’ adhbhraicheas dìochuimhneachadh agus call comasan beagan dhealbhan.
  • Le bhith a’ frithealadh modal ioma-gigabyte gnàthaichte airson gach cùis cleachdaidh chruthaicheadh sin eallachan neo-iomchaidh agus cosgais.

Bhrosnaich na draghan co-cheangailte seo sinn gu bhith a’ sgrùdadh dhòighean eile bhon litreachas o chionn ghoirid gus ar modalan cànain neòil a ghleusadh. Gu fortanach, taobh a-staigh na bliadhna a dh’ fhalbh tha an raon rannsachaidh giollachd cànain nàdarra air grunn dhòighean a leasachadh gus cosgaisean gnàthachaidh mhodalan cànain ro-thrèanadh a ghearradh sìos.

Tuning sgiobalta

Is e an dòigh-obrach thùsail a bha sinn a’ leantainn ris an canar Prompt Tuning or Soft Prompting (Lester et al. 2021). Anns an dòigh seo, tha crìochan an lìonra bho ro-thrèanadh air an cumail reòta. An àite sin, bidh sinn a’ ro-aithris àireamh bheag de vectaran in-ghabhail ionnsachadh (10 gu 20 mar as trice) air beulaibh na comharran brosnachaidh cuir a-steach, agus a’ gleusadh na h-innealan sin leis an amas modaladh cànain àbhaisteach air clàr-dàta mion-gleusaidh. Chan eil na bun-stèidh seo a' riochdachadh comharran cànain; faodaidh sinn smaoineachadh orra an àite sin mar stòr dùmhail de cho-theacsa as urrainn don lìonra a shuidheachadh - tron inneal aire - leis gu bheil e a’ dèanamh ro-innse mu na comharran san t-sreath.


Cha bhith gleusadh sgiobalta a’ cur ach cosgais bheag ùine ruith ris a’ mhodail, leis gu bheil na molaidhean bog anns an raon kilobyte agus faodar an ruith tron lìonra aig an aon àm. Tha na feartan sin gan dèanamh tarraingeach airson a bhith a’ frithealadh mòran de luchd-cleachdaidh aig an aon àm, mar a tha cleachdadh o chionn ghoirid den dòigh ann an aithris sgeulachdan AI air nochdadh. Ach, tha e iom-fhillte a bhith ag amalachadh molaidhean bog ann am frèaman mòr-chòrdte leithid cruth-atharrachaidh HuggingFace, leis gu bheil na h-eadar-aghaidhean gu ìre mhòr air an dealbhadh gus obrachadh air sreathan de chlàran-amais seach vectaran dùmhail. A bharrachd air an sin, mar a bhios barrachd co-theacsa air a chur ris eadar an gluasad bog agus an ginealach, bidh sinn a’ tòiseachadh a ’faicinn mì-chothromachadh eadar neart an t-suidheachaidh air a’ cho-theacsa bog agus air a ’cho-theacsa tòcan. Bha e cudromach dhuinn a bhith a’ cumail a’ chomais na ceudan de chomharran co-theacsa a chur ris gu sùbailte aig àm ruith, leis gu bheil e a’ toirt seachad luamhanan smachdachaidh grinn a bharrachd anns a’ phròiseas ùghdarrachaidh nithean. Ma tha sinn airson am modail a stiùireadh gus fòcas a chuir air susbaint bho dhuilleag sònraichte de leabhar-teacsa, no stuth tuigse leughaidh a sgrìobhadh, no eisimpleirean le beagan dhealbhan a thoirt seachad, tha suidheachadh cruth fada cudromach.

Adapters ìre ìosal (LoRA)

Ghluais sinn nas fhaide air adhart gu modh ris an canar LoRA no Low Rank Adapters (Hu et al. 2021). Chaidh an dòigh seo a leasachadh le luchd-rannsachaidh aig Microsoft ag obair air modalan meud GPT-3, agus a’ togail air dòighean-atharrachaidh nas tràithe. Ma smaoinicheas sinn air cruth-atharrachaidh mar a bhith ag ùrachadh a stàitean falaichte comharran mean air mhean le gach còmhdach air fhàgail, is e bun-bheachd inneal-atharrachaidh delta beag a tha an urra ri cuir a-steach (air a thòiseachadh gu no-op) a chuir ris na latents sin aig ìre sònraichte. Bidh an cnap socair seo an uairsin comasach air a ghiùlan atharrachadh sìos an abhainn le bhith, can, a’ cur cuideam air na pàirtean den chur-a-steach a tha buntainneach don ghnìomh.


Is e seòrsa de inneal-atharrachaidh a th’ ann an luchd-atharrachaidh ìre ìosal a tha ag amas air subspace ìre ìosal, a bhios a’ gearradh sìos an àireamh de pharamadairean ùra a dh’ fheumas sinn a thrèanadh (bho D 2 gu 2 × D × r, far a bheil D anns na mìltean). Mar le brosnachadh bog, bidh sinn a’ cumail paramadairean tùsail an lìonra reòta gus ge bith dè an eòlas a th’ ann bho ro-thrèanadh a ghleidheadh, agus dìreach na paramadairean atharrachaidh ùra sin atharrachadh. Anns na deuchainnean taobh a-staigh againn, tha sinn air comharran math fhaicinn bho LoRA. A bharrachd air a bhith comasach dhuinn modalan mòra a ghleusadh air buidseatan bathar-cruaidh beaga, bidh modalan le sreathan adapter eadar-dhealaichte cuideachd a’ gleidheadh mòran den chomas beagan dhealbhan tùsail aca fhad ‘s a tha iad fhathast ag atharrachadh a rèir an raon targaid. Gu sònraichte, tha e furasta a bhith ag amalachadh innealan-atharrachaidh ìre ìosal ann am frèaman eile, oir is urrainn dhuinn dìreach sreathan sreathach a th’ ann mar-thà atharrachadh le sreathan sreathach + adapter mar a dh ’fheumar.

A' Gluasad air adhart

Gus blas a thoirt don t-seòrsa leasachaidhean a chunnaic sinn nar rannsachaidhean, gu h-ìosal tha sinn a’ roinn taghadh beag de ghinealaichean bho mhodalan air an trèanadh le diofar dhòighean gleusaidh. Chaidh na nithean sin uile a chruthachadh a’ cleachdadh na h-aon trì brosnachaidhean co-cheangailte ri lìbhrigeadh cùram altramais: bha a’ chiad fhear ag amas air prìomhachas a thoirt do fheumalachdan ioma-chleachdaiche agus an dàrna fear air a dhol an gnìomh ann an suidheachadh sgioba.

Item #1: A nurse is assessing a client who is scheduled for outpatient surgery. Which of the following patients would the nurse evaluate next? (A) A patient with type 1 diabetes (B) A patient with acute pancreatitis (C) A patient who requires intravenous antibiotic therapy (D) A patient with Crohn's disease Item #2: A client is admitted to the hospital with the diagnosis of congestive heart failure. The client's mother is refusing treatment. Which of the following actions should the nurse take? (A) Notify the provider of the situation. (B) Check the patient's medication list. (C) Check the client's medical chart. (D) Notify the client's doctor of the client's condition.

Item #3: A nurse is evaluating a patient on the pediatric unit. The client is scheduled for a diagnostic workup, including a chest radiograph. Which of the following patients should the nurse be planning to evaluate next? (A) A child who has pneumonia and is experiencing fever (B) A child who has a rash and is not responding to a medication (C) A child who has a fever and has a temperature >100.4 (D) A child who has a fever and a rash Item #4: A client with renal failure is in the hospital and is scheduled to undergo a renal transplant. The client has a strong belief that the transplant surgeon is incompetent. The client refuses to allow a doctor from another hospital to perform the transplant. Which of the following actions should the charge nurse take? (A) Take a statement from the client that the transplant surgeon is competent and give it to the transplant surgeon. (B) Ask the client for a signed statement to back up her assertion. (C) Contact the transplant surgeon and find out why the client refuses to allow the surgeon from another hospital to perform the transplant. (D) Inform the transplant surgeon that the client is refusing the transplant.

Item #5: A nurse is planning to assign clients to various bedside stations. Which of the following clients should the nurse assign to the bedside station closest to the nurses' station? (A) A client who has a suspected diagnosis of a pulmonary embolism and requires a computed tomography (CT) scan (B) A client who needs assistance with a bowel movement (C) A client who has an emergency indication for a chest X-ray (D) A client who requires a chest X-ray because she has a cough Item #6: An LPN is caring for a client with an indwelling urinary catheter and is asking the nurse to help her clean the catheter. Which of the following actions should the nurse take? (A) Explain to the client that she will need to provide the cleaning solution and will need to obtain the client's consent for the procedure. (B) Ask the LPN for assistance. (C) Offer to help the client clean the catheter. (D) Assure the LPN that the nurse will assist her.

Faodaidh sinn faicinn, ged a tha na stuthan as fheàrr bhon mhodail bun-loidhne gu ìre mhòr fileanta agus ciallach gu loidsigeach, tha iad buailteach a bhith fo-chuingealaichte (mar ann an #1) no ag iarraidh glè bheag de eòlas air an raon altramais (mar ann an #3). An coimeas ris na stuthan bun-loidhne, tha barrachd mion-fhiosrachaidh anns na stuthan bho na modalan gleusadh sgiobalta agus inneal-atharrachaidh aig ìre ìosal anns na brosnachaidhean, gasan agus roghainnean aca. Tha an cuspair buntainneach don raon, ag iarraidh eòlas sònraichte ann an riaghladh cùram altramais seach a bhith an urra ri eòlas cùl-fhiosrachaidh a-mhàin. A bharrachd air an sin, tha cruth nas cunbhalaiche aig na stuthan bhon mhodail adapter ìre ìosal. Mar eisimpleir, bidh na nithean gu cunbhalach a’ toirt iomradh air an “neach-dèiligidh” an taca ris an “euslainteach”, a rèir a’ chànain a dh’ fhaodadh nochdadh ann am measaidhean (dèan coimeas eadar #5 agus #1 agus #3). Bidh e cuideachd gu soirbheachail a’ cumail sùil air iomraidhean air grunn dhaoine ann an suidheachadh (dèan coimeas eadar #6 agus #4).

Faodaidh leasachaidhean air còmhdach fearainn, cunbhalachd stoidhle, agus co-leanailteachd loidsigeach eadar-theangachadh gu leasachaidhean mòra ann am feum modalan cànain neural. Chan eil an seo ach toiseach: mar a bhios an teicneòlas a’ tighinn gu ìre, lorgar eadhon barrachd dhòighean gus modalan cànain nàdarra gnàthaichte a chruthachadh aig sgèile. Agus mar a lorgar na dòighean sin, cumaidh sinn oirnn a’ toirt a-steach a’ chuid as fheàrr bho acadamaidh, gnìomhachas, agus rannsachadh neo-eisimeileach air toraidhean Finetune.

Taing dhùrachdach do Nick Koprowicz, Jesse Hamer, Saad Khan, agus Ogden Morse airson fios air ais coibhneil, cuideachail a thoirt seachad ann an leasachadh a’ bhlog seo.

Iomraidhean

Hu, EJ, Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., … & Chen, W. (2021). Lora: Atharrachadh aig ìre ìosal de mhodalan cànain mòra. arXiv preprint arXiv: 2106.09685.

Lester, B., Al-Rfou, R., & Constant, N. (2021). Cumhachd sgèile airson gleusadh sgiobalta a tha èifeachdach le paramadair. arXiv preprint arXiv: 2104.08691.