Jauns pašapzinības tīkla laikmets: liela modeļa virzīta nākotne

2023. gada AI tīkla inovāciju konference, kas notika Pekinas inteliģenta tīkla modelī BBS, ZTE kabeļu izstrādājumu modeļa vecākā arhitekta Ji'an-Guo Lu padarīja gudrības tīklam jaunu laikmetu: Big Model virza ZTE tēmas nākotni, izmantojot smalku noregulēšanas virziena modeli, lai uzlabotu intelektu, korpusa intelekta līmeni.
Lu Jianguo sacīja, ka daudzas galvenās tehnoloģijas, piemēram, AI, kas ir iespējama, digitālā dvīņa un nodomu virzība, atbalstīs pašintelligences tīkla intelekta līmeni no L4 līdz L5 un liks pašizliedienamības tīklam turpināt atkārtoties un attīstīties, lai pabeigtu pašnozīmību. Starp šīm galvenajām tehnoloģijām AI ir vissvarīgākais motors, un lielie modeļi ir AI tehnoloģijas atslēga.
Kā piemērot lielu modeli pašizliedienam tīklam, Lu Jianguo iepazīstināja ar to, ka lielam modelim ir super paaudzes spēja un tas var ātri ģenerēt lielu skaitu shēmu. Intelektuālā tīkla operācijām šāda nepieciešamība ieviest lielu skaitu darbības darbību, kas ir līdzvērtīga augstas dimensijas telpā, lai atrastu optimālu risinājumu, risinājumu, kas iestatīts visiem iespējamiem procesiem, liels vispārējs risinājumu modelis, piemēram, NP (nevis polinoma) problēmu, liels skaits paraugu, novērtēšana, optimizācija, iterācija var spēlēt efektīvu atzarošanu, ātri tuvojas optimālam risinājumam. Tomēr, lai arī lieli modeļi rada daudzas shēmas, ir grūti nodrošināt, ka šīs shēmas ir noderīgas. Kaut arī lieliem modeļiem ir noteiktas domāšanas spējas, viņiem joprojām ir nepieciešama cilvēku iejaukšanās, strādājot ar sarežģītu loģiku. Lai atrisinātu šo problēmu, ZTE ierosina integrēt ekspertu pieredzi pakāpeniskas pirmstalizēšanas un modeļa noregulēšanas procesā, lai veidotu slēgta cilpas iterāciju. Tādā veidā var veikt vienmērīgu pāreju no manuālas atgriezeniskās saites pastiprināšanas mācīšanās uz instrumentu atgriezeniskās saites pastiprināšanas mācīšanos, kas var efektīvi izmantot lielu modeļu ģenerēšanas spēju, no vienas puses, un, no otras puses, nodrošināt, ka ģenerētā diagnostikas shēma ir precīza un uzticama. Šajā shēmā tā ir galvenā saikne, lai izveidotu operāciju un apkopes zināšanu karti apvienojumā ar zināšanu inženieriju. Datu spararata shēmas ģenerēšana ir balstīta uz operācijas un uzturēšanas zināšanu karti, lai izvairītos no modeļa ilūzijas un nodrošinātu paaudzes shēmas uzticamību un precizitāti. Šī uz zināšanām balstīta pieeja var labāk integrēt ekspertu pieredzi un modeļa ģenerēšanas iespējas, lai sniegtu ticamākus risinājumus.

1222608496226784797
Lielā modeļa lietojumprogrammu loģikas dizainam Lu Jianguo arī iepazīstināja ar to, ka ZTE izmantos uz modeli balstītu slēgtas cilpas metodi, pamatojoties uz tūlītēju inženieriju. Dizaina būtība ir uztvert cilvēka valodas strukturētu izpausmi (uzvednes veidne) kā ievadi, ar lielo modeļa palīdzību ģenerēt strukturētu izvadi (izkārtojuma shēmu) un visbeidzot apvienot lietojumprogrammas ietvara interaktīvo izpildi. Lai realizētu iepriekš minēto loģiku, ZTE veiks tehniskus sagatavošanās darbus no daudziem aspektiem, piemēram, daudzmodālu spēju evolūciju, korpusa sagatavošanu, resursu attiecību zināšanu diagrammas zināšanu injekciju, atomu API korpusa rezervi / atomu API spēju rezervi, mākslīgas simulācijas kļūdas vidi, digitālo Twin automātiskās bojājuma simulācijas vidi un instrumentu sagatavošanu.
Lu Jianguo beidzot teica, ka lielā modeļa galvenā vērtība ir tā parādīšanās spējas, tas ir, tas var radīt jauninājumus, apvienojot esošās zināšanas. Tomēr šīs iespējamās jaudas realizācija ir atkarīga no augstas kvalitātes datu ražošanas, pieņemšanas un nokrišņiem. Tikumīgs datu cikls ir noteicošais faktors.


Pasta laiks: 20.-2023. Novembris