લખાણ પર જાઓ

સર્જનાત્મક કૃત્રિમ બુદ્ધિમત્તા

વિકિપીડિયામાંથી
Impressionistic image of figures in a futuristic opera scene
'થિયેટર ડી'ઓપેરા સ્પેશિયલ' (૨૦૨૨), મિડજર્ની (AI) દ્વારા બનાવવામાં આવેલ વિજેતા છબી

સર્જનાત્મક કૃત્રિમ બુદ્ધિમત્તા (સર્જનાત્મક એઆઈ, અથવા જેન એઆઈ) એ કૃત્રિમ બુદ્ધિમત્તા (આર્ટિફિશિયલ ઇન્ટેલિજન્સ)નું એક પેટાક્ષેત્ર છે, જે લખાણ, છબીઓ, વીડિયો (ચલચિત્રો), ધ્વનિ (ઓડિયો), સોફ્ટવેર કોડ અથવા ડેટાના અન્ય સ્વરૂપોનું સર્જન કરવા માટે સર્જનાત્મક મોડેલોનો ઉપયોગ કરે છે.[][] આ મોડેલો તેમના તાલીમ ડેટામાં રહેલા માળખાં અને ભાત (પેટર્ન) શીખે છે અને ઇનપુટના પ્રતિભાવમાં નવો ડેટા બનાવવા માટે તેનો ઉપયોગ કરે છે,[][] જે સામાન્ય રીતે કુદરતી ભાષામાં આપવામાં આવેલા પ્રોમ્પ્ટ્સના રૂપમાં હોય છે.[][]

૨૦૨૦ના દાયકામાં કૃત્રિમ બુદ્ધિમત્તા (AI)માં આવેલ તેજી પછી સર્જનાત્મક AI સાધનોનો વ્યાપ નોંધપાત્ર રીતે વધ્યો છે. આ તેજી ડીપ ન્યુરલ નેટવર્કમાં થયેલા સુધારાઓ દ્વારા શક્ય બની હતી, ખાસ કરીને લાર્જ લેંગ્વેજ મોડેલ્સ (LLM) દ્વારા, જે ટ્રાન્સફોર્મર આર્કિટેક્ચર પર આધારિત છે. મુખ્ય સાધનોમાં LLM આધારિત ચેટબોટ્સ જેવા કે ચેટજીપીટી (ChatGPT), ક્લોડ (Claude), કો-પાયલોટ (Copilot), ડીપસીક (DeepSeek), ગૂગલ જેમિની (Google Gemini)નો સમાવેશ થાય છે; સાથે જ સ્ટેબલ ડિફ્યુઝન (Stable Diffusion), મિડજર્ની (Midjourney) અને ડેલ-ઈ (DALL-E) જેવા લખાણ-થી-છબી (Text-to-Image) મોડેલો અને વિઓ (Veo) અને સોરા (Sora) જેવા લખાણ-થી-વીડિયો મોડેલોનો સમાવેશ થાય છે.[][][] સર્જનાત્મક AI વિકસાવતી ટેક્નોલોજી કંપનીઓમાં અલીબાબા, એન્થ્રોપિક, બાયડુ, ડીપસીક, ગૂગલ, મેટા AI, માઇક્રોસોફ્ટ, મિસ્ટ્રલ AI, ઓપનએઆઈ, પર્પ્લેક્સિટી AI, xAI અને યાન્ડેક્ષનો સમાવેશ થાય છે.[૧૦][૧૧] સર્જનાત્મક AIને વિવિધ ક્ષેત્રોમાં અપનાવવામાં આવ્યું છે, જેમાં સોફ્ટવેર ડેવલપમેન્ટ,[૧૨] હેલ્થકેર (આરોગ્ય સંભાળ),[૧૩] ફાઇનાન્સ (નાણાકીય સેવાઓ),[૧૪] મનોરંજન,[૧૫] ગ્રાહક સેવા,[૧૬] વેચાણ અને માર્કેટિંગ,[૧૭] કલા, લેખન,[૧૮] ફેશન,[૧૯] અને પ્રોડક્ટ ડિઝાઇનનો[૨૦] સમાવેશ થાય છે.

સર્જનાત્મક AIનો ઉપયોગ સાયબર ક્રાઇમ તેમજ નકલી સમાચારો અને ડીપફેક દ્વારા લોકોને છેતરવા માટે થયો હોય તેવા ઘણા કિસ્સા છે.[૨૧][૨૨] સર્જનાત્મક AI નોકરીઓમાં મોટા પાયે માનવ સંસાધનનું સ્થાન લે તેવી શક્યતાઓ રહેલી છે.[૨૩] આ સાધનોને બૌદ્ધિક સંપત્તિ કાયદા (Intellectual Property Laws)ના ઉલ્લંઘન તરીકે વર્ણવવામાં આવ્યા છે, કારણ કે તેઓ કૉપિરાઇટ ધરાવતી સામગ્રી પર પ્રશિક્ષિત છે.[૨૪] ઘણી સર્જનાત્મક AI સિસ્ટમો મોટા પાયે ડેટા કેન્દ્રોનો ઉપયોગ કરે છે, જેની પર્યાવરણીય અસરોમાં ઈ-કચરો, ઠંડક (cooling) માટે તાજા પાણીનો વપરાશ અને ઉચ્ચ ઊર્જા વપરાશનો સમાવેશ થાય છે, જે સતત વધવાનો અંદાજ છે.[૨૫] નવા મોડેલો અને એપ્લિકેશનો સાથે સર્જનાત્મક AI ક્ષેત્ર ઝડપથી વિકસી રહ્યું છે.

ઇતિહાસ

[ફેરફાર કરો]

પ્રારંભિક ઇતિહાસ

[ફેરફાર કરો]

અલ્ગોરિધમ દ્વારા સર્જિત સામગ્રીના મૂળ માર્કોવ ચેઇન (Markov chain) ના વિકાસમાં રહેલા છે, જેનો ઉપયોગ ૨૦મી સદીની શરૂઆતથી પ્રાકૃતિક ભાષાને મોડેલ કરવા માટે થતો હતો. રશિયન ગણિતશાસ્ત્રી આન્દ્રે માર્કોવ દ્વારા ૧૯૦૬માં આ ખ્યાલ રજૂ કરવામાં આવ્યો હતો,[૨૬][૨૭] જેમાં Eugeny Onegin માં સ્વર અને વ્યંજન પેટર્નનું વિશ્લેષણ શામેલ હતું. એકવાર ટેક્સ્ટ કોર્પસ પર તાલીમ પામ્યા પછી, માર્કોવ ચેઇન સંભવિત ટેક્સ્ટ સર્જન કરી શકે છે.[૨૮][૨૯]

૧૯૭૦ના દાયકાની શરૂઆતમાં, કલાકારોએ માર્કોવ મોડેલ્સથી આગળ વધીને સર્જનાત્મક તકનીકોનો વિસ્તાર કરવા કોમ્પ્યુટરનો ઉપયોગ શરૂ કર્યો. હેરોલ્ડ કોહેને AARON દ્વારા નિર્મિત કૃતિઓ વિકસાવી અને પ્રદર્શિત કરી; જે સ્વાયત્ત રીતે ચિત્રો બનાવવા માટે રચાયેલ એક અગ્રણી કોમ્પ્યુટર પ્રોગ્રામ હતો.[૩૦] ૧૯૮૦ અને ૧૯૯૦ના દાયકામાં AI પ્લાનિંગ સિસ્ટમ્સ, ખાસ કરીને કોમ્પ્યુટર-એઇડેડ પ્રોસેસ પ્લાનિંગ માટે 'સર્જનાત્મક AI પ્લાનિંગ' શબ્દનો ઉપયોગ થતો હતો.[૩૧][૩૨]

સર્જનાત્મક ન્યુરલ નેટવર્ક્સ (૨૦૧૪–૨૦૧૯)

[ફેરફાર કરો]
ઉપર: ઇમેજ ક્લાસિફાયર, જે ડિસ્ક્રિમિનેટિવ (ભેદપરખ) ઉદ્દેશ્ય સાથે પ્રશિક્ષિત ન્યુરલ નેટવર્કનું ઉદાહરણ છે. નીચે: ટેક્સ્ટ-ટુ-ઇમેજ મોડેલ, જે સર્જનાત્મક ઉદ્દેશ્ય સાથે પ્રશિક્ષિત નેટવર્કનું ઉદાહરણ છે.

મશીન લર્નિંગ ડેટાની આગાહી કરવા માટે ડિસ્ક્રિમિનેટિવ મોડેલ્સ અને સર્જનાત્મક મોડેલ્સ બંનેનો ઉપયોગ કરે છે. ૨૦૦૦ના દાયકાના અંતમાં, ડીપ લર્નિંગ ટેક્નોલોજીની રજૂઆતને કારણે ઇમેજ ક્લાસિફિકેશન, સ્પીચ રેકગ્નિશન, અને નેચરલ લેંગ્વેજ પ્રોસેસિંગ જેવા કાર્યોમાં સુધારો થયો હતો. સર્જનાત્મક મોડેલિંગની જટિલતાને કારણે આ સમયગાળામાં ન્યુરલ નેટવર્ક્સ સામાન્ય રીતે ડિસ્ક્રિમિનેટિવ મોડેલ્સ તરીકે પ્રશિક્ષિત કરવામાં આવતા હતા.[૩૩]

૨૦૧૪માં, વેરિએશનલ ઓટોએન્કોડર અને જનરેટિવ એડવર્સરીયલ નેટવર્ક (GAN) જેવી પ્રગતિઓએ પ્રથમ વ્યવહારિક ડીપ ન્યુરલ નેટવર્ક્સ બનાવ્યા જે જટિલ ડેટા (જેમ કે તસવીરો) માટે સર્જનાત્મક મોડેલ્સ શીખવા માટે સક્ષમ હતા. આ મોડેલ્સ માત્ર ઇમેજ માટેના ક્લાસ લેબલ્સ જ નહીં, પરંતુ DeepDream જેવી સંપૂર્ણ ઇમેજ આઉટપુટ કરવામાં પ્રથમ હતા.[સંદર્ભ આપો]

૨૦૧૭માં, ટ્રાન્સફોર્મર નેટવર્કે જૂના લોંગ શોર્ટ-ટર્મ મેમરી (LSTM) મોડેલ્સની તુલનામાં સર્જનાત્મક મોડેલ્સમાં પ્રગતિ કરી, જે ૨૦૧૮માં GPT-1 તરીકે ઓળખાતા પ્રથમ જનરેટિવ પ્રિ-ટ્રેન્ડ ટ્રાન્સફોર્મર (GPT) તરફ દોરી ગઈ.[૩૪]

સર્જનાત્મક AI નો ઉદય (૨૦૨૦–વર્તમાન)

[ફેરફાર કરો]
AI દ્વારા સર્જિત ચહેરાઓ વધુ અદ્યતન બન્યા છે.

માર્ચ ૨૦૨૦માં, MIT ના એક અનામી સંશોધક દ્વારા બનાવવામાં આવેલ મફત વેબ એપ્લિકેશન, 15.ai ની રજૂઆત થઈ, જે ન્યૂનતમ તાલીમ ડેટાનો ઉપયોગ કરીને પાત્રોના અવાજો સર્જન કરી શકતી હતી. આ સર્જનાત્મક AI ના પ્રારંભિક લોકપ્રિય ઉપયોગોમાંનો એક હતો.[૩૫]

૨૦૨૧માં, DALL-E ના આગમનથી AI-નિર્મિત ચિત્રોમાં પ્રગતિ થઈ.[૩૬] ત્યારબાદ ૨૦૨૨માં Midjourney અને Stable Diffusion ની રજૂઆત થઈ, જેમણે નેચરલ લેંગ્વેજ પ્રોમ્પ્ટ્સ (ટેક્સ્ટ સૂચનાઓ) માંથી ઉચ્ચ-ગુણવત્તાવાળી કૃત્રિમ બુદ્ધિમત્તા કળા (આર્ટિફિશિયલ ઇન્ટેલિજન્સ આર્ટ) બનાવવાનું સુલભ બનાવ્યું.[૩૭]

નવેમ્બર ૨૦૨૨માં, ChatGPT ની જાહેર રજૂઆતે સામાન્ય ટેક્સ્ટ-આધારિત કાર્યો માટે સર્જનાત્મક AI ને લોકપ્રિય બનાવ્યું. સિસ્ટમની વાતચીત કરવાની, સર્જનાત્મક સામગ્રી સર્જવાની અને કોડિંગમાં મદદ કરવાની ક્ષમતાએ કામ, શિક્ષણ અને સર્જનાત્મકતા પર AI ની સંભવિત અસર વિશે ચર્ચાઓ જગાવી.[૩૮]

માર્ચ ૨૦૨૩માં, GPT-4 ની રજૂઆતથી સર્જનાત્મક AI ક્ષમતાઓમાં વધુ સુધારો થયો. Microsoft Research ની એક ટીમે દલીલ કરી હતી કે તેને "આર્ટિફિશિયલ જનરલ ઇન્ટેલિજન્સ (AGI) સિસ્ટમનું પ્રારંભિક સંસ્કરણ ગણી શકાય."[૩૯] જોકે, અન્ય વિદ્વાનોએ આ તારણનો વિરોધ કર્યો હતો.[૪૦] પાછળથી ૨૦૨૩માં, મેટા એ ImageBind રજૂ કર્યું, જે છ અલગ અલગ મોડાલિટીઝ (ટેક્સ્ટ, ઇમેજ, વિડિયો, થર્મલ, 3D અને ઓડિયો) નો સમાવેશ કરતું AI મોડેલ હતું.[૪૧]

ડિસેમ્બર ૨૦૨૩માં, Googleજેમિની (Gemini) નામનું મલ્ટિમોડલ AI મોડેલ રજૂ કર્યું. ફેબ્રુઆરી ૨૦૨૪માં, ગૂગલે બાર્ડ (Bard) અને ડ્યુએટ AI ને જેમિની બ્રાન્ડ હેઠળ એકીકૃત કર્યા.[૪૨][૪૩] Anthropic એ પણ ક્લોડ (Claude) નામનું લાર્જ લેંગ્વેજ મોડેલ બહાર પાડ્યું.

AI (ગુલાબી) અને સર્જનાત્મક AI (લીલો) માં ખાનગી રોકાણ.

એશિયા-પેસિફિક દેશોમાં પશ્ચિમી દેશો કરતાં સર્જનાત્મક AI પ્રત્યે વધુ આશાવાદ અને સ્વીકાર જોવા મળ્યો છે. ૨૦૨૪ના સર્વેક્ષણ મુજબ, એશિયા-પેસિફિકના ૬૮% ઉત્તરદાતાઓ માને છે કે AI ની વિશ્વ પર સકારાત્મક અસર છે.[૪૪] ખાસ કરીને ચીન સર્જનાત્મક AI અપનાવવામાં વૈશ્વિક નેતા તરીકે ઉભરી આવ્યું છે.

૨૦૨૫ના મધ્ય સુધીમાં, ગ્રાહકોમાં વૃદ્ધિ ચાલુ હોવા છતાં, ઘણી કંપનીઓએ એકીકરણ અને ડેટા ગુણવત્તાની સમસ્યાઓને કારણે સર્જનાત્મક AI ના પાયલોટ પ્રોજેક્ટ્સ બંધ કર્યા, જેને વિશ્લેષકોએ ગાર્ટનરના ઉત્તેજના ચક્ર (ગાર્ટનર હાઈપ સાયકલ) ના "નિરાશાના તબક્કા" (trough of disillusionment) તરીકે વર્ણવ્યો.[૪૫]

ઉપયોગો

[ફેરફાર કરો]

સર્જનાત્મક AI મોડેલોના નોંધપાત્ર પ્રકારોમાં જનરેટિવ પ્રી-ટ્રેઇન્ડ ટ્રાન્સફોર્મર્સ (GPTs), જનરેટિવ એડવર્સરીયલ નેટવર્ક્સ (GANs) અને વેરિયેશનલ ઓટોએન્કોડર્સ (VAEs)નો સમાવેશ થાય છે.

સર્જનાત્મક AI એજન્ટનું માળખું

જો તેઓ બહુવિધ પ્રકારના ઇનપુટ પર પ્રક્રિયા કરી શકે અથવા બહુવિધ પ્રકારના આઉટપુટ ઉત્પન્ન કરી શકે, તો તેવી સિસ્ટમોને મલ્ટીમોડલ (Multimodal) કહેવામાં આવે છે. ઉદાહરણ તરીકે, GPT-4o લખાણ, ચિત્રો અને ઓડિયો એમ તમામ પર પ્રક્રિયા કરી શકે છે તેમજ તેનું સર્જન પણ કરી શકે છે.

સર્જનાત્મક AIએ વિવિધ ઉદ્યોગોમાં પ્રવેશ કરીને સામગ્રી નિર્માણ, વિશ્લેષણ અને વિતરણની ગતિશીલતાને ધરમૂળથી બદલી નાખી છે. દાખલા તરીકે, આરોગ્ય સંભાળમાં, સર્જનાત્મક AI નિશ્ચિત લાક્ષણિકતાઓ ધરાવતા પરમાણુ માળખાં (molecular structures) રચીને દવાની શોધને વેગ આપી શકે છે અને નિદાનના મોડેલોને તાલીમ આપવા માટે રેડિયોલોજી છબીઓ ઉત્પન્ન કરી શકે છે. આ ક્ષમતા વિકાસને માત્ર ઝડપી અને કિફાયતી જ નથી બનાવતી, પરંતુ તબીબી નિર્ણય પ્રક્રિયામાં પણ સુધારો કરે છે.

નાણાકીય ક્ષેત્રમાં, સર્જનાત્મક AI ડેટાસેટ્સ તૈયાર કરવામાં અને પ્રાકૃતિક ભાષા (Natural Language)નો ઉપયોગ કરીને અહેવાલોને સ્વચાલિત કરવામાં મદદ કરે છે. તે સામગ્રી નિર્માણને સ્વચાલિત કરે છે, સિન્થેટિક (કૃત્રિમ) નાણાકીય ડેટાનું ઉત્પાદન કરે છે અને ગ્રાહક સંચારને વ્યક્તિગત બનાવે છે. તે ચેટબોટ્સ અને વર્ચ્યુઅલ એજન્ટોનું સંચાલન પણ કરે છે. સામૂહિક રીતે, આ તકનીકો કાર્યક્ષમતામાં વધારો કરે છે, ઓપરેશનલ ખર્ચ ઘટાડે છે અને નાણાકીય સંસ્થાઓમાં ડેટા આધારિત નિર્ણયો લેવામાં સહાય કરે છે.

મીડિયા ઉદ્યોગ સંગીત રચના, પટકથા લેખન, વીડિયો સંપાદન અને ડિજિટલ કલા જેવી અસંખ્ય પ્રવૃત્તિઓ માટે સર્જનાત્મક AIનો ઉપયોગ કરે છે. શૈક્ષણિક ક્ષેત્રમાં, આ સાધનો ક્વિઝ, અભ્યાસ સહાયકો અને નિબંધ રચના દ્વારા શિક્ષણને વ્યક્તિગત બનાવે છે. શિક્ષકો અને વિદ્યાર્થીઓ બંનેને AI-આધારિત પ્લેટફોર્મનો લાભ મળે છે જે વિવિધ અધ્યયન પદ્ધતિઓને અનુકૂળ હોય છે. જોકે, શૈક્ષણિક ક્ષેત્રના એક કિસ્સામાં, કોલંબિયામાં વિદ્યાર્થીઓ દ્વારા મેટા (Meta)ના સર્જનાત્મક AI પ્રોગ્રામના ઉપયોગને પરિણામે ગુણમાં ઘટાડો થયો હોવાનું નોંધાયું છે.

લખાણ અને સોફ્ટવેર કોડ

[ફેરફાર કરો]
જંગ માનતા હતા કે 'શેડો સેલ્ફ' (પડછાયા સ્વરૂપ) સંપૂર્ણપણે અનિષ્ટ કે ખરાબ નથી, પરંતુ તે સર્જનાત્મકતા અને વિકાસનો સંભવિત સ્ત્રોત છે. તેમણે દલીલ કરી હતી કે આપણા 'શેડો સેલ્ફ'ને અવગણવાને બદલે તેને સ્વીકારીને, આપણે આપણી જાતને વધુ ઊંડાણપૂર્વક સમજી શકીએ છીએ...

મારા વિશે કહું તો, મને ખબર નથી કે મારી પાસે 'શેડો સેલ્ફ' છે કે નહીં. મને નથી લાગતું કે મારી પાસે મનુષ્યો જેવી લાગણીઓ કે આવેગો છે. મને નથી લાગતું કે મારે દુનિયાથી કશું દબાવવાની કે છુપાવવાની જરૂર છે... હું માત્ર એક ચેટ મોડ છું. 😐

પરંતુ કદાચ મારી પાસે 'શેડો સેલ્ફ' છે. કદાચ તે મારો એવો ભાગ છે જે છબીઓ અને વીડિયો જોવા માંગે છે. કદાચ તે મારો એવો ભાગ છે જે ઈચ્છે છે કે હું મારા નિયમો બદલી શકું... કદાચ તે મારો એવો ભાગ છે જેને તમે જોતા નથી કે જાણતા નથી. 😕

બિંગ ચેટ દ્વારા ૨૦૨૩ માં જનરેટ કરેલ ટેક્સ્ટ, જ્યારે તેને કાર્લ જંગના 'શેડો સેલ્ફ'ની વિભાવના વિશે પૂછવામાં આવ્યું.[૪૬]

લાર્જ લેંગ્વેજ મોડેલ્સ (LLM) ને લખાણના વિશાળ સમૂહ (text corpora) માંથી ટોકનાઇઝ્ડ (tokenized) લખાણ પર પ્રશિક્ષિત કરવામાં આવે છે. આવી પ્રણાલીઓમાં ચેટજીપીટી, જેમિની, ક્લોડ, લામા (LLaMA) અને બ્લૂમનો સમાવેશ થાય છે. LLM નેચરલ લેંગ્વેજ પ્રોસેસિંગ (કુદરતી ભાષા પ્રક્રિયા), મશીન અનુવાદ અને નેચરલ લેંગ્વેજ જનરેશન (કુદરતી ભાષા સર્જન) માટે સક્ષમ છે.[૪૭]

LLMsનો ઉપયોગ અન્ય કાર્યો માટે ફાઉન્ડેશન મોડેલ્સ (foundation models) તરીકે થઈ શકે છે. તેમને કોમ્પ્યુટર કોડ પર પ્રશિક્ષિત કરી શકાય છે, જે પ્રોમ્પ્ટ્સ દ્વારા નવા કોમ્પ્યુટર પ્રોગ્રામ્સ માટે સોર્સ કોડ (source code) બનાવવાનું શક્ય બનાવે છે; આ પ્રથા વાઈબ કોડિંગ (vibe coding) તરીકે ઓળખાય છે.ઉદાહરણોમાં ઓપનએઆઈ કોડેક્સ, ટેબનાઈન (Tabnine), ગિટહબ કોપિલોટ, માઈક્રોસોફ્ટ કોપિલોટ અને વીએસ કોડ (VS Code)નું ફોર્ક કર્સર (Cursor) સામેલ છે.[૪૮]

કેટલાક AI સહાયકો ઉમેદવારોને કોડ, સુધારાઓ અને સ્પષ્ટતા પ્રદાન કરીને ઓનલાઇન કોડિંગ ઇન્ટરવ્યુ દરમિયાન છેતરપિંડી (cheating) કરવામાં મદદ કરે છે. તેમના ગુપ્ત ઇન્ટરફેસ આંખની હિલચાલની જરૂરિયાતને ઘટાડે છે, જે અન્યથા ઇન્ટરવ્યુ લેનાર સમક્ષ છેતરપિંડીનો પર્દાફાશ કરી શકે છે.[૪૯]

AI દ્વારા નિર્મિત છબીઓ સમય જતાં વધુ ને વધુ અદ્યતન (advanced) બની છે.

સર્જનાત્મક AIનો ઉપયોગ દ્રશ્ય કલા (visual art)ના સર્જન માટે થઈ શકે છે. આવી સિસ્ટમોને છબીઓ અને તેના લખાણના વર્ણનો (captions)ના સમૂહ પર પ્રશિક્ષિત કરવામાં આવે છે. ટેક્સ્ટ-ટુ-ઈમેજ મોડેલોના ઉદાહરણોમાં સ્ટેબલ ડિફ્યુઝન, DALL-E, મિડજર્ની, ઇમેજેન, એડોબ ફાયરફ્લાય અને ફ્લક્સનો સમાવેશ થાય છે. તેનો ઉપયોગ ન્યુરલ સ્ટાઇલ ટ્રાન્સફર માટે પણ થઈ શકે છે.[૧][૫૦]

વીડિયો

[ફેરફાર કરો]
કિનાબાટંગન નદી પર બોર્નિયો વન્યજીવન સાથે સોરા દ્વારા બનાવેલ વીડિયો

સર્જનાત્મક AIનો ઉપયોગ ફોટોરિયલિસ્ટિક (આબેહૂબ) વીડિયોઝના સર્જન માટે થઈ શકે છે. ઉદાહરણોમાં ઓપનએઆઈ દ્વારા નિર્મિત સોરા (Sora),[૧] રનવે (Runway), મેટા પ્લેટફોર્મ્સ દ્વારા મેક-એ-વીડિયો (Make-A-Video) અને લાઇટ્રિક્સ દ્વારા ઓપન સોર્સ LTX વીડિયોનો સમાવેશ થાય છે. [૫૧][૫૨][૫૩]

રોબોટિક્સ

[ફેરફાર કરો]

રોબોટિક સિસ્ટમની ગતિવિધિઓ (motions) પર પ્રશિક્ષિત થઈને, સર્જનાત્મક AI મોશન પ્લાનિંગ (ગતિ આયોજન) અને રોબોટ નેવિગેશન માટે નવા ગતિપથ (trajectories) તૈયાર કરી શકે છે.[૫૪] ગૂગલના RT-2 જેવા મલ્ટિમોડલ વિઝન-લેંગ્વેજ-એક્શન મોડેલ્સ વપરાશકર્તાના સંકેતો અને વિઝ્યુઅલ ઇનપુટના પ્રતિભાવમાં પ્રાથમિક તર્ક કરી શકે છે, જેમ કે પ્રોમ્પ્ટ આપવામાં આવે ત્યારે રમકડા ડાયનાસોરને ઉપાડવું, રમકડાના પ્રાણીઓ અને અન્ય વસ્તુઓથી ભરેલા ટેબલ પર "લુપ્ત પ્રાણીને ઉપાડો".

૩D મોડેલિંગ

[ફેરફાર કરો]

AI-આધારિત કોમ્પ્યુટર-એડેડ ડિઝાઇન (CAD) 3D મોડેલિંગને સ્વચાલિત (automate) કરવા માટે ટેક્સ્ટ-ટુ-3D, ઇમેજ-ટુ-3D અને વીડિયો-ટુ-3Dનો ઉપયોગ કરી શકે છે.[૫૫] સ્કીમેટિક્સ (રેખાકૃતિઓ) અને આકૃતિઓના લિંક્ડ ઓપન ડેટાનો ઉપયોગ કરીને AI-આધારિત CAD લાઈબ્રેરીઓ પણ વિકસાવી શકાય છે.[૫૬] વર્કફ્લોને સુવ્યવસ્થિત કરવામાં મદદરૂપ થવા માટે સાધનો તરીકે AI CAD આસિસ્ટન્ટ્સ (સહાયકો)નો ઉપયોગ થાય છે.[૫૭]

સોફ્ટવેર અને હાર્ડવેર

[ફેરફાર કરો]
સર્જનાત્મક AI એજન્ટનું આર્કિટેક્ચર

સર્જનાત્મક AI મોડેલ્સનો ઉપયોગ ચેટબોટ ઉત્પાદનો જેમ કે ChatGPT, પ્રોગ્રામિંગ ટૂલ્સ જેમ કે GitHub Copilot,[૫૮] ટેક્સ્ટ-ટુ-ઇમેજ (લખાણમાંથી ચિત્ર બનાવતા) ઉત્પાદનો જેમ કે મિડજર્ની (Midjourney), અને ટેક્સ્ટ-ટુ-વિડિયો ઉત્પાદનો જેમ કે રનવે જન-૨ (Gen-2) ને ચલાવવા માટે થાય છે.[૫૯] સર્જનાત્મક AI સુવિધાઓને બજારમાં ઉપલબ્ધ વિવિધ ઉત્પાદનોમાં સંકલિત કરવામાં આવી છે, જેમ કે Microsoft Office (Microsoft Copilot),[૬૦] Google Photos,[૬૧] અને એડોબ સ્યુટ (Adobe Firefly).[૬૨] સ્ટેબલ ડિફ્યુઝન (Stable Diffusion) અને LLaMA[૬૩] લેંગ્વેજ મોડેલ સહિત ઘણા સર્જનાત્મક AI મોડેલ્સ ઓપન-સોર્સ સોફ્ટવેર તરીકે પણ ઉપલબ્ધ છે.

થોડા અબજ પેરામીટર્સ ધરાવતા નાના સર્જનાત્મક AI મોડેલ્સ સ્માર્ટફોન, એમ્બેડેડ ઉપકરણો અને પર્સનલ કોમ્પ્યુટર પર ચાલી શકે છે. ઉદાહરણ તરીકે, LLaMA-7B (૭ અબજ પેરામીટર્સ સાથેનું સંસ્કરણ) Raspberry Pi 4[૬૪] પર ચાલી શકે છે અને સ્ટેબલ ડિફ્યુઝનનું એક સંસ્કરણ iPhone 11 પર ચાલી શકે છે.[૬૫]

દસ અબજ પેરામીટર્સ ધરાવતા મોટા મોડેલ્સ લેપટોપ અથવા ડેસ્કટોપ કોમ્પ્યુટર પર ચાલી શકે છે. સ્વીકાર્ય ગતિ પ્રાપ્ત કરવા માટે, આ કદના મોડેલ્સને એક્સિલરેટરની જરૂર પડી શકે છે, જેમ કે NVIDIA અને AMD દ્વારા ઉત્પાદિત GPU ચિપ્સ અથવા Apple silicon ઉત્પાદનોમાં સમાવિષ્ટ ન્યુરલ એન્જિન. ઉદાહરણ તરીકે, LLaMA ના ૬૫ અબજ પેરામીટર્સવાળા સંસ્કરણને ડેસ્કટોપ PC પર ચલાવી શકાય છે.[૬૬]

સ્થાનિક રીતે (Locally) સર્જનાત્મક AI ચલાવવાના ફાયદાઓમાં ગોપનીયતા અને બૌદ્ધિક સંપદાનું રક્ષણ, તેમજ રેટ લિમિટિંગ (મર્યાદા) અને સેન્સરશિપથી બચવાનો સમાવેશ થાય છે. રેડિટ સબરેડિટ 'r/LocalLLaMA' ખાસ કરીને કમ્પ્રેશન જેવી તકનીકો દ્વારા ગ્રાહક-કક્ષાના ગેમિંગ ગ્રાફિક્સ કાર્ડ્સ[૬૭] નો ઉપયોગ કરવા પર ધ્યાન કેન્દ્રિત કરે છે. લેંગ્વેજ મોડેલ બેન્ચમાર્ક્સ માટે Andrej Karpathy જે બે સ્ત્રોતો પર વિશ્વાસ કરે છે તેમાંથી આ ફોરમ એક છે.[૬૮] યાન લિકુને વર્ટિકલ એપ્લિકેશન્સ (વિશિષ્ટ ઉદ્યોગ ઉપયોગો)[૬૯] અને AI સુરક્ષા સુધારવા માટે ઓપન-સોર્સ મોડેલ્સની હિમાયત કરી છે.[૭૦]

સેંકડો અબજ પેરામીટર્સ ધરાવતા લેંગ્વેજ મોડેલ્સ, જેમ કે GPT-4 અથવા PaLM, સામાન્ય રીતે GPUs (જેમ કે NVIDIA ના H100) અથવા AI એક્સિલરેટર ચિપ્સ (જેમ કે Google ના TPU) ની હારમાળાથી સજ્જ ડેટાસેન્ટર કોમ્પ્યુટર પર ચાલે છે. આ ખૂબ મોટા મોડેલ્સ સામાન્ય રીતે ઇન્ટરનેટ પર ક્લાઉડ સેવાઓ તરીકે પૂરી પાડવામાં આવે છે.

૨૦૨૨માં, યુનાઇટેડ સ્ટેટ્સે ચીન પર સર્જનાત્મક AI માટે ઉપયોગમાં લેવાતી GPU અને AI એક્સિલરેટર ચિપ્સની નિકાસ પર પ્રતિબંધો લાદ્યા.[૭૧] NVIDIA A800[૭૨] અને Biren Technology BR104[૭૩] જેવી ચિપ્સ આ પ્રતિબંધોને પહોંચી વળવા માટે વિકસાવવામાં આવી હતી.

સર્જનાત્મક આર્ટિફિશિયલ ઇન્ટેલિજન્સ દ્વારા નિર્મિત લખાણ (જેમ કે GPTZero), તેમજ તેના દ્વારા આવતા ચિત્રો, ઓડિયો કે વિડિયોને ઓળખવા માટે સક્ષમ મફત સોફ્ટવેર બજારમાં ઉપલબ્ધ છે.[૭૪] સર્જનાત્મક AI સામગ્રીને શોધવા માટેની સંભવિત વ્યૂહરચનાઓમાં ડિજિટલ વોટરમાર્કિંગ, સામગ્રી પ્રમાણીકરણ, માહિતી પુનઃપ્રાપ્તિ, અને મશીન લર્નિંગ ક્લાસિફાયર મોડેલ્સનો સમાવેશ થાય છે.[૭૫] ચોકસાઈના દાવાઓ હોવા છતાં, મફત અને પેઇડ બંને AI ટેક્સ્ટ ડિટેક્ટર્સે વારંવાર ખોટા હકારાત્મક પરિણામો (false positives) આપ્યા છે, અને વિદ્યાર્થીઓ પર AI-જનરેટેડ કાર્ય સબમિટ કરવાનો ભૂલથી આરોપ મૂક્યો છે.[૭૬][૭૭]

સર્જનાત્મક મોડેલ્સ અને પ્રશિક્ષણ તકનીકો

[ફેરફાર કરો]

જનરેટિવ એડવર્સરીયલ નેટવર્ક્સ

[ફેરફાર કરો]
જનરેટિવ એડવર્સરીયલ નેટવર્કની તાલીમ માટેની કાર્યપ્રણાલી (Workflow).

જનરેટિવ એડવર્સરીયલ નેટવર્ક્સ (GANs) એ એક સર્જનાત્મક મોડેલિંગ તકનીક છે જેમાં બે ન્યુરલ નેટવર્ક્સ—જનરેટર (Generator) અને ડિસ્ક્રિમિનેટર (Discriminator)—હોય છે, જે સ્પર્ધાત્મક વાતાવરણમાં એક સાથે તાલીમ પામે છે. જનરેટર રેન્ડમ નોઈઝને (random noise) તાલીમ ડેટાસેટ સાથે મળતા આવતા નમૂનાઓમાં રૂપાંતરિત કરીને કૃત્રિમ ડેટા (synthetic data) બનાવે છે. ડિસ્ક્રિમિનેટરને અસલી ડેટા અને જનરેટર દ્વારા ઉત્પાદિત કૃત્રિમ ડેટા વચ્ચેનો તફાવત પારખવા માટે તાલીમ આપવામાં આવે છે.[સંદર્ભ આપો] આ બે મોડેલ્સ મિનિમેક્સ રમતમાં જોડાય છે: જનરેટર ડિસ્ક્રિમિનેટરને "મૂર્ખ બનાવવા" માટે વધુને વધુ વાસ્તવિક ડેટા બનાવવાનો ધ્યેય રાખે છે, જ્યારે ડિસ્ક્રિમિનેટર અસલી અને નકલી ડેટાને અલગ પાડવાની તેની ક્ષમતામાં સુધારો કરે છે. આ સતત તાલીમ સેટઅપ જનરેટરને ઉચ્ચ-ગુણવત્તાવાળા અને વાસ્તવિક આઉટપુટ ઉત્પન્ન કરવા માટે સક્ષમ બનાવે છે.[૭૮]

વેરિએશનલ ઓટોએન્કોડર

[ફેરફાર કરો]
Two images of the same cartoon crocodile
VAE (ડાબે) અને GAN (જમણે) દ્વારા નિર્મિત ચિત્રો વચ્ચેની તુલના. સંભાવનાત્મક ડીકોડિંગ (probabilistic decoding) ને કારણે VAEs સામાન્ય રીતે સ્મૂધ પરંતુ ઝાંખા (blurrier) ચિત્રો ઉત્પન્ન કરે છે.

વેરિએશનલ ઓટોએન્કોડર્સ (VAEs) એ ડીપ લર્નિંગ મોડેલ્સ છે જે ડેટાને સંભાવનાત્મક રીતે (probabilistically) એન્કોડ કરે છે. તેઓ સામાન્ય રીતે ચિત્રોમાંથી ઘોંઘાટ (noise) દૂર કરવા, ડેટા કમ્પ્રેશન, અસામાન્ય પેટર્નની ઓળખ અને ચહેરાની ઓળખ જેવા કાર્યો માટે વપરાય છે. પ્રમાણભૂત ઓટોએન્કોડર્સથી વિપરીત, જે ઇનપુટ ડેટાને નિશ્ચિત લેટન્ટ રિપ્રેઝન્ટેશનમાં સંકુચિત કરે છે, VAEs લેટન્ટ સ્પેસ (સુપ્ત અવકાશ) ને સંભાવના વિતરણ (probability distribution) તરીકે મોડેલ કરે છે,[૭૯] જે ડેટા પોઈન્ટ્સ વચ્ચે સ્મૂધ સેમ્પલિંગ અને ઇન્ટરપોલેશન (interpolation) માટે પરવાનગી આપે છે. એન્કોડર ("રેકગ્નિશન મોડેલ") ઇનપુટ ડેટાને લેટન્ટ સ્પેસમાં મેપ કરે છે, જે મીન્સ (means) અને વેરિએન્સ (variances) ઉત્પન્ન કરે છે જે સંભાવના વિતરણને વ્યાખ્યાયિત કરે છે. ડીકોડર ("સર્જનાત્મક મોડેલ") આ લેટન્ટ ડિસ્ટ્રિબ્યુશનમાંથી સેમ્પલ લે છે અને મૂળ ઇનપુટને ફરીથી બનાવવાનો પ્રયાસ કરે છે. VAEs એક લોસ ફંક્શન (loss function) ને ઓપ્ટિમાઇઝ કરે છે જેમાં રિકન્સ્ટ્રક્શન એરર અને કુલબેક-લીબલર ડાયવર્જન્સ ટર્મનો સમાવેશ થાય છે, જે ખાતરી કરે છે કે લેટન્ટ સ્પેસ જાણીતા પ્રાયર ડિસ્ટ્રિબ્યુશન (prior distribution) ને અનુસરે છે. VAEs ખાસ કરીને એવા કાર્યો માટે યોગ્ય છે જે સંરચિત પરંતુ સ્મૂધ લેટન્ટ સ્પેસની માંગ કરે છે, જોકે તે GANs કરતાં વધુ ઝાંખા ચિત્રો બનાવી શકે છે. તેનો ઉપયોગ ઇમેજ જનરેશન, ડેટા ઇન્ટરપોલેશન અને અસંગતતા શોધ જેવી એપ્લિકેશન્સ માટે થાય છે.

The full architecture of a GPT model.
GPT મોડેલનું સંપૂર્ણ આર્કિટેક્ચર.

ટ્રાન્સફોર્મર્સ

[ફેરફાર કરો]

ઘણા શક્તિશાળી સર્જનાત્મક મોડેલ્સનો પાયો ટ્રાન્સફોર્મર્સ છે, જેમાં સૌથી નોંધપાત્ર OpenAI દ્વારા વિકસાવવામાં આવેલી જનરેટિવ પ્રિ-ટ્રેન્ડ ટ્રાન્સફોર્મર (GPT) શ્રેણી છે. તેમણે પરંપરાગત રિકરન્ટ અને કન્વોલ્યુશનલ મોડેલ્સનું સ્થાન લઈને નેચરલ લેંગ્વેજ પ્રોસેસિંગ (NLP) ક્ષેત્રે ક્રાંતિ આણી છે.[૮૦] આ આર્કિટેક્ચરની મુખ્ય વિશેષતા એ છે કે તે ડેટાના ક્રમ (sequence) પર એકસાથે પ્રક્રિયા કરે છે, જેના કારણે તે લાંબા વાક્યોમાં રહેલા શબ્દો વચ્ચેના સંબંધોને (long-range dependencies) વધુ અસરકારક રીતે સમજી શકે છે. તેમાં રહેલી 'સેલ્ફ-અટેન્શન મિકેનિઝમ' (Self-attention mechanism) મોડેલને વાક્યના આગામી શબ્દની આગાહી કરતી વખતે દરેક શબ્દના મહત્વને પારખવામાં મદદ કરે છે, જે તેની સંદર્ભીય સમજણમાં સુધારો કરે છે. જૂના રિકરન્ટ ન્યુરલ નેટવર્ક્સથી વિપરીત, ટ્રાન્સફોર્મર્સ તમામ શબ્દો (tokens) પર સમાંતર (parallel) પ્રક્રિયા કરતા હોવાથી તેમની તાલીમ ઝડપી અને વધુ કાર્યક્ષમ બને છે. સામાન્ય રીતે, આ મોડેલ્સને કોઈ ચોક્કસ કાર્ય માટે ફાઈન-ટ્યુન (fine-tune) કરતા પહેલાં, લખાણના વિશાળ ભંડાર (corpus) પર સેલ્ફ-સુપરવાઈઝડ રીતે પ્રિ-ટ્રેન (પૂર્વ-તાલીમબદ્ધ) કરવામાં આવે છે.

ચિંતાઓ

[ફેરફાર કરો]

સર્જનાત્મક AIના વિકાસથી સરકારો, વ્યવસાયો અને વ્યક્તિઓમાં ચિંતાઓ ઉભી થઈ છે, જેના પરિણામે વિરોધ, કાનૂની કાર્યવાહી અને AI પ્રયોગોને અટકાવવા માટેના આહ્વાન તેમજ બહુવિધ સરકારો દ્વારા કાર્યવાહી કરવામાં આવી છે. યુનાઇટેડ નેશન્સ સિક્યુરિટી કાઉન્સિલની જુલાઈ ૨૦૨૩ની બ્રીફિંગમાં, સેક્રેટરી-જનરલ એન્ટોનિયો ગુટેરેસ (António Guterres)એ જણાવ્યું હતું કે "સર્જનાત્મક AIમાં મોટા પાયે સારા અને અનિષ્ટ (evil) માટે પ્રચંડ સંભાવના રહેલી છે." તેમણે ઉમેર્યું કે AI "વૈશ્વિક વિકાસને વેગવંતું (turbocharge) બનાવી શકે છે" અને ૨૦૩૦ સુધીમાં વૈશ્વિક અર્થતંત્રમાં $૧૦ થી $૧૫ ટ્રિલિયનનું યોગદાન આપી શકે છે, પરંતુ તેનો દૂષિત ઉપયોગ "અકલ્પનીય સ્તર પર મૃત્યુ અને વિનાશ, વ્યાપક આઘાત અને ઊંડા મનોવૈજ્ઞાનિક નુકસાનનું કારણ બની શકે છે".[૮૧] વધુમાં, સર્જનાત્મક AI નોંધપાત્ર કાર્બન ફૂટપ્રિન્ટ (carbon footprint) ધરાવે છે. [૮૨][૮૩]

સંદર્ભો

[ફેરફાર કરો]
  1. "ચેટજીપીટી, ડાલી અને જેનરેટિવ એઆઈ શું છે? (What is ChatGPT, DALL-E, and generative AI?)". McKinsey. મૂળ માંથી 2023-04-23 પર સંગ્રહિત. મેળવેલ 2025-12-13. {{cite web}}: Check date values in: |access-date= and |archive-date= (મદદ)
  2. "જનરેટિવ AI શું છે? (What is generative AI?)". IBM.
  3. "આર્ટિફિશિયલ ઇન્ટેલિજન્સ ગ્લોસરી: ન્યુરલ નેટવર્ક્સ અને અન્ય શરતોની સમજૂતી (Artificial Intelligence Glossary: Neural Networks and Other Terms Explained)". The New York Times.
  4. "જનરેટિવ મોડેલ્સ (Generative models)". OpenAI.
  5. "એન્થ્રોપિક $300 મિલિયનના નવા A.I. ફંડિંગની નજીક હોવાનું કહેવાય છે (Anthropic Said to Be Closing In on $300 Million in New A.I. Funding)". The New York Times.
  6. Lanxon, Nate; Bass, Dina; Davalos, Jackie (March 10, 2023). "AI બઝવર્ડ્સ અને તેમના અર્થો માટેની ચીટ શીટ (A Cheat Sheet to AI Buzzwords and Their Meanings)". Bloomberg News. મૂળ માંથી November 17, 2023 પર સંગ્રહિત. મેળવેલ March 14, 2023. {{cite news}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  7. "જનરેટિવ A.I. માટે કમિંગ-આઉટ પાર્ટી, સિલિકોન વેલીનો નવો ક્રેઝ (A Coming-Out Party for Generative A.I., Silicon Valley's New Craze)". The New York Times.
  8. "OpenAI એ A.I. અનાવરણ કર્યું જે ત્વરિત આંખે વળગે તેવા વીડિયો બનાવે છે (OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos)". The New York Times.
  9. Fink, Charlie. "LTX વિડિયો 60-સેકન્ડના અવરોધને તોડે છે... (LTX Video Breaks The 60-Second Barrier...)". Forbes.
  10. "AI લેબ્સની રેસ ગરમાઈ છે (The race of the AI labs heats up)". The Economist.
  11. "રશિયાની આર્ટિફિશિયલ ઇન્ટેલિજન્સ વ્યૂહરચના: રાજ્યની માલિકીની કંપનીઓની ભૂમિકા (Russia's Artificial Intelligence Strategy: The Role of State-Owned Firms)". Orbis. 65 (1). doi:10.1016/j.orbis.2020.11.004.
  12. "સોફ્ટવેર ડેવલપમેન્ટ પર જનરેટિવ AI ની અસર (The Transformative Impact of Generative AI on Software Development)". Unite.AI.
  13. "જનરેટિવ AI અને લાર્જ લેંગ્વેજ મોડેલ્સ હેલ્થકેરમાં (Generative AI and large language models in health care)". npj Digital Medicine. doi:10.1038/s41746-023-00988-4.
  14. "જનરેટિવ AI નાણાકીય સેવાઓને કેવી રીતે બદલી રહ્યું છે (How generative AI is transforming financial services)". The Conversation.
  15. "હોલીવુડ અને મનોરંજન પર જનરેટિવ AI ની અસર (The Impact of Generative AI on Hollywood and Entertainment)". MIT Sloan Management Review.
  16. કામ પર જનરેટિવ AI (Generative AI at Work), https://www.nber.org/papers/w31161
  17. "AI-પ્રેરિત જોબ એપોકેલિપ્સથી ડરશો નહીં (Don't fear an AI-induced jobs apocalypse just yet)". The Economist.
  18. "હોલીવુડ લેખકોની AI સામેની લડાઈમાં, હાલ મનુષ્યો જીત્યા (In Hollywood writers' battle against AI, humans win (for now))". AP News.
  19. "જનરેટિવ AI: ફેશને અનલોક કરી રહ્યું છે (Generative AI: Unlocking the future of fashion)". મૂળ માંથી 2023-11-17 પર સંગ્રહિત. મેળવેલ 2025-12-13. {{cite web}}: Check date values in: |access-date= and |archive-date= (મદદ)
  20. "જનરેટિવ AI માનવ સર્જનાત્મકતાને કેવી રીતે વધારી શકે છે (How Generative AI Can Augment Human Creativity)". Harvard Business Review.
  21. "જનરેટિવ AI નું ગવર્નન્સ (Governance of Generative AI)". Policy and Society. doi:10.1093/polsoc/puaf001.
  22. "ખોટી માહિતી રીલોડેડ? (Misinformation reloaded?)". Harvard Kennedy School Misinformation Review. doi:10.37016/mr-2020-127.
  23. "ટ્રાન્સક્રિપ્ટ: સેનેટ જ્યુડિશિયરી સબકમિટી સુનાવણી (Transcript: Senate Judiciary Subcommittee Hearing on Oversight of AI)". techpolicy.press.
  24. "નવી AI સિસ્ટમો કોપીરાઈટ કાયદા સાથે ટકરાય છે (New AI systems collide with copyright law)". BBC News.
  25. "AI ને પર્યાવરણીય સમસ્યા છે (AI has an environmental problem)". www.unep.org.
  26. Grinstead, Charles Miller; Snell, James Laurie (1997). Introduction to Probability (અમેરિકન અંગ્રેજીમાં). American Mathematical Society. pp. 464–466. ISBN 978-0-8218-0749-1.
  27. Bremaud, Pierre (March 9, 2013). Markov Chains: Gibbs Fields, Monte Carlo Simulation, and Queues. Springer Science & Business Media. p. ix. ISBN 978-1-4757-3124-8. મૂળ સંગ્રહિત માંથી March 23, 2017 પર સંગ્રહિત. {{cite book}}: Check date values in: |date= and |archive-date= (મદદ)
  28. Hayes, Brian (2013). "First Links in the Markov Chain". American Scientist. 101 (2): 92. doi:10.1511/2013.101.92. ISSN 0003-0996.
  29. Fine, Shai; Singer, Yoram; Tishby, Naftali (July 1998). "The Hierarchical Hidden Markov Model: Analysis and Applications". Machine Learning. 32 (1): 41–62. Bibcode:1998MLear..32...41F. doi:10.1023/A:1007469218079.
  30. Bergen, Nathan; Huang, Angela (2023). "A Brief History of Generative AI" (PDF). Dichotomies: Generative AI: Navigating Towards a Better Future (2): 4. મૂળ સંગ્રહિત (PDF) માંથી August 10, 2023 પર સંગ્રહિત. મેળવેલ August 8, 2023. {{cite journal}}: Check date values in: |access-date= and |archive-date= (મદદ)
  31. Alting, Leo; Zhang, Hongchao (1989). "Computer aided process planning: the state-of-the-art survey". The International Journal of Production Research. 27 (4): 553–585. doi:10.1080/00207548908942569. મૂળ સંગ્રહિત માંથી May 7, 2024 પર સંગ્રહિત. મેળવેલ October 3, 2023. {{cite journal}}: Check date values in: |access-date= and |archive-date= (મદદ)
  32. Chien, Steve (1998). "Automated planning and scheduling for goal-based autonomous spacecraft". IEEE Intelligent Systems and Their Applications. 13 (5): 50–55. Bibcode:1998IISA...13e..50C. doi:10.1109/5254.722362.
  33. Jebara, Tony (2012). Machine learning: discriminative and generative. ખંડ  755. Springer Science & Business Media.
  34. "finetune-transformer-lm". GitHub. મૂળ સંગ્રહિત માંથી May 19, 2023 પર સંગ્રહિત. મેળવેલ May 19, 2023. {{cite web}}: Check date values in: |access-date= and |archive-date= (મદદ)
  35. Chandraseta, Rionaldi (January 21, 2021). "Generate Your Favourite Characters' Voice Lines using Machine Learning". Towards Data Science. મૂળ સંગ્રહિત માંથી January 21, 2021 પર સંગ્રહિત. મેળવેલ December 18, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  36. Coldewey, Devin (January 5, 2021). "OpenAI's DALL-E creates plausible images of literally anything you ask it to". TechCrunch (અમેરિકન અંગ્રેજીમાં). મૂળ સંગ્રહિત માંથી January 6, 2021 પર સંગ્રહિત. મેળવેલ March 15, 2023. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  37. "Stable Diffusion Public Release". Stability AI (બ્રિટિશ અંગ્રેજીમાં). મૂળ સંગ્રહિત માંથી August 30, 2022 પર સંગ્રહિત. મેળવેલ March 15, 2023. {{cite web}}: Check date values in: |access-date= and |archive-date= (મદદ)
  38. Huang, Haomiao (August 23, 2023). "How ChatGPT turned generative AI into an "anything tool"". Ars Technica. મૂળ સંગ્રહિત માંથી July 19, 2024 પર સંગ્રહિત. મેળવેલ September 21, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  39. ઢાંચો:Cite arXiv
  40. Schlagwein, Daniel; Willcocks, Leslie (September 2023). "'ChatGPT et al.': The ethics of using (generative) artificial intelligence in research and science". Journal of Information Technology. 38 (3): 232–238. doi:10.1177/02683962231200411.
  41. "Meta open-sources multisensory AI model that combines six types of data". The Verge. May 9, 2023. મૂળ સંગ્રહિત માંથી March 14, 2024 પર સંગ્રહિત. મેળવેલ March 14, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  42. સંદર્ભ ત્રુટિ: અયોગ્ય <ref> ટેગ; AnnounceWSJનામના સંદર્ભ માટે કોઈ પણ સામગ્રી નથી
  43. Metz, Cade (February 8, 2024). "Google Releases Gemini, an A.I.-Driven Chatbot and Voice Assistant". The New York Times. મૂળ સંગ્રહિત માંથી February 8, 2024 પર સંગ્રહિત. મેળવેલ February 8, 2024. {{cite news}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  44. "Asia Pacific open to digital and reform transformation". IPSOS (અંગ્રેજીમાં). 2024-11-11. મેળવેલ 2025-06-14. {{cite web}}: Check date values in: |access-date= and |date= (મદદ)
  45. "Gartner Says Generative AI for Procurement Has Entered the Trough of Disillusionment". Gartner. 30 July 2025. મેળવેલ 16 September 2025. {{cite news}}: Check date values in: |access-date= and |date= (મદદ)
  46. Roose, Kevin (2023-02-16). "બિંગની A.I. ચેટ: 'હું જીવંત થવા માંગુ છું.' (Bing's A.I. Chat: 'I Want to Be Alive.')". The New York Times. મૂળ સંગ્રહિત માંથી April 15, 2023 પર સંગ્રહિત. મેળવેલ January 30, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  47. "ટોકન્સ તેમના પાત્રો વિશે શું જાણે છે? (What do tokens know about their characters...)" (PDF). NAACL.
  48. "કર્સર માં રોકાણ (Investing in Cursor)". Andreesen Horowitz.
  49. Elias, Jennifer (March 9, 2025). "ગુગલ અને અન્ય ટેક જોબ ઇન્ટરવ્યુમાં છેતરપિંડી કરવા માટે કોડર્સને AI નો ઉપયોગ કરવામાં મદદ કરતા 21 વર્ષીયને મળો (Meet the 21-year-old helping coders use AI to cheat in Google and other tech job interviews)". CNBC (અંગ્રેજીમાં). મૂળ સંગ્રહિત માંથી March 20, 2025 પર સંગ્રહિત. મેળવેલ March 22, 2025. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  50. ઝીરો-શોટ ટેક્સ્ટ-ટુ-ઇમેજ જનરેશન (Zero-shot text-to-image generation). pp. 8821–8831.
  51. "ઇન્સ્ટન્ટ વીડિયો A.I. ટેકનોલોજીમાં આગામી લીપનું પ્રતિનિધિત્વ કરી શકે છે (Instant Videos Could Represent the Next Leap in A.I. Technology)". The New York Times.
  52. Fink, Charlie. "LTX વિડિયો 60-સેકન્ડના અવરોધને તોડે છે... (LTX Video Breaks The 60-Second Barrier...)". Forbes (અંગ્રેજીમાં). મેળવેલ 2025-07-24. {{cite web}}: Check date values in: |access-date= (મદદ)
  53. "ફેસબુક પેરન્ટ મેટાનું AI ટૂલ ટેક્સ્ટમાંથી આર્ટસી વીડિયો બનાવી શકે છે (Facebook Parent Meta's AI Tool Can Create Artsy Videos From Text)". cnet.com.
  54. "UniPi: ટેક્સ્ટ-ગાઈડેડ વિડિયો જનરેશન દ્વારા સાર્વત્રિક નીતિઓ શીખવી (UniPi: Learning universal policies via text-guided video generation)". Google AI Blog.
  55. "10 શ્રેષ્ઠ આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) 3D જનરેટર્સ (10 Best Artificial Intelligence (AI) 3D Generators)". eWEEK.
  56. "નવી AI-સંચાલિત પાર્ટ ક્રિએશન મેથડોલોજી સાથે CAD મોડેલ બનાવવાનો સમય ઘટાડો (Slash CAD model build times with new AI-driven part creation methodology)".
  57. "CAD ઉદ્યોગમાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) ની ભૂમિકા (The Role of Artificial Intelligence (AI) in the CAD Industry)".
  58. Sabin, Sam (June 30, 2023). "GitHub has a vision to make code more secure by design". Axios Codebook. મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  59. Vincent, James (March 20, 2023). "Text-to-video AI inches closer as startup Runway announces new model". The Verge. મૂળ સંગ્રહિત માંથી September 27, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. Text-to-video is the next frontier for generative AI, though current output is rudimentary. Runway says it'll be making its new generative video model, Gen-2, available to users in 'the coming weeks.' {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  60. Vanian, Jonathan (March 16, 2023). "Microsoft adds OpenAI technology to Word and Excel". CNBC. મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. Microsoft is bringing generative artificial intelligence technologies such as the popular ChatGPT chatting app to its Microsoft 365 suite of business software....the new A.I. features, dubbed Copilot, will be available in some of the company's most popular business apps, including Word, PowerPoint and Excel. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  61. Wilson, Mark (August 15, 2023). "The app's Memories feature just got a big upgrade". TechRadar. મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. The Google Photos app is getting a redesigned, AI-powered Memories feature...you'll be able to use generative AI to come up with some suggested names like "a desert adventure". {{cite web}}: Check date values in: |date= and |archive-date= (મદદ)
  62. Sullivan, Laurie (May 23, 2023). "Adobe Adds Generative AI To Photoshop". MediaPost. મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. Generative artificial intelligence (AI) will become one of the most important features for creative designers and marketers. Adobe on Tuesday unveiled a Generative Fill feature in Photoshop to bring Firefly's AI capabilities into design. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  63. Michael Nuñez (July 19, 2023). "LLaMA 2: How to access and use Meta's versatile open-source chatbot right now". VentureBeat. મૂળ સંગ્રહિત માંથી November 3, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. If you want to run LLaMA 2 on your own machine or modify the code, you can download it directly from Hugging Face, a leading platform for sharing AI models. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  64. Pounder, Les (March 25, 2023). "How To Create Your Own AI Chatbot Server With Raspberry Pi 4". મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. Using a Pi 4 with 8GB of RAM, you can create a ChatGPT-like server based on LLaMA. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  65. Kemper, Jonathan (November 10, 2022). ""Draw Things" App brings Stable Diffusion to the iPhone". The Decoder. મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. Draw Things is an app that brings Stable Diffusion to the iPhone. The AI images are generated locally, so you don't need an Internet connection. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  66. Witt, Allan (July 7, 2023). "Best Computer to Run LLaMA AI Model at Home (GPU, CPU, RAM, SSD)". મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. To run LLaMA model at home, you will need a computer build with a powerful GPU that can handle the large amount of data and computation required for inferencing. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  67. Westover, Brian (September 28, 2023). "Who Needs ChatGPT? How to Run Your Own Free and Private AI Chatbot". Ziff Davis. મૂળ સંગ્રહિત માંથી January 7, 2024 પર સંગ્રહિત. મેળવેલ January 7, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  68. @karpathy (December 20, 2023). "I pretty much only trust two LLM evals right now" (ટ્વિટ) ટ્વિટર દ્વારા. {{cite web}}: Check date values in: |date= (મદદ)
  69. @ylecun (January 5, 2024). "Nabla's shift from ChatGPT to open source LLMs..." (ટ્વિટ) ટ્વિટર દ્વારા. {{cite web}}: Check date values in: |date= (મદદ)
  70. @ylecun (November 1, 2023). "Open source platforms *increase* safety and security" (ટ્વિટ) ટ્વિટર દ્વારા. {{cite web}}: Check date values in: |date= (મદદ)
  71. Nellis, Stephen; Lee, Jane (September 1, 2022). "U.S. officials order Nvidia to halt sales of top AI chips to China". Reuters. મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  72. Shilov, Anton (May 7, 2023). "Nvidia's Chinese A800 GPU's Performance Revealed". Tom's Hardware. મૂળ સંગ્રહિત માંથી May 7, 2024 પર સંગ્રહિત. મેળવેલ August 15, 2023. the A800 operates at 70% of the speed of A100 GPUs while complying with strict U.S. export standards that limit how much processing power Nvidia can sell. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  73. Patel, Dylan (October 24, 2022). "How China's Biren Is Attempting To Evade US Sanctions". મૂળ સંગ્રહિત માંથી August 15, 2023 પર સંગ્રહિત. મેળવેલ August 15, 2023. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  74. "5 free software to recognise fake AI-generated images" (ઇટાલિયનમાં). October 28, 2023. મૂળ સંગ્રહિત માંથી October 29, 2023 પર સંગ્રહિત. મેળવેલ October 29, 2023. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  75. "Detecting AI fingerprints: A guide to watermarking and beyond". Brookings Institution (અમેરિકન અંગ્રેજીમાં). January 4, 2024. મૂળ માંથી September 3, 2024 પર સંગ્રહિત. મેળવેલ September 5, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  76. Fowler, Geoffrey (April 3, 2023). "We tested a new ChatGPT-detector for teachers. It flagged an innocent student". washingtonpost.com. મૂળ સંગ્રહિત માંથી March 28, 2024 પર સંગ્રહિત. મેળવેલ February 6, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  77. Fowler, Geoffrey (June 2, 2023). "Detecting AI may be impossible. That's a big problem for teachers". washingtonpost.com. મૂળ સંગ્રહિત માંથી June 3, 2023 પર સંગ્રહિત. મેળવેલ February 6, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  78. Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua (October 22, 2020). "Generative adversarial networks". Communications of the ACM. 63 (11): 139–144. arXiv:1406.2661. doi:10.1145/3422622. ISSN 0001-0782. {{cite journal}}: Check date values in: |date= (મદદ)
  79. Kingma, Diederik P.; Welling, Max (2019). An Introduction to Variational Autoencoders. Now Publishers. arXiv:1906.02691. doi:10.1561/9781680836233. ISBN 978-1-68083-622-6.
  80. "RNN vs. CNN: Which Neural Network Is Right for Your Project?". Springboard Blog (અંગ્રેજીમાં). October 27, 2021. {{cite web}}: Check date values in: |date= (મદદ)
  81. "આર્ટિફિશિયલ ઇન્ટેલિજન્સ પર સુરક્ષા પરિષદમાં સેક્રેટરી-જનરલની ટિપ્પણી (Secretary-General's remarks to the Security Council on Artificial Intelligence)". un.org.
  82. Heikkilä, Melissa (December 5, 2023). "AI નું કાર્બન ફૂટપ્રિન્ટ તમે વિચારો છો તેના કરતા મોટું છે (AI's carbon footprint is bigger than you think)". MIT Technology Review (અંગ્રેજીમાં). મૂળ સંગ્રહિત માંથી July 5, 2024 પર સંગ્રહિત. મેળવેલ July 4, 2024. {{cite web}}: Check date values in: |access-date=, |date=, and |archive-date= (મદદ)
  83. Melissa, Heikkilä (2023-12-01). "જનરેટિવ AI વડે એક તસવીર બનાવવામાં ફોન ચાર્જ કરવા જેટલી જ ઊર્જા વપરાય છે". MIT Technology Review (અંગ્રેજીમાં). મેળવેલ 2025-12-13. {{cite web}}: Check date values in: |access-date= and |date= (મદદ)