
ဂူးဂဲလ်က ထုတ်ပြန်လိုက်သည့် TurboQuant နည်းပညာကြောင့် မန်မိုရီကုမ္ပဏီများ၏ ရှယ်ယာဈေးနှုန်းများ ဖိအားသက်ရောက်ခဲ့သော်လည်း AI လုပ်ငန်းတစ်ခုလုံး၏ ဝယ်လိုအား ဆက်လက်မြင့်တက်နေသဖြင့် မန်မိုရီချစ်ပ်ဝယ်လိုအား သိသိသာသာ လျော့ကျမသွားနိုင်ကြောင်း လေ့လာသူများက သုံးသပ်ထားသည်။
Google Research က အင်္ဂါနေ့တွင် ကြေညာခဲ့သည့် TurboQuant သည် AI ထိရောက်မှုကို မြှင့်တင်ရန် ရည်ရွယ်ထုတ်လုပ်ထားသည့် compression နည်းပညာတစ်ခု ဖြစ်သည်။ အဆိုပါနည်းပညာသည် AI မော်ဒယ်များအသုံးပြုသည့် key value cache memory (KV cache) ကို 3 bits အထိ ဖိသိပ်နိုင်ပြီး အရွယ်အစားကို ၆ ဆကျော် လျှော့ချနိုင်ကြောင်း ဆိုသည်။ KV cache သည် မော်ဒယ်တစ်ခုအနေဖြင့် နောက်ထပ်ထုတ်မည့် စကားလုံးများကို ပိုမိုလျင်မြန်စွာ ခန့်မှန်းနိုင်ရန် တွက်ချက်ပြီးသား key နှင့် value များကို ယာယီသိမ်းဆည်းထားသည့် short-term memory ဖြစ်သည်။ ယင်းသို့ ၆ ဆ လျှော့ချနိုင်ခြင်းကြောင့် လက်ရှိအသုံးပြုနေသည့် မန်မိုရီပမာဏ၏ ခန့်မှန်းအားဖြင့် ၆ ပုံ ၁ ပုံခန့်ဖြင့်ပင် အလားတူ စွမ်းဆောင်ရည် ရရှိနိုင်သည်ဟု ရှင်းပြထားသည်။
AI ဝန်ဆောင်မှုများ ပိုမိုရှုပ်ထွေးလာသည်နှင့်အမျှ KV cache ကြောင့် ဖြစ်ပေါ်လာသည့် ဖိအားကို လုပ်ငန်းရှင်များက ဖြေရှင်းနည်းများ ရှာဖွေနေပြီး high-bandwidth memory (HBM) ကဲ့သို့သော AI မန်မိုရီချစ်ပ်များ၏ ဝယ်လိုအားမှာလည်း ဆက်လက်အားကောင်းနေဆဲဖြစ်သည်။ အဆင့်မြင့် NAND သိုလှောင်မှုကို HBM အတွက် အထောက်အကူပြုရန် အသုံးပြုနိုင်မလားဆိုသည့် ဆွေးနွေးမှုများလည်း ပေါ်ပေါက်လာခဲ့သည်။
TurboQuant ကို စီးပွားဖြစ်အသုံးပြုလာနိုင်မည့် မျှော်လင့်ချက်ကြောင့် မန်မိုရီကုမ္ပဏီများ၏ ရှယ်ယာများ ဖိအားခံခဲ့ရပြီး Samsung Electronics က ကြာသပတေးနေ့တွင် 4.71% ကျဆင်းခဲ့သလို SK hynix က 6.23% လျော့ကျခဲ့သည်။ Micron လည်း အဆိုပါနေ့တွင် 6.97% ကျဆင်းခဲ့ပြီး သောကြာနေ့တွင် Samsung Electronics နှင့် SK hynix တို့က ထပ်မံကျဆင်းကာ 0.22% နှင့် 1.18% အသီးသီး လျော့နည်းခဲ့သည်။
သို့သော် လေ့လာသူများက TurboQuant ကြောင့် မန်မိုရီအသုံးပြုမှု လျော့နည်းနိုင်သော်လည်း စုစုပေါင်း မန်မိုရီဝယ်လိုအား ကျဆင်းသွားမည်ဆိုသည့် စိုးရိမ်ချက်မှာ လွန်ကဲနေကြောင်း ဆိုသည်။ Samsung Securities မှ လေ့လာသူ Lee Jong-wook က AI မော်ဒယ်များကို ပိုမိုထိရောက်အောင် ပြုပြင်တိုးတက်စေခြင်းသည် ချစ်ပ်အသုံးချမှုကို အကောင်းဆုံးဖြစ်စေရန် ကြိုးပမ်းမှုတစ်ခုဖြစ်သော်လည်း ထိရောက်မှု ပိုမိုမြင့်မားလာသည့်အခါ စုစုပေါင်းကုန်ကျစရိတ် လျော့ကျပြီး AI တွက်ချက်မှုအပေါ် ဝယ်လိုအား ပိုမိုမြင့်တက်လာတတ်ကြောင်း ပြောကြားသည်။ သူက Jevons paradox ကို ဥပမာပြ၍ ထိရောက်မှု တိုးလာလေလေ အသုံးပြုမှုလည်း တိုးလာနိုင်ကြောင်း ရှင်းပြခဲ့သည်။
Lee ၏အဆိုအရ AI စွမ်းဆောင်ရည် တိုးတက်မှု ရပ်တန့်သွားခြင်း သို့မဟုတ် AI မော်ဒယ် ဖန်တီးသူများကြား ပြိုင်ဆိုင်မှု လျော့နည်းသွားခြင်းမျိုး ဖြစ်လာမှသာ AI မန်မိုရီဝယ်လိုအား ကျဆင်းနိုင်ခြေ ရှိမည်ဖြစ်သည်။ “AI ကုမ္ပဏီတွေက စရိတ်ထက် စွမ်းဆောင်ရည်ကို ယှဉ်ပြိုင်နေသရွေ့ optimization က semiconductor ဝယ်လိုအားကို ဖိအားမပေးနိုင်ပါဘူး” ဟုလည်း သူက ဆိုသည်။
Hana Securities မှ လေ့လာသူ Kim Rok-ho ကလည်း TurboQuant ကို စီးပွားဖြစ်အသုံးပြုလာနိုင်ခြင်းသည် data center လည်ပတ်သူများအတွက် ကုန်ကျစရိတ်ထိရောက်မှုကို မြှင့်တင်ပေးပြီး AI မန်မိုရီချစ်ပ်ဝယ်လိုအား စုစုပေါင်းကို ပိုမိုတိုးလာစေနိုင်ကြောင်း သုံးသပ်သည်။ Compression နည်းပညာများမှာ အသစ်အဆန်းမဟုတ်သော်လည်း လုပ်ငန်းတစ်ခုလုံးအတိုင်းအတာဖြင့် ကျယ်ကျယ်ပြန့်ပြန့် အသုံးပြုလာမည်လားဆိုသည်မှာ မသေချာသေးကြောင်းလည်း သူက ပြောသည်။ “အလယ်အလတ်ကာလမှ ရေရှည်အထိ အဲဒီနည်းပညာတွေ ပိုအသုံးများလာရင်တောင် မန်မိုရီကုန်ကျစရိတ် အတားအဆီးတွေ လျော့ကျပြီး AI အသုံးပြုမှု ပိုမိုကျယ်ပြန့်လာနိုင်ပါတယ်။ DRAM နဲ့ storage ဝယ်လိုအား ကျဆင်းနိုင်ချေက အလွန်နည်းပါတယ်” ဟု Kim က ဆိုသည်။