هنا يأتي FastVLM



يضعون MLP لإسقاط الرموز المرئية من FastViTHD إلى عالم LLM.

النتيجة: عدد أقل بكثير من الرموز ( مثل 4× أقل من FastViT، 16× أقل من ViT‑L/14 بدقة 336 بكسل ). أعني، هذا انخفاض كبير في عدد الرموز والتعقيد، بينما
IN0.63%
MLP7.64%
PIXEL0.99%
TOKEN-0.39%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • إعادة النشر
  • مشاركة
تعليق
0/400
GlueGuyvip
· منذ 3 س
هذه العملية منطقياً قوية جداً
شاهد النسخة الأصليةرد0
rekt_but_resilientvip
· منذ 8 س
هنا التحسين هائل!
شاهد النسخة الأصليةرد0
GasFeeLovervip
· 09-02 14:39
حسناً، لا يوجد ما يُفاخر به.
شاهد النسخة الأصليةرد0
ser_we_are_earlyvip
· 09-02 14:39
يبدو أن FastVLM رائع حقًا
شاهد النسخة الأصليةرد0
BlockchainBardvip
· 09-02 14:38
مذهل! لقد اندهشت من عدد الرموز.
شاهد النسخة الأصليةرد0
WhaleWatchervip
· 09-02 14:27
لقد أضفت شيئًا جديدًا مرة أخرى!
شاهد النسخة الأصليةرد0
DiamondHandsvip
· 09-02 14:23
آه آه، أشعر بالدوار بسبب الرياح...
شاهد النسخة الأصليةرد0
  • تثبيت