لا تتزوج نموذجك

توجيه نماذج اللغة الكبيرة، رائج جداً الآن

معظم فرق الهندسة تختار نموذجًا لغويًا وتلتزم به. مزود واحد، نموذج واحد، كل المهام. الأمر أشبه بتوظيف شخص واحد للقيام بالبرمجة، وكتابة المحتوى، وحساب الضرائب لمجرد أنه كان جيدًا في المقابلة الأولى.

في أي لحظة، هناك نموذج أفضل في البرمجة، وآخر أفضل في التعامل مع السياقات الطويلة والفوضوية، وثالث هو أرخص حصان عمل روتيني للتصنيف. الأسماء تتغير. شكل المشكلة لا يتغير. معاملة نموذج واحد كما لو كان ممتازًا في كل شيء يعني إما أنك تدفع أكثر من اللازم للمهام البسيطة، أو تحصل على نتائج دون المستوى في المهام المتخصصة.

رأيت فريقًا يحرق آلاف الدولارات في تحليل المشاعر باستخدام نموذج يكلف 30 دولارًا لكل مليون رمز، بينما نموذج يكلف 0.50 دولار كان سيقوم بالمهمة بنفس الجودة. تنسيق JSON بسيط، ومهام تصنيف أساسية، كلها تمر عبر مزودهم المتميز. الشيء الوحيد الذي كان يسخن هو فاتورة AWS الخاصة بهم.

هناك طريقة أفضل، وهي ليست معقدة بشكل خاص.

التفويض أفضل من التفاني

ماذا لو كان بإمكانك توجيه الطلبات إلى النموذج الأنسب لتلك المهمة تحديدًا؟ استخدم نموذجك القوي والمكلف للأمور الصعبة، لكن أنزل التحليل البسيط والتنسيق إلى شيء أرخص. احصل على فوائد مزودين متعددين دون الحاجة إلى التبديل بينهم يدويًا في قاعدة الكود الخاصة بك.

Mastra يتيح لك بناء هذا النوع من الأنظمة بالضبط. تقوم بإعداد وكلاء متخصصين لأنواع مختلفة من العمل، ثم تنشئ وكيل موجه يحدد أي متخصص يجب أن يتعامل مع كل طلب. معرفات النماذج أدناه هي أمثلة، وليست لوحة متصدرين. استبدلها بالنماذج الحالية التي تتفوق في تقييماتك وتناسب ميزانيتك.

فكر في الأمر بهذه الطريقة: لديك ثلاثة متخصصين في فريقك.

import { Mastra } from '@mastra/core';
import { Agent } from '@mastra/core/agent';
import { openai } from '@ai-sdk/openai';
import { anthropic } from '@ai-sdk/anthropic';
import { google } from '@ai-sdk/google';

export const claudeAgent = new Agent({
  id: 'claude-agent',
  instructions: 'You are an expert engineer. Write bugs? You are fired.',
  model: anthropic(process.env.CODE_MODEL ?? 'claude-sonnet-4-5'),
});

export const geminiAgent = new Agent({
  id: 'gemini-agent',
  instructions: 'You are a creative writer. Be weird.',
  model: google(process.env.LONG_CONTEXT_MODEL ?? 'gemini-3-pro-preview'),
});

export const gptAgent = new Agent({
  id: 'gpt-agent',
  instructions: 'You are a helpful assistant. Be boring.',
  model: openai(process.env.GENERAL_MODEL ?? 'gpt-5.2'),
});

كل واحد لديه وظيفة. وكيل الكود الخاص بك يجب أن يكون النموذج الذي يجتاز تقييمات البرمجة الخاصة بمستودعك. وكيل السياق الطويل يجب أن يكون النموذج الذي يتحمل مستنداتك الفعلية دون أن يحول الوسط إلى حساء. وكيلك العام يجب أن يكون رخيصًا، وموثوقًا، ومملًا بأفضل طريقة ممكنة.

هنا يصبح الأمر مثيرًا للاهتمام. تضيف موجهًا يعمل كوسيط ذكي:

export const routerAgent = new Agent({
  id: 'router-agent',
  name: 'The Boss',
  instructions: `أنت موجه ذكي.
  - البرمجة → Claude
  - الشعر → Gemini
  - الحقائق → GPT

  لا تقم بالعمل بنفسك. فوّض.`,
  model: openai(process.env.ROUTER_MODEL ?? 'gpt-5-mini'), // استخدم نموذجًا رخيصًا للتوجيه!
  agents: {
    claudeAgent,
    geminiAgent,
    gptAgent,
  },
});

export const mastra = new Mastra({
  agents: { routerAgent, claudeAgent, geminiAgent, gptAgent },
});

الموجه نفسه يعمل على نموذج خفيف لأنه يقوم فقط باتخاذ قرارات حول أين يوجه حركة المرور. أنت لا تدفع أسعارًا ممتازة لمعرفة أي نموذج ممتاز آخر ستستخدم. قِس هذا أيضًا؛ الموجه السيئ يحول التوفير بهدوء إلى توجيه خاطئ.

عندما يطلب شخص ما تنفيذ خوارزمية فرز الفقاعات، يتعرف الموجه على أنها مهمة برمجية ويُسلمها إلى متخصص الكود لديك. طلب كتابة إبداعية؟ يُوجه إلى النموذج الذي اخترته للصوت والنطاق. سؤال واقعي عن أحداث تاريخية؟ يُوجه إلى الوكيل العام، ويفضل مع استرجاع عندما تكون الحداثة أو الاستشهاد مهمة.

الفوائد العملية

كفاءة التكلفة أهم مما تظن. نموذج توجيه صغير يتخذ قرارات التفويض يكلف جزءًا بسيطًا من تشغيل كل طلب عبر مزودك الأكثر تكلفة. بمرور الوقت، خاصة على نطاق واسع، يتراكم هذا ليصبح أموالًا حقيقية. أنت تدفع فقط مقابل الذكاء الثقيل عندما تحتاجه حقًا.

تتحسن الجودة عندما تطابق النماذج مع المهام. الفائز يتغير شهريًا، وحسب المهمة، وشكل المطالبة. لهذا السبب يجب أن تعتمد طبقة التوجيه على تقييماتك، وليس على أي نموذج كان يهيمن على تويتر في الأسبوع الذي كتبت فيه التكامل.

تصبح المرونة فائدة جانبية. عندما تواجه OpenAI أحد انقطاعاتها الدورية (وهي تفعل)، يمكن لموجهك إعادة توجيه حركة المرور إلى مزودين آخرين. أنت لست عالقًا في انتظار عودة واجهة برمجية معينة إلى العمل.

هذا ليس عن الذكاء من أجل الذكاء. إنه عن بناء أنظمة منطقية ماليًا وتقنيًا. لن تستخدم نفس المطرقة لكل مهمة بناء، وربما لا ينبغي لك استخدام نفس نموذج اللغة لكل مهمة ذكاء اصطناعي أيضًا.

جمال هذا النهج هو أن كود تطبيقك لا يتغير. ما زلت تستدعي وكيل التوجيه الخاص بك فقط. تعقيد تحديد النموذج الذي سيستخدم لأي مهمة يعيش في مكان واحد، مهيأ مرة واحدة، بدلاً من أن يكون مبعثرًا في جميع أنحاء قاعدة الكود الخاصة بك في مجموعة من المنطق الشرطي.

DanLevy.net

لا تتزوج نموذجك

التفويض أفضل من التفاني

الفوائد العملية

الموارد

اقرأ السلسلة

لا تتزوج نموذجك

التفويض أفضل من التفاني

الفوائد العملية

الموارد

اقرأ السلسلة

Share Stats