llm

1045/03/02

مستندات پروژه – سیستم بازیابی مبتنی بر LLM

این پروژه شامل دو مدل مختلف است که با استفاده از کتابخانه HuggingFace Transformers برای وظایف پردازش زبان طبیعی (NLP) ساخته و تنظیم دقیق (Fine-tune) شده‌اند. در ادامه، توضیحات کاملی درباره ساختار دایرکتوری و منطق مدل‌ها ارائه شده است.


ساختار پروژه

.
├── QA_Model
│   ├── LLMProject.ipynb
│   ├── model
│   │   ├── config.json
│   │   ├── pytorch_model.bin
│   │   ├── special_tokens_map.json
│   │   ├── tokenizer_config.json
│   │   ├── tokenizer.json
│   │   └── vocab.txt
│   ├── README.md
│   ├── RunModel.ipynb
│   └── RUNMODEL.md
└── T2T_Model
   ├── LLMProject.ipynb
   └── README.md

دایرکتوری QA_Model/

این پوشه حاوی مدل پرسش و پاسخ (Question Answering) است.

  • LLMProject.ipynb: نوت‌بوکی که در آن مدل QA آموزش و تنظیم دقیق شده است. این فایل شامل بارگذاری داده‌ها، تنظیمات Tokenizer، بارگذاری مدل، حلقه آموزش و ارزیابی است.
  • RunModel.ipynb: یک نوت‌بوک مجزا برای تست مدل آموزش‌دیده. این فایل سوال کاربر و یک متن (Context) را دریافت کرده و پاسخ را پیش‌بینی می‌کند.
  • model/: شامل تمام فایل‌های خروجی مدل آموزش‌دیده، از جمله:
    • pytorch_model.bin: وزن‌های مدل آموزش‌دیده.
    • config.json: تنظیمات معماری مدل.
    • tokenizer.json و سایر فایل‌های مرتبط: جزئیات مربوط به توکن‌ساز مدل.
  • README.md: اطلاعات پایه درباره پروژه مدل QA.
  • RUNMODEL.md: توضیحات مربوط به نحوه بارگذاری و اجرای استنتاج (Inference) روی مدل.

دایرکتوری T2T_Model/

این پوشه شامل یک مدل ساده‌تر متن‌-به‌-متن (Text-to-Text) است.

  • LLMProject.ipynb: در این نوت‌بوک، مدل بر روی یک مجموعه داده مبتنی بر پرامپت (Prompt) آموزش دیده است. این مدل یک سوال را دریافت کرده و بدون نیاز به متن اضافی، پاسخ را تولید می‌کند.
  • README.md: توضیحاتی درباره نحوه عملکرد مدل T2T و چگونگی آموزش آن.

تفاوت بین مدل‌های QA و T2T

ویژگی مدل QA_Model مدل T2T_Model
ورودی سوال + متن مرجع (Context) فقط سوال (Prompt)
نوع مدل استخراجی (مانند BERT) تولید متن (مانند T5)
مورد استفاده نیاز به متن مرجع برای پاسخ‌دهی تولید پاسخ‌های آزاد
نوع خروجی بخشی از متن مرجع متن کاملاً جدید و تولید شده
هدف آموزش یافتن توکن شروع و پایان پاسخ تولید پاسخ به صورت توکن‌به‌توکن

چه زمانی از کدام مدل استفاده کنیم؟

  • QA_Model: زمانی ایده‌آل است که شما یک سند یا متن مشخص دارید و می‌خواهید پاسخ دقیق را از داخل آن استخراج کنید. این مدل بهترین عملکرد را روی داده‌های ساختاریافته دارد.
  • T2T_Model: انعطاف‌پذیری بیشتری دارد و برای سوالات باز، چت‌بات‌ها، خلاصه‌سازی یا کارهای تولید متن استفاده می‌شود. این مدل نیازی به متن خارجی ندارد و بر اساس دانش داخلی خود پاسخ می‌دهد.

گیت هاب پروژه

Narjes Rezaei
Narjes Rezaei

خیلی ممنونم بابت مطالعه این وبلاگ