Επεξήγηση:
Κάθε LLM έχει όριο στο πόσα tokens (μονάδες κειμένου) μπορεί να επεξεργαστεί ταυτόχρονα. Το “παράθυρο περιεχομένου” αυτό (context window) ορίζει την έκταση των προηγούμενων λέξεων/προτάσεων που λαμβάνονται υπόψη σε κάθε απάντηση. Μοντέλα όπως το GPT-4 Turbo υποστηρίζουν 128K context window.