Sponsored by

Find leads on Reddit on auto pilot

Agent skills
ai-engineering

Topic: ai-engineering

51 skills in this topic.

rlhf Understanding Reinforcement Learning from Human Feedback (RLHF) for aligning language models. Use when learning about preference data, reward modeling, policy optimization, or direct alignment algorithms like DPO.
itsmostafa/llm-engineering-skills 17
qlora Memory-efficient fine-tuning with 4-bit quantization and LoRA adapters. Use when fine-tuning large models (7B+) on consumer GPUs, when VRAM is limited, or when standard LoRA still exceeds memory. Builds on the lora skill.
itsmostafa/llm-engineering-skills 17
prompt-engineering Crafting effective prompts for LLMs. Use when designing prompts, improving output quality, structuring complex instructions, or debugging poor model responses.
itsmostafa/llm-engineering-skills 17