🔒 Building a Tokenizer from Scratch

🔧 How to Train Custom Language Models: Fine-Tuning vs Training From Scratch (2026)

🕛 92 Tage, 0 Stunden 10 Minuten
📆 19.03.2026 um 10:30 Uhr
📈 340.71 Punkte
🔧 Programmierung

🔧 Build a Fast NLP Pipeline with Modern Text Tokenizer in C++

🕛 314 Tage, 23 Stunden 12 Minuten
📆 08.08.2025 um 11:14 Uhr
📈 331.44 Punkte
🔧 Programmierung

🔧 Building an LLM From Scratch for Indic Languages: What No One Tells You About the Hard Parts

🕛 96 Tage, 21 Stunden 57 Minuten
📆 14.03.2026 um 12:39 Uhr
📈 311.02 Punkte
🔧 Programmierung

🔧 Tokens: The Invisible Building Blocks of Large Language Models

🕛 221 Tage, 22 Stunden 40 Minuten
📆 09.11.2025 um 12:06 Uhr
📈 282.68 Punkte
🔧 Programmierung

🔧 Using hf tokenizers in Rust

🕛 53 Tage, 18 Stunden 54 Minuten
📆 26.04.2026 um 15:43 Uhr
📈 270.14 Punkte
🔧 Programmierung

🔧 Code Review: Deep Dive into vLLM's Architecture and Implementation Analysis of OpenAI-Compatible Serving (2/2)

🕛 364 Tage, 15 Stunden 40 Minuten
📆 19.06.2025 um 18:41 Uhr
📈 260.13 Punkte
🔧 Programmierung

🔧 Serving LLMs at Scale with KitOps, Kubeflow, and KServe

🕛 196 Tage, 16 Stunden 55 Minuten
📆 04.12.2025 um 17:36 Uhr
📈 252.67 Punkte
🔧 Programmierung

🔧 Tokenization under the hood: BPE, WordPiece, SentencePiece, and Unigram compared

🕛 2 Tage, 6 Stunden 57 Minuten
📆 17.06.2026 um 03:10 Uhr
📈 236.47 Punkte
🔧 Programmierung

🔧 Here's how OpenAI Token count is computed in Tiktokenizer - Part 3

🕛 344 Tage, 16 Stunden 56 Minuten
📆 09.07.2025 um 17:30 Uhr
📈 230.12 Punkte
🔧 Programmierung

🔧 Building a High-Performance Text Embedding API with Rust, Axum, and ONNX

🕛 244 Tage, 5 Stunden 26 Minuten
📆 18.10.2025 um 05:12 Uhr
📈 221.38 Punkte
🔧 Programmierung

🔧 Fine-Tuning Mistral-7B for Scientific Research: A Step-by-Step Guide

🕛 354 Tage, 4 Stunden 41 Minuten
📆 30.06.2025 um 06:00 Uhr
📈 220.11 Punkte
🔧 Programmierung

🔧 Fine-Tuning Llama 3.2 3B on Medical QA: Week 1 Setup and Baseline Inference

🕛 30 Tage, 22 Stunden 38 Minuten
📆 19.05.2026 um 11:56 Uhr
📈 205.21 Punkte
🔧 Programmierung

🔧 Run Big LLMs on Small GPUs: A Hands-On Guide to 4-bit Quantization and QLoRA

🕛 203 Tage, 18 Stunden 55 Minuten
📆 27.11.2025 um 15:26 Uhr
📈 190.1 Punkte
🔧 Programmierung

🔧 Using “ibm-granite/granite-speech-3.3–8b” 🪨 for ASR

🕛 228 Tage, 20 Stunden 56 Minuten
📆 02.11.2025 um 13:26 Uhr
📈 180.09 Punkte
🔧 Programmierung

🔧 Resources for Learning to Build Technologies from Scratch with Go: Books and Free Online Courses

🕛 14 Tage, 23 Stunden 22 Minuten
📆 04.06.2026 um 11:21 Uhr
📈 176.31 Punkte
🔧 Programmierung

🔧 Building a Vector Database from Scratch - CapybaraDB

🕛 220 Tage, 6 Stunden 41 Minuten
📆 11.11.2025 um 03:45 Uhr
📈 171.85 Punkte
🔧 Programmierung

🔧 95. Fine-Tuning LLMs: Make a General Model Do Your Specific Job

🕛 26 Tage, 19 Stunden 7 Minuten
📆 23.05.2026 um 15:30 Uhr
📈 163.92 Punkte
🔧 Programmierung

🔧 Here's how OpenAI Token count is computed in Tiktokenizer - Part 2

🕛 345 Tage, 17 Stunden 11 Minuten
📆 08.07.2025 um 17:30 Uhr
📈 160.08 Punkte
🔧 Programmierung

🔧 Chat Templates can improve LM inferencing.

🕛 71 Tage, 18 Stunden 50 Minuten
📆 08.04.2026 um 15:44 Uhr
📈 150.08 Punkte
🔧 Programmierung

🔧 Chapter 3: The Tokenizer - Text to Numbers and Back

🕛 57 Tage, 11 Stunden 57 Minuten
📆 22.04.2026 um 22:44 Uhr
📈 150.08 Punkte
🔧 Programmierung

🔧 Fine-Tune Any HuggingFace Model like Gemma on TPUs with TorchAX

🕛 52 Tage, 23 Stunden 54 Minuten
📆 27.04.2026 um 10:45 Uhr
📈 150.08 Punkte
🔧 Programmierung

🔧 81. BERT: Understanding Language Deeply

🕛 35 Tage, 1 Stunden 37 Minuten
📆 15.05.2026 um 08:55 Uhr
📈 150.08 Punkte
🔧 Programmierung

🔧 🔥 Fine-Tuning Gemma 4 on Your Own Dataset: A Step-by-Step Guide

🕛 44 Tage, 16 Stunden 51 Minuten
📆 05.05.2026 um 17:39 Uhr
📈 141.34 Punkte
🔧 Programmierung

🔧 🚀 Production-Ready: 6 Advanced Fixes for Your LLMService Class 🚀

🕛 356 Tage, 19 Stunden 41 Minuten
📆 27.06.2025 um 15:00 Uhr
📈 140.07 Punkte
🔧 Programmierung

🔧 The Ghost in the Tokenizer: How Subword Tokenization Invisibly Shapes What Your Prompt 'Means' to the Model

🕛 117 Tage, 17 Stunden 43 Minuten
📆 21.02.2026 um 16:49 Uhr
📈 140.07 Punkte
🔧 Programmierung

🔧 Why Most Developer Startups Fail Before Launch: The Brutal Truths Nobody Tells You

🕛 151 Tage, 16 Stunden 28 Minuten
📆 18.01.2026 um 18:12 Uhr
📈 139.88 Punkte
🔧 Programmierung

🔧 I benchmarked every Go SQL parser in 2026 and built my own

🕛 89 Tage, 2 Stunden 10 Minuten
📆 22.03.2026 um 08:14 Uhr
📈 132.61 Punkte
🔧 Programmierung

🔧 Write a Programming Language in a Weekend (Seriously) With Python

🕛 330 Tage, 0 Stunden 40 Minuten
📆 24.07.2025 um 09:53 Uhr
📈 131.53 Punkte
🔧 Programmierung

🔧 Fine-Tuning LLaMA in 5 Minutes with Unsloth - Unrivaled Speed & Simplicity

🕛 310 Tage, 13 Stunden 13 Minuten
📆 12.08.2025 um 20:55 Uhr
📈 131.34 Punkte
🔧 Programmierung

🔧 I Tried Vector Search on Molecules. Here Is What Actually Happened.

🕛 84 Tage, 0 Stunden 26 Minuten
📆 27.03.2026 um 10:07 Uhr
📈 131.34 Punkte
🔧 Programmierung

🔧 One Open Source Project a Day (No.51): VibeVoice - Microsoft's Speech AI That Processes 90 Minutes of Audio in a Single Pass

🕛 51 Tage, 6 Stunden 11 Minuten
📆 29.04.2026 um 04:32 Uhr
📈 131.34 Punkte
🔧 Programmierung

🔧 Apache Doris 4.0: One Engine for Analytics, Full-Text Search, and Vector Search

🕛 237 Tage, 14 Stunden 13 Minuten
📆 24.10.2025 um 20:28 Uhr
📈 130.07 Punkte
🔧 Programmierung

🔧 THE RECEIPT TRAIL: WHAT THEY CHARGE VS WHAT YOU ACTUALLY PAY

🕛 39 Tage, 10 Stunden 38 Minuten
📆 10.05.2026 um 23:47 Uhr
📈 125.17 Punkte
🔧 Programmierung

🔧 RLHF in 2026: when to pick PPO, DPO, or verifier-based RL

🕛 33 Tage, 22 Stunden 54 Minuten
📆 16.05.2026 um 11:37 Uhr
📈 123.9 Punkte
🔧 Programmierung

🔧 how does browser render webpage?

🕛 214 Tage, 17 Stunden 8 Minuten
📆 16.11.2025 um 17:15 Uhr
📈 120.06 Punkte
🔧 Programmierung

☑ Lösungen

☑ Betriebssysteme

☑ IT-Sicherheit

☑ Cyberbedrohungen

☑ Ressourcen

☑ Videos

☑ Sicherheitstipps

☑ Häufig gesucht

🔧 Building a Tokenizer from Scratch

Sharing is caring on Social Media