🔒 trunk/e3bfefb9348d4eb4b8eb639d74406f249e3ec1bf: [vllm hash update] update the pinned vllm hash (#186165)

🔧 vLLM Quickstart: High-Performance LLM Serving

🕛 163 Tage, 19 Stunden 6 Minuten
📆 10.01.2026 um 04:53 Uhr
📈 1639.52 Punkte
🔧 Programmierung

🔧 Comparison: vLLM 0.6 vs. Text Generation Inference 1.4 for Serving Code LLMs

🕛 54 Tage, 17 Stunden 34 Minuten
📆 29.04.2026 um 06:20 Uhr
📈 920.15 Punkte
🔧 Programmierung

🔧 10 Best vLLM Alternatives for LLM Inference in Production (2026)

🕛 102 Tage, 18 Stunden 36 Minuten
📆 12.03.2026 um 05:30 Uhr
📈 901.46 Punkte
🔧 Programmierung

📰 Schneider Electric devices using CODESYS Runtime

🕛 153 Tage, 5 Stunden 53 Minuten
📆 20.01.2026 um 13:00 Uhr
📈 724.9 Punkte
📰 IT Security Nachrichten

🔧 War Story: We Migrated from Hugging Face Inference API to Self-Hosted LLMs and Cut Latency by 60%

🕛 56 Tage, 2 Stunden 33 Minuten
📆 27.04.2026 um 21:20 Uhr
📈 657.61 Punkte
🔧 Programmierung

🔧 Why We Stopped Using vLLM 0.6 for Local LLMs in Favor of Ollama 0.5 for Code Tasks

🕛 54 Tage, 18 Stunden 19 Minuten
📆 29.04.2026 um 05:38 Uhr
📈 528.35 Punkte
🔧 Programmierung

🔧 End-to-End Observability for vLLM and TGI: from DCGM to Tokens

🕛 32 Tage, 10 Stunden 16 Minuten
📆 21.05.2026 um 13:37 Uhr
📈 517.78 Punkte
🔧 Programmierung

🔧 vLLM vs SGLang vs LMDeploy: Fastest LLM Inference Engine in 2026?

🕛 109 Tage, 13 Stunden 36 Minuten
📆 05.03.2026 um 10:30 Uhr
📈 443.81 Punkte
🔧 Programmierung

🔧 Pare de Brincar com LLMs Locais: Leve a IAG Open Source para a Produção na Magalu Cloud

🕛 137 Tage, 12 Stunden 36 Minuten
📆 05.02.2026 um 11:30 Uhr
📈 425.95 Punkte
🔧 Programmierung

🔧 LLM on EKS: Serving with vLLM

🕛 52 Tage, 7 Stunden 19 Minuten
📆 01.05.2026 um 16:49 Uhr
📈 422.68 Punkte
🔧 Programmierung

🔧 The Local Model That Doesn't Sleep: Gemma 4 + MTP as a Marathon Engine

🕛 45 Tage, 12 Stunden 59 Minuten
📆 08.05.2026 um 11:01 Uhr
📈 422.68 Punkte
🔧 Programmierung

🔧 Analyzing ZIP Encryption: When to Act

🕛 63 Tage, 5 Stunden 5 Minuten
📆 20.04.2026 um 18:48 Uhr
📈 417.32 Punkte
🔧 Programmierung

📰 Patch Tuesday - May 2026

🕛 40 Tage, 20 Stunden 20 Minuten
📆 13.05.2026 um 02:22 Uhr
📈 415.16 Punkte
📰 IT Security Nachrichten

🔧 Why Self-Hosted Claude Code Was 15 Slower Than It Should Be

🕛 15 Tage, 19 Stunden 32 Minuten
📆 07.06.2026 um 03:55 Uhr
📈 374.37 Punkte
🔧 Programmierung

🔧 vLLM on Google Cloud TPU: A Model Size vs Chip Cheat Sheet (With Interactive Tool)

🕛 53 Tage, 12 Stunden 20 Minuten
📆 30.04.2026 um 11:38 Uhr
📈 359.28 Punkte
🔧 Programmierung

🔧 vLLM Explained: How PagedAttention Makes LLMs Faster and Cheaper

🕛 147 Tage, 5 Stunden 35 Minuten
📆 26.01.2026 um 18:37 Uhr
📈 348.71 Punkte
🔧 Programmierung

🔧 Building a Production ML Inference Stack with KServe, vLLM, and Karmada

🕛 129 Tage, 19 Stunden 49 Minuten
📆 13.02.2026 um 03:56 Uhr
📈 348.71 Punkte
🔧 Programmierung

📰 Milesight Cameras

🕛 60 Tage, 5 Stunden 6 Minuten
📆 23.04.2026 um 14:00 Uhr
📈 339.16 Punkte
📰 IT Security Nachrichten

🔧 We ran Qwen3.6-27B on $800 of consumer GPUs, day one: llama.cpp vs vLLM

🕛 59 Tage, 18 Stunden 52 Minuten
📆 24.04.2026 um 05:06 Uhr
📈 338.14 Punkte
🔧 Programmierung

🔧 Ollama vs llama.cpp vs vLLM: Which Should You Use in 2026?

🕛 33 Tage, 20 Stunden 33 Minuten
📆 20.05.2026 um 03:14 Uhr
📈 338.14 Punkte
🔧 Programmierung

🔧 How to Install DeepSeek Nano-VLLM Locally?

🕛 363 Tage, 14 Stunden 18 Minuten
📆 24.06.2025 um 09:46 Uhr
📈 328.39 Punkte
🔧 Programmierung

🔧 The Intelligence Stack: Engineering Production-Grade Agentic AI Systems

🕛 93 Tage, 7 Stunden 34 Minuten
📆 21.03.2026 um 16:27 Uhr
📈 310.59 Punkte
🔧 Programmierung

🔧 vLLM vs TensorRT-LLM vs Ollama vs llama.cpp — Choosing the Right Inference Engine on RTX 5090

🕛 100 Tage, 10 Stunden 49 Minuten
📆 14.03.2026 um 13:16 Uhr
📈 306.44 Punkte
🔧 Programmierung

🔧 Apple Silicon LLM Inference Optimization: The Complete Guide to Maximum Performance

🕛 72 Tage, 21 Stunden 48 Minuten
📆 11.04.2026 um 02:06 Uhr
📈 286.13 Punkte
🔧 Programmierung

🔧 Session 1: vLLM Overview and the User API

🕛 141 Tage, 1 Stunden 5 Minuten
📆 01.02.2026 um 23:00 Uhr
📈 285.31 Punkte
🔧 Programmierung

📰 Patch Tuesday - June 2026

🕛 13 Tage, 0 Stunden 21 Minuten
📆 09.06.2026 um 23:04 Uhr
📈 280.32 Punkte
📰 IT Security Nachrichten

🔧 Local LLM Hosting: Complete 2025 Guide - Ollama, vLLM, LocalAI, Jan, LM Studio & More

🕛 205 Tage, 21 Stunden 48 Minuten
📆 29.11.2025 um 02:07 Uhr
📈 274.74 Punkte
🔧 Programmierung

🔧 vLLM On-Demand Gateway: Zero-VRAM Standby for Local LLMs on Consumer GPUs

🕛 88 Tage, 1 Stunden 47 Minuten
📆 26.03.2026 um 22:08 Uhr
📈 253.61 Punkte
🔧 Programmierung

🔧 Local LLM Inference in 2026: The Complete Guide to Tools, Hardware & Open-Weight Models

🕛 85 Tage, 8 Stunden 37 Minuten
📆 29.03.2026 um 15:23 Uhr
📈 253.61 Punkte
🔧 Programmierung

📰 Patch Tuesday - April 2026

🕛 68 Tage, 23 Stunden 50 Minuten
📆 14.04.2026 um 23:48 Uhr
📈 252.53 Punkte
📰 IT Security Nachrichten

🔧 Introducing the Voxtral Test: Breaking the Speed Barrier in Real-Time Speech AI

🕛 124 Tage, 4 Stunden 36 Minuten
📆 18.02.2026 um 19:28 Uhr
📈 244.68 Punkte
🔧 Programmierung

🔧 72B Parameters, Zero Quantization, One GPU: Benchmarking Qwen2-VL on AMD MI300X

🕛 40 Tage, 13 Stunden 48 Minuten
📆 13.05.2026 um 10:02 Uhr
📈 243.04 Punkte
🔧 Programmierung

🔧 vLLM — Session 2: The Engine Layer — Request Management

🕛 141 Tage, 1 Stunden 5 Minuten
📆 01.02.2026 um 23:00 Uhr
📈 232.47 Punkte
🔧 Programmierung

🔧 Compiling the Vision Encoder: Squeezing 3% More Throughput from Qwen3-VL on Hopper GPUs

🕛 133 Tage, 20 Stunden 34 Minuten
📆 09.02.2026 um 03:08 Uhr
📈 232.47 Punkte
🔧 Programmierung

🔧 Operational Techniques for Automatically Starting vLLM, Flask, and cron with systemd Services in WSL2

🕛 106 Tage, 13 Stunden 0 Minuten
📆 08.03.2026 um 10:59 Uhr
📈 232.47 Punkte
🔧 Programmierung

☑ Lösungen

☑ Betriebssysteme

☑ IT-Sicherheit

☑ Cyberbedrohungen

☑ Ressourcen

☑ Videos

☑ Sicherheitstipps

☑ Häufig gesucht

💾 trunk/e3bfefb9348d4eb4b8eb639d74406f249e3ec1bf: [vllm hash update] update the pinned vllm hash (#186165)

Sharing is caring on Social Media