JetStream is a throughput and memory optimized engine for LLM inference on XLA devices.

About

JetStream is a throughput and memory optimized engine for LLM inference on XLA devices, starting with TPUs (and GPUs in future -- PRs welcome).

JetStream Engine Implementation

Currently, there are two reference engine implementations available -- one for Jax models and another for Pytorch models.

Jax

Pytorch

Documentation

JetStream Standalone Local Setup

Getting Started

Setup

make install-deps

Run local server & Testing

Use the following commands to run a server locally:

# Start a server
python -m jetstream.core.implementations.mock.server

# Test local mock server
python -m jetstream.tools.requester

# Load test local mock server
python -m jetstream.tools.load_tester

Test core modules

# Test JetStream core orchestrator
python -m unittest -v jetstream.tests.core.test_orchestrator

# Test JetStream core server library
python -m unittest -v jetstream.tests.core.test_server

# Test mock JetStream engine implementation
python -m unittest -v jetstream.tests.engine.test_mock_engine

# Test mock JetStream token utils
python -m unittest -v jetstream.tests.engine.test_token_utils
python -m unittest -v jetstream.tests.engine.test_utils

Name	Name	Last commit message	Last commit date
Latest commit yuyanpeng-google Fix chunked prefill regression (#231 ) Mar 26, 2025 b8b9cb2 · Mar 26, 2025 History 194 Commits
.github	.github	Revert "internal change" (#169 )	Jan 29, 2025
benchmarks	benchmarks	Support long context dataset accuracy measurement (#230 )	Mar 25, 2025
docs	docs	Remove the link which create leaker issue with copybara (#179 )	Feb 5, 2025
experimental/jax	experimental/jax	Add the llama2-70b model (#217 )	Mar 11, 2025
jetstream	jetstream	Fix chunked prefill regression (#231 )	Mar 26, 2025
.gitattributes	.gitattributes	Revert accidental change - back to #216	Mar 5, 2025
.gitignore	.gitignore	Revert accidental change - back to #216	Mar 5, 2025
AUTHORS	AUTHORS	Revert "internal change" (#169 )	Jan 29, 2025
CONTRIBUTING.md	CONTRIBUTING.md	Revert "internal change" (#169 )	Jan 29, 2025
LICENSE	LICENSE	Revert "internal change" (#169 )	Jan 29, 2025
MANIFEST.in	MANIFEST.in	Revert "internal change" (#169 )	Jan 29, 2025
Makefile	Makefile	Support long context dataset accuracy measurement (#230 )	Mar 25, 2025
README.md	README.md	Revert "internal change" (#169 )	Jan 29, 2025
license_preamble.txt	license_preamble.txt	Revert "internal change" (#169 )	Jan 29, 2025
pylintrc	pylintrc	Revert "internal change" (#169 )	Jan 29, 2025
requirements.txt	requirements.txt	Add post-processing functions to extract math500 answers (#225 )	Mar 14, 2025
setup.py	setup.py	Revert accidental change - back to #216	Mar 5, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

JetStream is a throughput and memory optimized engine for LLM inference on XLA devices.

About

JetStream Engine Implementation

Jax

Pytorch

Documentation

JetStream Standalone Local Setup

Getting Started

Setup

Run local server & Testing

Test core modules

About

Releases 4

Packages

Contributors 35

Languages

License

AI-Hypercomputer/JetStream

Folders and files

Latest commit

History

Repository files navigation

JetStream is a throughput and memory optimized engine for LLM inference on XLA devices.

About

JetStream Engine Implementation

Jax

Pytorch

Documentation

JetStream Standalone Local Setup

Getting Started

Setup

Run local server & Testing

Test core modules

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 4

Packages 0

Contributors 35

Languages

Packages