more-memory-efficient

More memory efficient on top of Llama model!

Benchmark

All models randomly initialized, zero training done.

Tested using TinyLlama 1.1B.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
benchmark		benchmark
more_memory_efficient		more_memory_efficient
.gitignore		.gitignore
README.md		README.md
benchmark_llama3_64m.py		benchmark_llama3_64m.py
benchmark_llama3_64m_crosslayerkv.py		benchmark_llama3_64m_crosslayerkv.py
memory-usage-llama3.png		memory-usage-llama3.png
offload-attention.png		offload-attention.png
plot-llama3.ipynb		plot-llama3.ipynb
time-taken-llama3.png		time-taken-llama3.png