Nitisha Jain

Senior Research Engineer

Publications

View by:

- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  Publication

- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  Publication
- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  Publication

- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  Publication

Your Privacy Choices