Commits · visualisable-ai/api

Store matrices as numpy arrays instead of Python lists

f2e89c2

gary-boon Claude Opus 4.5 commited on about 19 hours ago

Add per-step memory cleanup for large model support

a94eb19

gary-boon Claude Opus 4.5 commited on about 20 hours ago

Fix RAM exhaustion for large token generation

959074d

gary-boon Claude Opus 4.5 commited on about 20 hours ago

feat: add auto_complete parameter for token generation

bb689ce

gary-boon Claude Opus 4.5 commited on about 22 hours ago

fix: add QKV extraction support for Mistral/Devstral architecture

d1d37a8

gary-boon Claude Opus 4.5 commited on about 23 hours ago

feat: implement lazy-loading for attention matrices

929ba88

gary-boon Claude Opus 4.5 commited on about 23 hours ago

Add avg_entropy calculation for attention heads

66a46b6

gary-boon Claude Opus 4.5 commited on 3 days ago

Revert QKV visualization fixes - need better approach for data streaming

d0b7e29

gary-boon Claude Opus 4.5 commited on 8 days ago

Add safety checks for missing QKV keys

a79cb83

gary-boon Claude Opus 4.5 commited on 8 days ago

Limit QKV matrices to top 5 heads per layer to reduce response size

decb5ab

gary-boon Claude Opus 4.5 commited on 8 days ago

Fix QKV matrix extraction for Mistral/Devstral architecture

9056859

gary-boon Claude Opus 4.5 commited on 8 days ago

Fix QKV visualization for Mistral/Devstral architecture

4ec134b

gary-boon Claude Opus 4.5 commited on 8 days ago

Add future considerations doc for response size optimization

3e67ea2

gary-boon Claude Opus 4.5 commited on 9 days ago

Fix: Import time module at top level for SSE events

15a862b

gary-boon Claude Opus 4.5 commited on 9 days ago

Add SSE streaming endpoint for real-time analysis progress

172a186

gary-boon Claude Opus 4.5 commited on 9 days ago

feat: Include token metadata in analysis response

ee0f6c9

gary-boon Claude Opus 4.5 commited on 9 days ago

feat: Implement tier-based model filtering by device type

6bf9f5c

gary-boon Claude Opus 4.5 commited on 9 days ago

Fix: Add attn_implementation="eager" to model switch function

f94a7ae

gary-boon Claude Opus 4.5 commited on 9 days ago

Add Phase 5: Performance optimizations to phased plan

383a328

gary-boon Claude Opus 4.5 commited on 10 days ago

Add tokenSections boundaries and update system prompt

c6f4cc5

gary-boon Claude Opus 4.5 commited on 10 days ago

Fix: Handle MistralCommonTokenizer pad_token setter

e20ccaf

gary-boon Claude Opus 4.5 commited on 10 days ago

Integrate mistral-common for correct Devstral tokenization

ed06dcb

gary-boon Claude Opus 4.5 commited on 10 days ago

Remove mistral_common to fix dependency conflict

3d9d9ee

gary-boon Claude Opus 4.5 commited on 10 days ago

Use mistral_common for proper Devstral prompt formatting

3e80769

gary-boon Claude Opus 4.5 commited on 10 days ago

Add system prompt support for instruction-tuned models

2860768

gary-boon Claude Opus 4.5 commited on 10 days ago

fix: Simpler prompt format and temperature=0 for Devstral

76020ee

gary-boon Claude Opus 4.5 commited on 10 days ago

fix: Sanitize JSON response for NaN/Inf float values

99f6209

gary-boon Claude Opus 4.5 commited on 10 days ago

fix: Check chat_template is set before using apply_chat_template

474927d

gary-boon Claude Opus 4.5 commited on 10 days ago