Projektit
Opiskelijoiden ja henkilökunnan oikeita projekteja. Avoin lähdekoodi aina kun mahdollista.
FinBERT-hienosäätö LUMIlla
● aktiivinenSuomenkielisen BERT-mallin hienosäätö toimialakohtaiseen NER-tunnistukseen CSC LUMI A100 -solmuilla. Täysi DDP-koulutus, Weights & Biases -seuranta.
Reaaliaikainen sensoridata-pipeline
● aktiivinenApache Kafka + Spark Streaming -pipeline, joka vastaanottaa IoT-sensoridataa KAMKin kampusrakennuksesta. Anomalian tunnistus Isolation Forest -menetelmällä.
Avoimen LLM:n vertailusarja
✓ valmisAvoimen lähdekoodin LLM:ien (Mistral, LLaMA, Phi) vertailu suomenkielisissä tehtävissä. Tulokset julkaistu avoimena datana.
MLOps-referenssialusta
✓ valmisKontitettu, itse isännöity MLOps-pino käyttäen MLflow:ta, DVC:tä ja Prefectiä — käyttöönotettavissa millä tahansa Linux-palvelimella tai CSC cPoutassa.
Pohjoismainen energiantarve-ennustus
✓ valmisSuomen sähkönkulutuksen aikasarjaennustaminen Temporal Fusion Transformerilla. Data Fingridin avoimesta API:sta.
CSC Jupyter -ympäristömallit
● aktiivinenValmiit Jupyter-ympäristöt CSC Notebooksiin — esiasennetut datatiede- ja ML-kirjastot.
Onko sinulla projekti-idea? Ota yhteyttä.
Ota yhteyttä →