Projektit

Opiskelijoiden ja henkilökunnan oikeita projekteja. Avoin lähdekoodi aina kun mahdollista.

FinBERT-hienosäätö LUMIlla

● aktiivinen

Suomenkielisen BERT-mallin hienosäätö toimialakohtaiseen NER-tunnistukseen CSC LUMI A100 -solmuilla. Täysi DDP-koulutus, Weights & Biases -seuranta.

PyTorchHuggingFaceLUMINLP
3 tekijää → repo

Reaaliaikainen sensoridata-pipeline

● aktiivinen

Apache Kafka + Spark Streaming -pipeline, joka vastaanottaa IoT-sensoridataa KAMKin kampusrakennuksesta. Anomalian tunnistus Isolation Forest -menetelmällä.

KafkaSparkPythonIoT
4 tekijää → repo

Avoimen LLM:n vertailusarja

✓ valmis

Avoimen lähdekoodin LLM:ien (Mistral, LLaMA, Phi) vertailu suomenkielisissä tehtävissä. Tulokset julkaistu avoimena datana.

LLMBenchmarkFinnish NLPFOSS
2 tekijää → repo

MLOps-referenssialusta

✓ valmis

Kontitettu, itse isännöity MLOps-pino käyttäen MLflow:ta, DVC:tä ja Prefectiä — käyttöönotettavissa millä tahansa Linux-palvelimella tai CSC cPoutassa.

MLOpsDockerMLflowDVC
2 tekijää → repo

Pohjoismainen energiantarve-ennustus

✓ valmis

Suomen sähkönkulutuksen aikasarjaennustaminen Temporal Fusion Transformerilla. Data Fingridin avoimesta API:sta.

Time SeriesPyTorchForecasting
3 tekijää → repo

CSC Jupyter -ympäristömallit

● aktiivinen

Valmiit Jupyter-ympäristöt CSC Notebooksiin — esiasennetut datatiede- ja ML-kirjastot.

CSCJupyterFOSSTools
1 tekijä → repo

Onko sinulla projekti-idea? Ota yhteyttä.

Ota yhteyttä →