навигация
Open Lakehouse Platform

Baikal.

Самое глубокое и чистое озеро данных.

Snowflake-class возможности на собственной инфре. Multi-tenant с первого дня. AI-цикл данные → действие закрыт.

8
источников iDev
25+
сервисов в стеке
7
OSS-пакетов
0
vendor lock-in
01 / 05
Что такое Baikal

Open-source Lakehouse, который закрывает циклданные → AI → операционка.

Baikal объединяет 8 операционных систем iDev (4 Postgres + 4 Telegram-бота) в единое аналитическое пространство. Тот же стек продаётся клиентам как открытая альтернатива Snowflake/Databricks/Fivetran — Managed, Hybrid или Self-hosted.

01

Open core

Apache Iceberg, Trino, dbt, Kafka API. Ноль vendor lock-in. ЗавтраSELECTпоедет на Snowflake без переписывания.

02

Multi-tenant с первого дня

Realm в Keycloak, bucket-prefix в MinIO, namespace в Iceberg, branch в Nessie — всё pertenant_id. Биллинг по usage.

03

Цикл закрывается

CDC → Iceberg → MLflow → reverse-ETL пишетai_scoreобратно в CRM. Не дашборд — operational AI в loop.

02 / 05
L1 — System Context

Где Baikalсидитв вашем мире

5 операционных источников · 5 ролей-консумеров · 1 платформа

Операционные системы iDev
idev-hr
Postgres · кандидаты, customers
idev-crm
Postgres · sales pipeline + ai_score
idev-portal
Postgres · бронирования, услуги
idev-website
Postgres + web-form leads
4 Telegram-бота
SQLite · interview / hr / cv / sales
Lakehouse
Baikal · store
CDC → Iceberg → dbt
Activation
Baikal · act
BI · ML · reverse-ETL
Кто потребляет
Sales rep
видит ai_score на каждой сделке
HR / Recruiter
funnel · time-to-place
Executive
ежедневный snapshot · MRR · churn
Tenant client
свой tenant · изолированные дашборды
Lead / Кандидат
touch-points: форма, бот, портал
03 / 05
L2 — Container

Семьсервисов, которые несут нагрузку

25+ сервисов в стеке · вот эти 7 — load-bearing spine

Keycloak · realm-per-tenant authn/z (backplane)
01 / Source
Postgres + SQLite
8 iDev систем · WAL CDC + bot-to-lake
02 / Stream
Debezium + Redpanda
CDC топики · Kafka API wire
03 / Store
Iceberg на MinIO
Open table · S3-compat warehouse
04 / Catalog
Project Nessie
Versioned · branch-per-tenant · time-travel
05 / Compute
Trino
Federated SQL · 4 PG catalogs + Iceberg
06 / Transform
dbt + Dagster
16 моделей · 42 ассета · hourly
07 / Semantic + BI
Cube → Superset
Один номер — одно определение
Headline assets — open table format Companion service — взаимозаменяемый Пунктирный envelope — на всю платформу
04 / 05
Цикл закрывается

От сырого события доAI-вердиктаобратно в CRM

6 swimlanes слева направо · честно: batch hourly, не realtime

01Sources
iDev Postgres
hr · crm · portal · website
Telegram bots
SQLite · 4 бота
02Stream
Debezium
WAL CDC
bot-to-lake
SQLite CDC bridge
Redpanda
Kafka топики
03Lake
RisingWave → Iceberg
streaming sink
bronze · silver · gold
person · leads · deals
04Govern
dbt + Dagster
16 моделей, hourly
Splink ER
probabilistic merge
Soda DQ
13 проверок
05Activate · BI
Cube semantic
6 cubes
Superset · Lightdash
dashboards
Evidence
exec snapshot
06Activate · AI
MLflow registry
lead_score_v1
BentoML serving
/predict 8ms
reverse-ETL job
пишет ai_score
Цикл закрывается.Reverse-ETL пишетai_scoreобратно вidev-crm.deals— sales rep видит AI-вердикт рядом с каждой сделкой.
batch · hourly
05 / 05