Postgres Start-up Ökosystem 2024

Posted on Do 29 Februar 2024 in Blog

Postgres Start-up Ökosystem 2024

Heute hatte ich ein Gespräch mit einem Kollegen über Datenbanken und wie wichtig ob der Tatsache der Langlebigkeit der Daten, die richtige Wahl der Datenbank ist. Dabei habe ich auch vom NoSQL-Hype erzählt und wie wenige Datenbanken dieser Ära es heute wirklich noch gibt. Meiner Meinung nach gab es die letzten Jahre so etwas wie Goldgräberstimmung im Postgres-Umfeld und es daher zahlreiche Start-ups in diesem Bereich gibt. Auch hier werden es wohl nicht alle schaffen auf ewig zu existieren und so habe ich mir gedacht, ich mache mir selbst einen (unvollständigen) Snapshot des aktuellen Stands. Daher werden im folgenden Teil einige Firmen aufgezählt. Allerdings erhebt die Liste keinen Anspruch auf Vollständigkeit.

Update 09.03.2024: Es wurden folgende weitere Firmen ergänzt: EdgeDB, Nile, Hydra, PostgresML, pgEdge, postgres.ai.

Update 01.04.2024: Es wurde Xata ergänzt.

Inhalt:

Timescale

Ein Start-up, das mit seiner Extension hier schon zu Gast war, ist Timescale (ehemals TimescaleDB). Im Blog-Beitrag Podman Container Logs mit Fluent Bit, Postgres und TimescaleDB verarbeiten habe ich vor einiger Zeit schon berichtet, dass ich Timescale im Einsatz habe. Es ist eine Erweiterung, die sich auf die Speicherung von Zeitreihen spezalisiert hat. Timescale bietet Ouf-of-the-box einige sehr nette Features, wie beispielsweise eine Data-Retention-Policy, Compression oder auch Continuous aggregates. In Wochennotiz Nr. 8 habe ich schon einmal auf den Deepdive der programmier.bar verwiesen, aber passt hier auch nochmals: TimescaleDB mit Sven Klemm.

Die letzte Funding Runde (Series C) hat 110 Millionen Dollar eingebracht: Year of the Tiger: $110 million to build the future of data for developers worldwide. Series B hat davor schon 40 Millionen Dollar (Timescale grabs $40M Series B as it goes all in on cloud version of time series database) eingebracht.

Supabase

Supabase beschreibt sich selbst als an open source Firebase alternative und ist ein Backend für Web- und Mobile-Applications. Neben Realtime-Kommunikation bietet Supabase auch Edge-Funktionalität an. Schnittstellen werden über PostgREST oder GraphQL bereitgestellt.

Supabase hat in der letzten Funding Runde (Series B) 80 Millionen Dollar (Supabase Series B) und hat davor (Series A) bereits 30 Millionen Dollar eingesammelt (Supabase $30m Series A). Außerdem war Supabase im Y Combinator Programm Sommer 2020: Supabase - Build in a weekend. Scale to billions.

Neon

Neon ist eine serverless Postgres-Variante. Seit der Gründung sind einigen bekannten Persönlichkeiten aus dem Postgres Umfeld wie Heikki Linnakangas, Stas Kelvich oder Anastasia Lubennikova dabei. Peter Geoghegan hingegen hat Neon nach relativ kurzer Zeit wieder verlassen und ist jetzt bei AWS.

Wahrscheinlich die beste Eigenschaft der serverlosen Architektur ist der schnelle Start einer neuen Postgres-Instanz. Zusätzlich bietet Neon branching an, wie man es beispielsweise von git her kennt.

Neon hat in der letzten Funding Runde (Series B) 46 Millionen Dollar und in einer Series A-Runde 30 Millionen Dollar bekommen: We Raised another $46M – What’s Next?.

Tembo

Tembo hat sich zum Ziel gesetzt Database Sprawl zu beenden und eine developer freundliche Plattform zu erstellen. Tembo hat es sich zur Aufgabe gemacht es zu erleichtern vom Ökosystem der Postgres-Extensions zu profitieren und bietet auf der eigenen Plattform sehr viele dieser Extensions an. Das Hauptprodukt nennt sich Stacks und ist eine Usecase spezifische auto-tunend Postgres Instanz.

Ich bin erstmals auf Tembo bei der letztjährigen pgconf.eu in Prag gestoßen, wo sie ihre eigene Message Queue-Extension vorgestellt haben: Blazingly Fast Message Queue on Postgres with Rust. Sie haben mit David E. Wheeler auch einen nicht ganz unbekannten Akteur aus dem Postgres-Umfeld an Board.

Tembo hat in einer ersten Runde 6.5 Millionen Dollar eingenommen (Introducing Tembo).

FerretDB

FerretDB nennt sich a truly Open Source MongoDB alternative, built on Postgres. Und versucht ein zu MongoDB kompatibles Produkt zu erstellen, das unter der Haube auf Postgres zugreift. Seit 14. Februar gibt es die Möglichkeit FerretDB via Tembo Cloud zu nutzen (MongoDB capabilities on Postgres with Managed FerretDB on Tembo Cloud).

Vor einigen Jahren gab es schon einmal einen Versuch von einer anderen Firma eine MongoDB kompatible Datenbank zu entwickeln. Der Name war ToroDB und zumindest das Github-Repository existiert noch: https://github.com/torodb/server.

FerretDB hat eine Seed-Round mit 2.8 Millionen Dollar abgeschlossen.

Lantern

Lantern hat eine Alternative zu pgvector entwickelt und eine eigene Extension, um Postgres als Vector Datenbank zu nutzen, veröffentlicht: Lantern.

Lantern ist im Y Combinator Programm Winter 2024: Lantern - PostgreSQL vector database extension to build AI applications. Im Zuge dessen gab es ein Funding von 500.000 Dollar von Y Combinator.

Ubicloud

Ubiclud ist eine relativ junge Firma, die mir ebenfalls erstmals bei der pgconf.eu in Prag untergekommen ist. Dort wurde mir erzählt, dass Teile der Gründer auch Citus gegründet haben. Dabei handelt es sich um eine open, free and portable cloud, die, zumindest in Prag noch, primär auf Servern von Hetzner gelaufen ist. Laut Website scheinen hier auch noch OVH und AWS Bare Metal dazugekommen zu sein.

Ubicloud ist im Y Combinator Programm Winter 2024: Ubicloud - Open source alternative to AWS. Im Zuge dessen gab es ein Funding von 500.000 Dollar von Y Combinator.

PeerDB

PeerDB ermöglicht es Daten aus Postgres auf schnellem und effizienten Weg in Data-warehouse-Lösungen, wie Snowflake zu streamen. Um Änderungen in Postgres zu verfolgen, wird, unter anderem, der Change Data Capture (CDC) Mechanismus von Postgres genutzt. In Wochennotiz 11 habe ich PeerDB schon kurz erwähnt.

PeerDB war im Y Combinator Programm Sommer 2023: PeerDB - Fast, native ETL for Postgres.

ParadeDB

ParadeDB beschreibt sich selbst als Elastic alternative built on Postgres. In Wochennotiz 9 habe ich ParadeDB schon kurz erwähnt. Dort ging es um die Möglichkeit durch ParadeDB Postgres als schnelle OLAP-Datenbank zu nutzen.

ParadeDB war im Y Combinator Programm Sommer 2023: ParadeDB - Postgres for Search and Analytics.

ReadySet

ReadySet ist ein realtime caching layer für Postgres und MySQL. In Wochennotiz 11 habe ich ReadySet schon kurz erwähnt. ReadySet arbeitet mit IVM (Incremental View Maintenance) und Logical Replication, um Änderungen an den Daten im Cache zu behalten.

ReadySet hat in einer Series A-Funding-Runde 29 Millionen Dollar eingesammelt (ReadySet Raises $29M in Series A Funding).

OrioleDB

OrioleDB nützt die Erweiterbarkeit von Postgres und versucht mit einer neuen Storage Engine sich dem Thema bloat anzunehmen. Die aktuelle Implementierung der Multi-Version Concurrency Control (MVCC) ist anfällig für table bloat. Hinter OrioleDB steht mit Alexander Korotkov auch ein durchaus bekannter Name in der Postgres-Welt.

Supabase hat 500.000 Dollar in OrioleDB investiert.

Bei diesem Thema gab es schon einmal den Versuch mit einem Projekt namens zheap das Problem zu lösen.

ZomboDB

ZomboDB verbindet Postgres und Elastic, indem es Elastic als neuen Indextyp in Postgres nutzt. Die Informationen zu ZomboDB selbst sind etwas mager, daher ist die Beschreibung kurz ausgefallen.

EdgeDB

EdgeDB baut auf die Postgres Query engine und data storage auf, aber verwendet eine eigene Abfragesprache. EdgeDB nennt sich selbst eine graph-relational database.

EdgeDB hat insgesamt 19 Millionen Dollar an Funding erhalten: EdgeDB raises $15M ahead of the launch of its cloud database service

Nile

Nile arbeitet an einer Serverless Variante von Postgres.

Die Gründer waren davor bei Confluent, der Firma hinter Kafka. Auf die Frage, warum sie auf Postgres setzen:

Why Postgres? According to Subramanian, thats where the market is going. Virtually every company the team talked to was betting on Postgres. Its pretty obvious that its going to become the Linux of databases,” he said. The fact that its open source and easily extensible also enables Nile to do what it does.

Nile hat 11.6 Millionen Dollar in einer Seed-Runde bekommen: Nile raises $11.6M in seed funding to build a Postgres-powered data layer for SaaS applications.

Hydra

Hydra arbeitet an einer Verbesserung der analytischen Fähigkeiten von Postgres und wird immer wieder als Open source Alternative von Snowflake genannt (Hydra aims to be the open cloud data warehouse alternative to Snowflake).

Sie bieten eine Extension, Hydra Columnar, an und haben einen eigenen Extensionmanager entwickelt: pgxman. Zusätzlich bietet sie mit der Extension pg_quack auch eine Erweiterung für die Arbeit mit DuckDB.

Hydra war im Y Combinator Programm Winter 2022: Hydra - Query billions of rows instantly on Postgres..

PostgresML

PostgresML beschreibt sich selbst als complete MLOps platform in a PostgreSQL extension. Es werden zwei Extensions (mit)entwickelt: PostgresML und PgCat (Connection Pooler, wie auch pgBouncer).

Er kürzlich gab es Geld für PostgresML: PostgresML raises $4.7M to launch serverless AI application databases based on Postgres.

pgEdge

pgEdge beschreibt sich selbst als Fully distributed PostgreSQL, optimized for the network edge. Laut den eigenen Beschreibungen soll pgEdge auch a true multi-primary distributed database system sein. Es gibt auch eine eigene Erweiterung, um Multi-Primary Replication anbieten zu können: Spock.

Gegründet wurde es von zwei Veteranen aus dem Postgres-Umfeld, die beispielsweise auch schon bei EDB waren.

pgEdge hat eine Seed-Runde mit 9 Millionen Dollar abgeschlossen: Distributed database provider pgEdge emerges from stealth with $9M.

postgres.ai

postgres.ai ermöglicht ein schnelles Klonen von Postgres-Datenbanken, um CI/CD-Prozesse zu beschleunigen.

Gegründet wurde die Firma von Nikolay Samokhvalov, der zusammen mit Michael Christofides den Postgres-Podcast Postgres.FM betreibt.

Xata

Laut einer founder profile series (SV Angel Founder Profile Series: Monica Sarbu — Xata) Xata wird folgendermaßen beschrieben:

Xata offers a serverless database service that combines the power of a traditional database with the UX of a spreadsheet.

Xata hat 30 Millionen Dollar in einer Series A funding Runde (Database Startup Xata Steps Forward With An All-Women Board And $30 Million In Fresh Funding) eingesammelt.

Der Fokus liegt darauf eine Serverless Datenbank für Jamstack apps zu sein.

Ehemalige Start-ups

Da es die erste Ausgabe des Start-up-Ökosystems ist, kann man noch nicht schauen, wie sich die Start-ups seit der letzten Ausgabe verändert haben, daher habe ich ein paar Firmen, die mir auf die Schnelle eingefallen sind, noch erwähnt.

Eine dieser Firmen ist Swarm64. Das wurde dann von ServiceNow aufgekauft. Der Fokus dort war auf den Einsatz von Postgres als Data Warehouse. Zumindest eine Podcastfolge ist mir auf Anhieb wieder eingefallen, wo über Swarm64 berichtet wurde: Techtiefen #33 Postgres als DWH.

Ein weiteres Start-up, das aufgekauft wurde, ist Citus. Citus hat eine Sharding-Extension für Postgres entwickelt, die wohl einigen schon bekannt ist. Vor einigen Jahren wurde Citus von Microsoft übernommen. Die Extension ist weiterhin als Open Source Lösung verfügbar. Und auch die Website existiert weiterhin: citusdata.com.