A ver, peña del gremio del byte.
Ando mirando por un sistema de arquivo distribuido con licencia libre. Hai montóns, pero casi todos se basean nunha arquitectura na que realmente ocrecen un sistema de almacenamento de bloques ou obxetos sobro o que montan despois unha capa de directorio para fecer a interface do sistema de ficheiros.
↘️
Todo ben, se non fora porque a maioría destas tecnoloxías almacenan esa base de datos do sistema de ficheiros nalgún tipo de tecnoloxía subsidiaria que á súa vez non é distribuida.
Estas solucións non me valen poque a solución que busco ten que ser completamente horizontal, non poder haber 'nodos' especiais na rede dos que o resto de equipos dependan para funcionar.
↘️
A única alternativa que atopei polo de agora e GlusterFS, que almacena os metadatos do sistema de ficheiros xunto cos datos dos mesmos, de xeito que todos os nodos da rede de almacenamento teñen acceso ó ditos metadatos.
Coñecedes algunha outra tecnoloxía de sistema de ficheiros distribuido que sexa realmente horizontal? Que permita mover as instancias do servizo entre nodos dun cluster sen depender de metadatos almacenados localmente en nodos concretos?
@bytes4life Yo ni idea, soy un zote para estas cosas, pero parece que esta tabla de la Wikipedia puede ser de utilidad: https://en.m.wikipedia.org/wiki/Comparison_of_distributed_file_systems
@jandi @bytes4life perdón que estoy limitado lingüísticamente.
Hay por ahí un artículo de Internet Archive sobre https://github.com/seaweedfs/seaweedfs que tenía buena pinta. Yo lo uso a pequeña escala y mola.
En teoría tiene failover; así que hay nodo especial pero se supone que el failover es automático.
Habría que ver de qué escala estás hablando.
@jandi las alternativas de esa tabla las he investigado. Algunas las he descartado por estar discontinuadas, otras porque fueron compradas y la documentación está "secuestrada", otras por el tema que mencioné en las publicaciones anteriores. Las dos únicas alternativas que no he descartado con GlusterFS e Tahoe-LAFS. De esta última sospecho que adolece del mismo problema a la hora de manejar los metadatos, pero no lo he conseguido verificar por el momento.
@yo Seaweed es una de las opciones que barajé y es una de los casos en los que la capa de sistema de ficheros emplea un backend para almacenar los metadatos, lo que implica tener a su ver un servicio de alta disponibilidad para ese backend.
@bytes4life pero en teoría está todo integrado:
Igual se me escapa alguna distinción, porque yo de sistemas de archivos distribuidos, más bien poco. (Uso seaweed porque necesitaba object storage y molaba que ofrece también block storage para k8s, a parte de que parece más sencillo que Ceph y Gluster.)