“Zu grosse” Mailordner

Ich habe 2007 bei der Einführung von Zimbra in der Firma versprochen, dass man “nie wieder Mail löschen” müsste. Das hat bei einigen Usern dazu geführt, dass einige Heavy User Inzwischen die 50 GB Marke Durchbrochen haben.

Für diese User ist E-Mail das zentrale Archivsystem. Wenn wir jetzt aber auf eine anderes Mailsystem, wie Google Apps umsteigen, wo wir “nur” 25 GB Mail pro user speichern können, haben wir ein Problem.

Bei näherer Betrachtung stellt sich heraus, dass die User mit sehr vielen Mails, relativ wenig Speicher (2 GB oder so) verbrauchen. Die User, die so viel Speicher verwenden sind die, die viele Attatchments haben.

Ein alter Plan von mir (noch aus Exchange Zeiten) war es, einfach die Attatchments von den Mails zu entfernen. Die Mails selber kann man sogar auf dem Server lassen und das Attatchment durch einen Link, wo die Datei jetzt herunter geladen werden kann, ersetzen.

Ich hab das mal bei Rent-A-Coder ausgeschrieben:

We need an Python Command Line Application which connects to an IMAP4 server and scans all messages (in all subfolders) of a certain account. If the messages are older than a certain date and have Attatchments bigger than a certain size the attatchmens should be extracted from the Message.

In addition there should be an option to remove the attatchment from the message (but keep the message) on the server (to save space on the server).
Output Should be put in CouchDB (see http://code.google.com/p/couchdb-python/#) where you should put To:, From:, Date:, Subject, In-Reply-to, References and Message-Id in the document. The Attatchment should be added as couchdb Attatchment conserving the mime type and file name.

Command line invokation might look like this:

remove-attachments
--server=myserver.example.com # IMAP hostname
--user=username # IMAP user
--password=pass # IMAP password
--couchdb=http://localhost:5984/maildb # save to couchdb running here
--mindate=2009-03-01 # only  check messages send befor this date
--minsize=1500 # only check messages bigger than 1500 KB
--remove # remove attatchments

If an Attatchment is removed instead of it there should be put a note in the message that an attatchment has been removed.

Since we will have extremely big (> 50GB) Mail Folders the tool must be able be run several times on the same account without generation duplicates in CouchDB.

Comments 6

  1. Armin Gerhardts wrote:

    Und 90% der Anhänge sind dann irgendwelche bmp oder tiff mit “des Internets gesammelter Werke” als ppt verpackt! ;)

    Posted 09 Nov 2009 at 0:54
  2. peter wrote:

    Hi,

    wird der Code public falls der Bid was wird?

    Passt gut zu einer ähnlichen Idee die ich seit einiger Zeit im Kopf habe:
    Wie bereits von Dir erwähnt benutzen viele Benutzer ihre Mailboxen als immerwährendes Archiv.
    Bei privaten Mailkonten sammelt sich da schonmal ein halbes Leben an, mit den entsprechenden Risiken bei einem etwaigen unbefugten Zugriff auf die Mailbox.

    Idee: Tool, ähnlich dem von Dir skizzierten, das Nachrichten nach bestimmten Kriterien (besonders relevante Sender, Alter der Nachricht, etc.) mit dem OpenPGP-Key des Mailbox-Inhabers verschlüsselt.

    Der Nutzer kann dann immer noch bequem über seinen übliche Mailagent in seiner Box suchen und die Nachrichten bequem lesen, eben wie anderen verschlüsselte Nachrichten die an ihn gesendet werden.
    Gleichzeitig ist der Inhalt der Nachrichten sicher und das auch bei Nachrichten von Sendern die nicht in der Lage sind die Nachrichten von ihrer Seite aus zu verschlüsseln…

    Klar gibt elegantere Lösungen wie z.B. entsprechende Mailgateways, die haben aber wieder entsprechende Abhängigkeiten und können nicht von einzeln Benutzern installiert werden.

    Posted 10 Nov 2009 at 20:59
  3. mdornseif wrote:

    Nee. JPEGs von unseren Produkten. Echt!

    Posted 13 Nov 2009 at 8:19
  4. mdornseif wrote:

    @peter: Nette Idee.

    Posted 13 Nov 2009 at 8:23
  5. mdornseif wrote:

    Den code gibt es jetzt unter http://github.com/hudora/hd_MailToolbox/

    Posted 03 Jan 2010 at 10:27
  6. Frank wrote:

    Ich hab die Idee mit Attachments als externen Link mal in einem Exchange Umfeld in Betrieb gesehen. Grausliche Lösung und schön Fehleranfällig. Aber spart teure Exchange Hardware…

    Posted 22 Apr 2010 at 21:05

Post a Comment

Your email is never published nor shared. Required fields are marked *