Najbežnejší formát ukladania e-mailových správ je formát mbox. MBOX znamená MailBOX. Mbox je jeden súbor obsahujúci nulu alebo viac mailových správ.
Formát mbox
Ak použijeme formát mbox na ukladanie e-mailov, všetko ich zložíme do jedného súboru. Toto vytvára viac či menej dlhý textový súbor (internetová e-mailová adresa je vždy iba ako 7-bitový ASCII text, všetko ostatné - napríklad prílohy - je zakódované), ktoré obsahujú jednu e-mailovú správu za druhou. Ako vieme, kde končí a začína druhá?
Našťastie každý e-mail má na začiatku aspoň jeden odkaz. Každá správa začína slovom "Od" (Z nasleduje znak bieleho medzera, nazývaný aj riadok "Od_"). Ak táto sekvencia ("Od") na začiatku riadku predchádza prázdny riadok alebo je v hornej časti súboru, našli sme začiatok správy.
Takže to, čo hľadáme pri analýze súboru mbox, je v podstate prázdny riadok, po ktorom nasleduje "Od".
Ako regulárny výraz môžeme písať ako " n nFrom. * N". Len prvá správa je iná. Začína sa iba "Od" na začiatku riadku ("^ From. * N").
"Od" v tele
Čo ak sa presne uvedená sekvencia objaví v tele e-mailovej správy? Čo keď je súčasťou e-mailu?
- … posielam vám najnovšiu správu.
- Z tejto správy nemusíte …
Tu máme prázdnu čiaru, po ktorej nasleduje "Od" na začiatku riadku. Ak sa to zobrazí v súbore mbox, nezameniteľne máme začiatok novej správy. Prinajmenšom je to, čo analyzátor myslí a prečo aj e-mailový klient a my by sme boli dosť zmätení e-mailovou správou, ktorá neobsahuje ani odosielateľa, ani príjemcu, ale začína s "Z tohto prehľadu".
Aby sme sa vyhli takým katastrofálnym podmienkam, musíme sa uistiť, že na začiatku riadku po prázdnom riadku v tele e-mailu sa nikdy nezobrazí "Od".
Kedykoľvek pridáme novú správu do súboru mbox, hľadáme takéto sekvencie v tele a jednoducho nahradíme "Od" s "> Od". To umožňuje nesprávne interpretácie. Vyššie uvedený príklad vyzerá takto a už nespúšťa analyzátor:
- … posielam vám najnovšiu správu.
- > Z tejto správy nemusíte …
To je dôvod, prečo môžete niekedy nájsť "> Od" v e-maile, kde by ste očakávali iba "Od".












