lost connection after DATA from 寄出e-mail 掉信

我個人任職的公司用的是postfix做e-mail系統,但由於個人原本就不是資管出身,所以是轉職之後,才開始學Postfix跟Sendmail的使用。

前幾個月,曾新來一位業務助理,結果他任職一個月時,就發生連續寄出郵件掉信的問題,其電腦系統已判定郵件已經寄出,但實際上所有收件人皆沒有接收到郵件,結果造成公司的業務嚴重失誤。

在內部網路,卻會漏信? 這實在是很嚴重的問題。但…其他郵件loading更重的人(郵件量高達百倍),也沒有掉信過啊?為何一個小助理就會掉信?

所以我從maillog去查該時間時,就發現該電腦有在該時間發生『lost connection after DATA from』的問題,查長期後也發現多比『lost connection after DATA from』的記錄。特別是一般郵件寄送記錄應該如下

Oct  4 10:58:57 mail1 postfix/smtpd[32155]: connect from lydia
Oct  4 10:58:57 mail1 postfix/smtpd[32155]: 0BEA84480C9: client=lydia[10.1.1.54], sasl_method=LOGIN, sasl_username=lydia
Oct  4 10:58:57 mail1 postfix/cleanup[31092]: 0BEA84480C9: message-id=48FFD4C67A714139B020375A13AA96F6@lydia
Oct  4 10:58:57 mail1 postfix/qmgr[14922]: 0BEA84480C9: from=<lydia>, size=1777, nrcpt=1 (queue active)
Oct  4 10:58:57 mail1 postfix/smtp[32474]: 0BEA84480C9: to=<???@whalelight.com.tw>, relay=mx.whalelight.com.tw[124.150.132.42]:25, delay=0.3, delays=0.02/0.01/0.21/0.06, dsn=2.0.0, status=sent (250 ok 1380855207 qp 30423)
Oct  4 10:58:57 mail1 postfix/qmgr[14922]: 0BEA84480C9: removed
Oct  4 10:58:59 mail1 postfix/smtpd[32155]: disconnect from lydia[10.1.1.54]

正常順序是
1. connect from  —發信電腦連線至mail server
2. LOGIN—帳號登入
3. message-id—
4. from=—寄信帳號
5. to=—收件帳號
6. removed —寄送完成,從伺服器刪除
7. disconnect from  發信電腦與 mail server斷線
以上步驟是連續的,最多在幾秒內或一分鐘內就完成,不會被其他帳號插入其連續步驟。

但出問題的電腦卻是
1. connect from  —發信電腦連線至mail server
2. LOGIN—帳號登入
3. 被其他帳號插入連線跟寄出郵件
4. 約3分鐘後,系統出現該電腦『lost connection after DATA from』的記錄。
這樣的maillog,就幾乎可以判定該connect from  的該時間所寄出郵件,已經寄出失敗; 但該電腦的系統卻是判定寄出成功。由於資料傳送連線失敗,mail server根本沒有完成郵件的接收跟發送,當然,所有的收件人也不可能收到郵件。

Sep 11 17:33:17 mail1 postfix/smtpd[21656]: lost connection after DATA from jenny[10.1.1.137] Sep 12 11:37:13 mail1 postfix/smtpd[19477]: lost connection after DATA from jenny[10.1.1.137] Sep 13 10:34:41 mail1 postfix/smtpd[21365]: lost connection after DATA from jenny[10.1.1.137] Sep 13 11:03:46 mail1 postfix/smtpd[24145]: lost connection after DATA from jenny[10.1.1.137] Sep 16 18:31:32 mail1 postfix/smtpd[24687]: lost connection after DATA from jenny[10.1.1.137] Sep 23 18:25:52 mail1 postfix/smtpd[15481]: lost connection after DATA from jenny[10.1.1.137] Sep 24 14:56:10 mail1 postfix/smtpd[22283]: lost connection after DATA from jenny[10.1.1.137] Sep 24 16:16:49 mail1 postfix/smtpd[27372]: lost connection after DATA from jenny[10.1.1.137]

 

我換過網卡(螃蟹、D-Link 503TX、3Com、intel)—>沒用
換全新網路線—>沒用
獨立加裝Hub強化訊號—>沒用
在加裝Hub時,我有發現到其網路連線頻率,比其他電腦高到異常!
掃毒—>才剛全新安裝的,沒毒!
掃木馬跟惡意程式—>沒有!
網路傳輸品質測試—>OK

但就是該台電腦卻還是一直發生『lost connection after DATA from』跟 『網路連線頻率異常』。

然後該助理旁邊又來一個新助理,結果兩個助理交接一段時間後,就變成兩台電腦一直有『lost connection after DATA from』的記錄。

結果,我實在沒招了,另一台新助理就接兩張網卡、兩條網路、兩個IP<—結果OK!
但我不可能每台電腦都這樣用啊!

結果沒辦法的辦法,升級Office看看(原本就有安排要從Office XP->Office 2007)。
結果在幫忙Outlook設定時,我發現問題所在了!該兩台電腦的『傳送/接收』每隔時間設定如下:
2013-09-25_144344

會發現,就是因為我看到短時間內就有多次連續『傳送/接收』,甚至現有工作『傳送/接收』尚未結束前,按下關閉 Outlook的話,又會立刻看到新增一個『傳送/接收』的工作排程(在短短不到一分鐘內,竟然看到三個等待執行)。

所以可以推測這兩台電腦就是由於過度密集執行『傳送/接收』,結果造成送發郵件錯誤。

事後將全部改回預設值。就結束這兩台電腦的鬧劇了!
2013-09-25_092617

現在新人進來,都會直接註釋,不要變更『傳送/接收』每隔時間設定!

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

w

連結到 %s