Bayesian Spam Filtering ਬਾਰੇ ਤੁਹਾਨੂੰ ਕੀ ਜਾਣਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ

ਪਤਾ ਕਰੋ ਕਿ ਅੰਕੜੇ ਤੁਹਾਡੇ ਇਨਬਾਕਸ ਨੂੰ ਕਿਵੇਂ ਸਾਫ ਰੱਖਦੇ ਹਨ

ਬੇਈਸੀਅਨ ਸਪੈਮ ਫਿਲਟਰਜ਼ ਇਸਦੇ ਸੰਖੇਪਾਂ ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਸਪੈਮ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਦਾ ਹਿਸਾਬ ਲਗਾਉਂਦੇ ਹਨ ਸਧਾਰਣ ਸਮੱਗਰੀ-ਅਧਾਰਤ ਫਿਲਟਰਾਂ ਤੋਂ ਉਲਟ, ਬਾਏਸਾਈਅਨ ਸਪੈਮ ਫਿਲਟਰਿੰਗ ਸਪੈਮ ਅਤੇ ਚੰਗੇ ਮੇਲ ਤੋਂ ਸਿੱਖਦਾ ਹੈ, ਜਿਸਦੇ ਪਰਿਣਾਮਸਵਰੂਪ ਇੱਕ ਬਹੁਤ ਹੀ ਮਜ਼ਬੂਤ, ਅਨੁਕੂਲ ਅਤੇ ਕੁਸ਼ਲ ਵਿਰੋਧੀ ਸਪੈਮ ਪਹੁੰਚ ਦਾ ਨਤੀਜਾ ਹੈ, ਜੋ ਸਭ ਤੋਂ ਵਧੀਆ ਹੈ, ਕਿਸੇ ਵੀ ਝੂਠੇ ਸਕਾਰਾਤਮਕ ਨਤੀਜੇ ਦਿੰਦਾ ਹੈ.

ਤੁਸੀਂ ਜੰਕ ਈ-ਮੇਲ ਨੂੰ ਕਿਵੇਂ ਪਛਾਣਦੇ ਹੋ?

ਇਸ ਬਾਰੇ ਸੋਚੋ ਕਿ ਤੁਹਾਨੂੰ ਸਪੈਮ ਕਿਵੇਂ ਲਗਦਾ ਹੈ ਇੱਕ ਤੇਜ਼ ਨਜ਼ਰ ਅਕਸਰ ਕਾਫੀ ਹੁੰਦੀ ਹੈ ਤੁਸੀਂ ਜਾਣਦੇ ਹੋ ਕਿ ਸਪੈਮ ਕੀ ਦੇਖਦਾ ਹੈ, ਅਤੇ ਤੁਸੀਂ ਜਾਣਦੇ ਹੋ ਕਿ ਚੰਗਾ ਮੇਲ ਕਿਹੋ ਜਿਹਾ ਹੈ.

ਵਧੀਆ ਮੇਲ ਦੀ ਤਰ੍ਹਾਂ ਸਪੈਮ ਦੀ ਸੰਭਾਵਨਾ ਦੁਆਲੇ ਹੈ ... ਜ਼ੀਰੋ

ਸਮੱਗਰੀ-ਅਧਾਰਿਤ ਫਿਲਟਰਾਂ ਨੂੰ ਸਕੋਰਿੰਗ

ਕੀ ਇਹ ਵਧੀਆ ਨਹੀਂ ਹੋਵੇਗਾ ਜੇਕਰ ਸਵੈਚਾਲਤ ਸਪੈਮ ਫਿਲਟਰ ਇਸ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰੇ, ਵੀ?

ਸਮਗਰੀ-ਅਧਾਰਿਤ ਸਪੈਮ ਫਿਲਟਰਜ਼ ਨੂੰ ਸਕੋਰ ਕਰਨ ਨਾਲ ਇਸਦੀ ਸਿਰਫ ਕੋਸ਼ਿਸ਼ ਕਰੋ ਉਹ ਸ਼ਬਦ ਅਤੇ ਸਪੈਮ ਦੇ ਲੱਛਣਾਂ ਨੂੰ ਲੱਭਦੇ ਹਨ. ਹਰੇਕ ਵਿਸ਼ੇਸ਼ਤਾ ਤੱਤ ਨੂੰ ਸਕੋਰ ਦਿੱਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਪੂਰੇ ਸੁਨੇਹੇ ਲਈ ਸਪੈਮ ਸਕੋਰ ਵਿਅਕਤੀਗਤ ਸਕੋਰ ਤੋਂ ਪ੍ਰਾਪਤ ਕੀਤਾ ਗਿਆ ਹੈ. ਕੁਝ ਸਕੋਰਿੰਗ ਫਿਲਟਰ ਵੀ ਜਾਇਜ਼ ਮੇਲ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਲੱਭਦੇ ਹਨ, ਇੱਕ ਸੰਦੇਸ਼ ਦੇ ਅੰਤਮ ਸਕੋਰ ਨੂੰ ਘਟਾਉਂਦੇ ਹਨ.

ਸਕੋਰਿੰਗ ਫਿਲਟਰ ਪਹੁੰਚ ਕੰਮ ਕਰਦੀ ਹੈ, ਪਰ ਇਸ ਵਿੱਚ ਕਈ ਕਮੀਆਂ ਵੀ ਹਨ:

ਬਾਏਸੀਅਨ ਸਪੈਮ ਫਿਲਟਰਜ਼ ਨੂੰ ਆਪਣੇ ਆਪ ਨੂੰ ਸੁਧਾਰੋ, ਬਿਹਤਰ ਅਤੇ ਵਧੀਆ ਪ੍ਰਾਪਤ ਕਰਨਾ

ਬੇਈਸੀਅਨ ਸਪੈਮ ਫਿਲਟਰ ਇੱਕ ਕਿਸਮ ਦਾ ਸਕੋਰਿੰਗ ਸਮੱਗਰੀ-ਅਧਾਰਿਤ ਫਿਲਟਰ ਹਨ, ਵੀ. ਉਨ੍ਹਾਂ ਦਾ ਤਰੀਕਾ ਸਧਾਰਨ ਸਕੋਰਿੰਗ ਸਪੈਮ ਫਿਲਟਰਾਂ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨਾਲ ਖ਼ਤਮ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਇਹ ਇਸ ਤਰ੍ਹਾਂ ਮੂਲ ਰੂਪ ਵਿੱਚ ਕਰਦਾ ਹੈ. ਕਿਉਂਕਿ ਸਕੋਰਿੰਗ ਫਿਲਟਰਾਂ ਦੀ ਕਮਜ਼ੋਰੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਸਕੋਰ ਦੀ ਖੁਦ ਤਿਆਰ ਸੂਚੀ ਵਿੱਚ ਹੈ, ਇਸ ਸੂਚੀ ਨੂੰ ਖਤਮ ਕੀਤਾ ਗਿਆ ਹੈ.

ਇਸ ਦੀ ਬਜਾਏ, ਬੇਈਸੀਅਨ ਸਪੈਮ ਫਿਲਟਰਸ ਖੁਦ ਸੂਚੀ ਬਣਾਉਂਦੇ ਹਨ ਆਦਰਸ਼ਕ ਤੌਰ ਤੇ, ਤੁਸੀਂ ਈਮੇਲਾਂ ਦੀ ਇਕ (ਵੱਡੀਆਂ) ਝੁੰਡਾਂ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰਦੇ ਹੋ ਜੋ ਤੁਸੀਂ ਸਪੈਮ ਦੇ ਤੌਰ ਤੇ ਸ਼੍ਰੇਣੀਬੱਧ ਕੀਤਾ ਹੈ, ਅਤੇ ਚੰਗੇ ਮੇਲ ਦਾ ਇੱਕ ਹੋਰ ਸਮੂਹ ਹੈ. ਫਿਲਟਰ ਦੋਵਾਂ 'ਤੇ ਨਜ਼ਰ ਮਾਰਦੇ ਹਨ ਅਤੇ ਸਪੈਮ ਵਿੱਚ ਆਉਣ ਵਾਲੇ ਵੱਖੋ-ਵੱਖਰੇ ਲੱਛਣਾਂ ਦੀ ਸੰਭਾਵਨਾ ਦਾ ਹਿਸਾਬ ਲਗਾਉਣ ਲਈ ਅਤੇ ਮੇਲ ਮੇਲ ਵਿੱਚ ਮਹੱਤਵਪੂਰਣ ਮੇਲ ਅਤੇ ਸਪੈਮ ਦੀ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦੇ ਹਨ.

ਇੱਕ ਬਾਏਸੀਅਨ ਸਪੈਮ ਫਿਲਟਰ ਇੱਕ ਈਮੇਂਟ ਦੀ ਜਾਂਚ ਕਿਵੇਂ ਕਰਦਾ ਹੈ

ਬਾਯਸਿਅਨ ਸਪੈਮ ਫਿਲਟਰ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਇਹ ਦੇਖ ਸਕਦੀਆਂ ਹਨ:

ਜੇ ਕੋਈ ਸ਼ਬਦ, "ਕਾਰਟੇਜ਼ਿਅਨ", ਉਦਾਹਰਨ ਲਈ ਕਦੇ ਵੀ ਸਪੈਮ ਵਿੱਚ ਨਹੀਂ ਆਉਂਦਾ ਪਰ ਅਕਸਰ ਤੁਹਾਡੇ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤੀ ਜਾਇਜ਼ ਈਮੇਲ ਵਿੱਚ, "Cartesian" ਸੰਕੇਤ ਕਰਦਾ ਹੈ ਕਿ ਸਪੈਮ ਦੀ ਗਿਣਤੀ ਸ਼ਨੀ ਦੇ ਨੇੜੇ ਹੈ. "ਟੋਨਰ", ਦੂਜੇ ਪਾਸੇ, ਸਪੈਮ ਵਿੱਚ ਅਕਸਰ ਅਤੇ ਅਕਸਰ ਪ੍ਰਗਟ ਹੁੰਦਾ ਹੈ. "ਟੋਨਰ" ਦੀ ਸਪੈੱਮ ਵਿੱਚ ਲੱਭਣ ਦੀ ਬਹੁਤ ਉੱਚ ਸੰਭਾਵਨਾ ਹੈ, ਬਹੁਤ ਘੱਟ 1 (100%).

ਜਦੋਂ ਕੋਈ ਨਵਾਂ ਸੁਨੇਹਾ ਆਉਂਦਾ ਹੈ, ਤਾਂ ਇਸਦਾ ਮੁਲਾਂਕਣ ਬਾਯਸਿਅਨ ਸਪੈਮ ਫਿਲਟਰ ਦੁਆਰਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਸਪੈਮ ਦੀ ਸਪੱਸ਼ਟ ਸੰਦੇਸ਼ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਵਿਅਕਤੀਗਤ ਲੱਛਣਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ.

ਮੰਨ ਲਓ ਕਿ ਦੋਵਾਂ ਵਿਚ "ਕਾਰਟੇਜ਼ਿਅਨ" ਅਤੇ "ਟੋਨਰ" ਦੋਵੇਂ ਸ਼ਾਮਿਲ ਹਨ. ਇਕੱਲੇ ਇਨ੍ਹਾਂ ਸ਼ਬਦਾਂ ਤੋਂ ਹਾਲੇ ਇਹ ਸਪੱਸ਼ਟ ਨਹੀਂ ਹੈ ਕਿ ਸਾਡੇ ਕੋਲ ਸਪੈਮ ਜਾਂ ਲੀਗਲ ਡਾਕ ਹੈ ਜਾਂ ਨਹੀਂ. ਹੋਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ (ਉਮੀਦ ਅਤੇ ਸਭ ਤੋਂ ਵੱਧ ਸੰਭਾਵਨਾ) ਇੱਕ ਸੰਭਾਵੀਤਾ ਨੂੰ ਸੰਕੇਤ ਕਰਦੇ ਹਨ ਜੋ ਫਿਲਟਰ ਨੂੰ ਸੁਨੇਹੇ ਨੂੰ ਸਪੈਮ ਜਾਂ ਚੰਗੇ ਮੇਲ ਦੇ ਤੌਰ ਤੇ ਵਰਗੀਕਰਨ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ.

ਬਾਏਸੀਅਨ ਸਪੈਮ ਫਿਲਟਰਸ ਆਟੋਮੈਟਿਕਲੀ ਸਿੱਖ ਸਕਦੇ ਹਨ

ਹੁਣ ਜਦੋਂ ਸਾਡੇ ਕੋਲ ਇੱਕ ਵਰਗੀਕਰਨ ਹੈ, ਤਾਂ ਸੰਦੇਸ਼ ਨੂੰ ਫਿਲਟਰ ਨੂੰ ਅੱਗੇ ਹੋਰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ. ਇਸ ਕੇਸ ਵਿੱਚ, ਜਾਂ ਤਾਂ "ਕਾਰਟਿਸੀਅਨ" ਦੀ ਸੰਭਾਵਨਾ ਹੈ ਜੋ ਚੰਗਾ ਮੇਲ ਦਰਸਾਉਂਦਾ ਹੈ (ਜੇ "ਕਾਰਟਿਸੀਅਨ" ਅਤੇ "ਟੋਨਰ" ਨੂੰ ਸਪੈਮ ਕਿਹਾ ਜਾਂਦਾ ਹੈ), ਜਾਂ "ਟੋਨਰ" ਦੀ ਸੰਭਾਵੀ ਜਾਣਕਾਰੀ ਸਪੈਮ ਨੂੰ ਦੁਬਾਰਾ ਵਿਚਾਰਿਆ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ.

ਇਸ ਆਟੋ-ਅਨੁਕੂਲ ਤਕਨੀਕ ਦੀ ਵਰਤੋਂ ਕਰਨ ਨਾਲ, Bayesian ਫਿਲਟਰ ਆਪਣੇ ਆਪ ਅਤੇ ਉਪਭੋਗਤਾ ਦੇ ਫੈਸਲਿਆਂ (ਜੇ ਉਹ ਖੁਦ ਫਿਲਟਰ ਦੁਆਰਾ ਗਲਤ ਸਮਝ ਠੀਕ ਕਰ ਲੈਂਦੇ ਹਨ) ਤੋਂ ਸਿੱਖ ਸਕਦੇ ਹਨ . Bayesian ਫਿਲਟਰਿੰਗ ਦੀ ਅਨੁਕੂਲਤਾ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਉਹ ਵਿਅਕਤੀਗਤ ਈਮੇਲ ਉਪਭੋਗਤਾ ਲਈ ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹਨ. ਹਾਲਾਂਕਿ ਜ਼ਿਆਦਾਤਰ ਲੋਕਾਂ ਦੇ ਸਪੈਮ ਵਿੱਚ ਇੱਕੋ ਜਿਹੇ ਲੱਛਣ ਹੋ ਸਕਦੇ ਹਨ, ਪਰ ਜਾਇਜ਼ ਮੇਲ ਹਰੇਕ ਲਈ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ.

ਸਪੈਮਰਜ਼ ਬੀਤੇਸਾਈਅਨ ਫਿਲਟਰਜ਼ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਨ?

ਜਾਇਜ਼ ਮੇਲ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਬਾਇਸੇਡੀਅਨ ਸਪੈਮ ਫਿਲਟਰਿੰਗ ਪ੍ਰਕਿਰਿਆ ਲਈ ਜਿੰਨੀਆਂ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦੀਆਂ ਹਨ ਜਿਵੇਂ ਸਪੈਮ ਹੈ ਜੇ ਫਿਲਟਰਾਂ ਨੂੰ ਹਰੇਕ ਉਪਭੋਗਤਾ ਲਈ ਖਾਸ ਤੌਰ ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਸਪੈਮਰਾਂ ਕੋਲ ਹਰ ਕੋਈ (ਜਾਂ ਜ਼ਿਆਦਾਤਰ ਲੋਕਾਂ ਦੇ) ਸਪੈਮ ਫਿਲਟਰਾਂ ਤੇ ਕੰਮ ਕਰਨ ਲਈ ਇੱਕ ਔਖਾ ਸਮਾਂ ਵੀ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਫਿਲਟਰ ਲਗਭਗ ਸਾਰੇ ਸਪਾਮਰਾਂ ਨਾਲ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਹਨ.

ਸਪੈਮਰ ਸਿਰਫ ਚੰਗੀ ਤਰ੍ਹਾਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਬਾਇਸੇਨ ਫਿਲਟਰ ਬਣਾ ਦੇਵੇਗਾ ਜੇ ਉਹ ਬਣਾਉਂਦੇ ਹਨ ਤਾਂ ਸਪੈਮ ਸੁਨੇਹੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਆਮ ਈਮੇਲ ਵਾਂਗ ਪ੍ਰਾਪਤ ਹੋ ਸਕਦੇ ਹਨ.

ਸਪੈਮਰ ਆਮ ਤੌਰ ਤੇ ਅਜਿਹੇ ਆਮ ਈਮੇਲ ਨਹੀਂ ਭੇਜਦੇ. ਸਾਨੂੰ ਇਹ ਮੰਨ ਲੈਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਇਹ ਈਮੇਲ ਜੰਕ ਈਮੇਲ ਦੇ ਤੌਰ ਤੇ ਕੰਮ ਨਹੀਂ ਕਰਦੇ. ਇਸ ਲਈ, ਸੰਭਾਵਨਾ ਹੈ ਕਿ ਉਹ ਇਸ ਨੂੰ ਨਹੀਂ ਕਰ ਰਹੇ ਹੋਣਗੇ ਜਦੋਂ ਸਧਾਰਣ, ਬੋਰਿੰਗ ਈਮੇਲਾਂ ਦਾ ਪਿਛਲਾ ਸਪੈਮ ਫਿਲਟਰ ਬਣਾਉਣ ਦਾ ਇੱਕੋ ਇੱਕ ਤਰੀਕਾ ਹੈ.

ਜੇ ਸਪੈਮਰਜ਼ ਜ਼ਿਆਦਾਤਰ ਆਮ ਦਿੱਖ ਵਾਲੀਆਂ ਈਮੇਲਾਂ ਉੱਤੇ ਸਵਿਚ ਕਰਦੇ ਹਨ, ਫਿਰ ਵੀ, ਅਸੀਂ ਆਪਣੇ ਇਨਬੌਕਸਾਂ ਤੇ ਬਹੁਤ ਸਾਰੇ ਸਪੈਮ ਦੇਖਾਂਗੇ, ਅਤੇ ਈਮੇਲ ਨਿਰਾਸ਼ਾਜਨਕ ਬਣ ਸਕਦੀਆਂ ਹਨ ਕਿਉਂਕਿ ਇਹ ਪ੍ਰੀ-ਬੇਏਸਿਆਨ ਦਿਨਾਂ (ਜਾਂ ਇਸ ਤੋਂ ਵੀ ਮਾੜੇ) ਵਿੱਚ ਸੀ. ਇਹ ਸਭ ਤਰ੍ਹਾਂ ਦੇ ਸਪੈਮ ਲਈ ਬਾਜ਼ਾਰ ਨੂੰ ਵੀ ਤਬਾਹ ਕਰ ਚੁੱਕਾ ਹੋਵੇਗਾ, ਹਾਲਾਂਕਿ, ਅਤੇ ਇਸ ਤਰ੍ਹਾਂ ਲੰਮੇ ਸਮੇਂ ਤੱਕ ਨਹੀਂ ਰਹੇਗਾ.

ਸਟ੍ਰੌਂਗ ਸੂਚਕ ਬਾਇਓਸਾਈਅਨ ਸਪੈਮ ਫਿਲਟਰ ਦੇ ਅਕੀਲਜ਼ 'ਹੋ ਸਕਦਾ ਹੈ. ਅੱਡੀ

ਸਪੈਮਰਾਂ ਲਈ ਇਕ ਅਪਵਾਦ ਸਮਝਿਆ ਜਾ ਸਕਦਾ ਹੈ ਕਿ ਉਹ ਆਪਣੇ ਆਮ ਸਮਗਰੀ ਦੇ ਨਾਲ ਬਾਇਸੇਡੀਅਨ ਫਿਲਟਰਾਂ ਰਾਹੀਂ ਆਪਣਾ ਕੰਮ ਕਰਨ. ਇਹ ਬੇਏਸੀਆਂ ਦੇ ਅੰਕੜਿਆਂ ਦੇ ਰੂਪ ਵਿੱਚ ਹੈ ਕਿ ਇਕ ਸ਼ਬਦ ਜਾਂ ਵਿਸ਼ੇਸ਼ਤਾ ਜੋ ਚੰਗਾ ਮੇਲ ਵਿੱਚ ਬਹੁਤ ਵਾਰ ਆਉਂਦਾ ਹੈ ਤਾਂ ਇਹ ਮਹੱਤਵਪੂਰਣ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਸਪੈਮ ਨੂੰ ਫਿਲਟਰ ਦੁਆਰਾ ਹੈਮ ਦੇ ਰੂਪ ਵਿੱਚ ਦਰਸਾਏ ਜਾ ਰਹੇ ਕਿਸੇ ਵੀ ਸੁਨੇਹੇ ਨੂੰ ਬਦਲਣ ਤੋਂ ਰੋਕਿਆ ਜਾ ਸਕੇ.

ਜੇ ਸਪੈੱਮਰ ਤੁਹਾਡੇ ਨਿਸ਼ਚਿਤ ਅੱਗ ਨੂੰ ਚੰਗੇ ਮੇਲ ਵਾਲੇ ਸ਼ਬਦਾਂ ਨੂੰ ਨਿਰਧਾਰਿਤ ਕਰਨ ਲਈ ਇੱਕ ਢੰਗ ਲੱਭਦੇ ਹਨ- HTML ਵਾਪਸੀ ਰਸੀਦਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਹ ਦੇਖਣ ਲਈ ਕਿ ਤੁਸੀਂ ਕਿਹੜੇ ਸੁਨੇਹੇ ਖੋਲ੍ਹੇ, ਉਦਾਹਰਨ ਲਈ-, ਉਹ ਇੱਕ ਜੰਕ ਮੇਲ ਵਿੱਚ ਉਹਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਨੂੰ ਸ਼ਾਮਲ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ ਇੱਕ ਚੰਗੀ ਤਰ੍ਹਾਂ- ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ Bayesian ਫਿਲਟਰ.

ਜੌਨ ਗ੍ਰਾਹਮ-ਕਮਿੰਗ ਨੇ ਦੋ ਬੇਈਸੀਅਨ ਫਿਲਟਰਾਂ ਨੂੰ ਇੱਕ ਦੂਜੇ ਦੇ ਵਿਰੁੱਧ ਕੰਮ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ ਹੈ, "ਚੰਗਾ" ਫਿਲਟਰ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤੇ ਜਾਣ ਵਾਲੇ "ਬੁਰਾ" ਇੱਕ ਸੰਦੇਸ਼. ਉਹ ਕਹਿੰਦਾ ਹੈ ਕਿ ਇਹ ਕੰਮ ਕਰਦਾ ਹੈ, ਹਾਲਾਂਕਿ ਇਹ ਪ੍ਰਕਿਰਿਆ ਸਮੇਂ ਦੀ ਵਰਤੋਂ ਅਤੇ ਕੰਪਲੈਕਸ ਹੈ. ਸਾਨੂੰ ਇਹ ਨਹੀਂ ਲਗਦਾ ਕਿ ਅਸੀਂ ਇਹ ਸਭ ਕੁਝ ਵੇਖਾਂਗੇ, ਘੱਟੋ ਘੱਟ ਇਕ ਵੱਡੇ ਪੈਮਾਨੇ ਤੇ ਨਹੀਂ, ਅਤੇ ਵਿਅਕਤੀਆਂ ਦੀਆਂ ਈਮੇਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਅਨੁਸਾਰ ਨਹੀਂ. ਸਪੈਮਜ਼ ਸੰਸਥਾਵਾਂ ਲਈ ਕੁੱਝ ਸ਼ਬਦ ਖੋਜਣ ਦੀ ਕੋਸ਼ਿਸ ਕਰ ਸਕਦੇ ਹਨ (ਆਈਬੀਐਮ ਵਿੱਚ ਕੁਝ ਲੋਕਾਂ ਲਈ "ਅਲਮਾਡੇਨ" ਜਿਵੇਂ ਕਿ ਕੁਝ ਹੋ ਸਕਦਾ ਹੈ)?

ਆਮ ਤੌਰ 'ਤੇ, ਸਪੈਮ ਹਮੇਸ਼ਾਂ (ਮਹੱਤਵਪੂਰਣ ਤੌਰ ਤੇ) ਨਿਯਮਤ ਮੇਲ ਤੋਂ ਵੱਖ ਹੁੰਦਾ ਹੈ ਜਾਂ ਇਹ ਸਪੈਮ ਨਹੀਂ ਹੋਵੇਗਾ, ਹਾਲਾਂਕਿ.

ਬੌਟਮ ਲਾਈਨ: ਬੇਈਸਾਈਅਨ ਫਿਲਟਰਿੰਗ ਦੀ ਤਾਕਤ ਇਸ ਦੀ ਕਮਜ਼ੋਰੀ ਹੋ ਸਕਦੀ ਹੈ

Bayesian ਸਪੈਮ ਫਿਲਟਰ ਸਮੱਗਰੀ-ਅਧਾਰਤ ਫਿਲਟਰ ਹੁੰਦੇ ਹਨ, ਜੋ: