無料かつオープンソースの使い捨てメール検出

Leo
LeoFounder, BillionVerify

BillionVerifyが最も完全な使い捨てメールドメインデータベースをオープンソース化 — MITライセンス、毎日更新 — APIでの使い捨てチェックはクレジット消費ゼロ。

Cover Image for 無料かつオープンソースの使い捨てメール検出

今日、私たちは同時に2つのことをやる。github.com/BillionVerify/disposable を公開する — 私たちが把握している中で最も完全なオープンソースの使い捨てメールドメインデータベースで、毎日更新される — そして、使い捨て検出を残りの検証料金から切り離す。BillionVerify APIでは、使い捨てヒットはクレジットゼロ、無条件で、残りの検証作業でどのプランを使っていても関係ない。Apolloからリードリストを引っ張ったことがある人、Googleマップから連絡先をスクレイピングしたことがある人、コールドメールキャンペーンを走らせてバウンス率が2%を超えるのを見たことがある人、このアナウンスはあなたのためだ。使い捨てインボックスはB2Bアウトリーチにおける送信者レピュテーション損傷の中で、最も防ぎやすい単一の原因であり、それを捕捉するデータはパブリックインフラであるべきだと私たちは考える。

要点

ポイント詳細
リポジトリは公開済みで無料BillionVerify/disposable はMITライセンスで毎日更新され、私たちが組み上げることができた中で最も包括的な使い捨て・一時・throwawayメールドメインのオープンリストを収録している。
APIは使い捨てヒットに対してクレジットゼロ/verify/disposable/verify/single/verify/bulk/verify/file のどれを呼んでも、使い捨てドメインに解決されるアドレスはクレジットゼロ。BillionVerifyのアカウントとAPIキーは引き続き必要 — メール検証の残り(キャッチオール、SMTPプロービング、完全なメールボックス検証)は通常のプラン料金で請求される — が、使い捨てチェック自体はどのプランでも無料だ。
使い捨て検出はアルゴリズムの問題ではなくデータの問題ほとんどの検証サービスが新しい使い捨てプロバイダーを見逃す原因は、コードが悪いからではなく、リストが古いからだ。毎日更新されるドメインカバレッジだけが持続可能な防御になる。
コールドメールとリードスクレイピングのワークフローが最高リスク面Googleマップのスクレイプ、Apolloのエクスポート、B2Bエージェンシーキャンペーン、地域ビジネスへのアウトリーチは、使い捨て汚染が集中するソースから引っ張ってくる。送信前に検証することが、健全なドメインとバーンしたドメインの差だ。
オープンかつ無料は競合の基準線を変える主要な検証ベンダーはすべて使い捨て検出を課金対象の項目として扱っている。私たちはそれをアンバンドルする。

なぜこれをやるのか

メールは唯一、ミスのコストが非対称なチャネルだ。汚染されたリストに送った1バッチは、そのバッチを無駄にするだけでなく、あなたのドメインが死んだインボックスにメールを送る種類の送信者だとメールボックスプロバイダーに教えてしまう。そのシグナルからの回復には数週間かかる。防止は2ミリ秒以内に収まるドメインルックアップで済む。

その防止の経済性は長年歪んできた。使い捨てドメインリスト自体 — 文字列のフラットファイル — は、最初からオープンリポジトリをスクレイピングしたベンダーによってプレミアムティアの一部として売られている。一方、存在するオープンリポジトリは、どれほど献身的であっても、新しい使い捨てサービスが立ち上がるペースに追いつけないボランティアがパートタイムでメンテしている。私たちはインターネット上の大きな商業検証パイプラインの上に座っている。私たちのお客様がそこに送信するから、新しい使い捨てドメインがライブになった当日に私たちは見る。そのデータがペイウォールの裏にある理由はない。

だから私たちは両端で無料にする。オープンリポジトリとしての生のリスト、そしてホストされたAPIの無料レイヤーとしてのルックアップ。どちらが合うかを選んでくれ。

使い捨てメール検出とは何か

メール検証という専門分野は、安価なチェックを高価なチェックの前にレイヤー化したスタックだ。まず構文検証 — アドレスがパースできるか、文字が合法か、長さが254以下か。次にドメインチェック — DNSにドメインが存在するか、SMTPを受け入れる場所を指すMXレコードがあるか。次にメールボックスレベルのチェック — サーバーが実際にそのローカルパートのメールを受け入れるか、拒否するか。各レイヤーは前のものより高コストで、より多くの情報を明らかにする。

使い捨て検出はドメイン検証とSMTPプロービングの間に位置し、スタック全体で最もレバレッジが高い単一のチェックだ。理由は単純。使い捨てドメインに対するSMTPプロービングはしばしば「受け付けた」を返す。一時的なインボックスが — 数時間だけ — 実際に存在しているからだ。検証サービスはアドレスを有効とマークする。キャンペーンプラットフォームは配信済みとマークする。そしてインボックスが期限切れになり、あなたのメッセージは受信者がもういないサーバーに届き、ハードバウンスがあなたの送信ドメインに帰属する。SMTPはここでは助けにならない。SMTPは真実を言っている。チェックの時点でインボックスは本当に存在していた。問題は「今存在する」と「シーケンスのステップ3に達したときに存在する」は同じではないということだ。

これを確実に捕捉できる唯一のシグナルはドメイン自体だ。yopmail.com がリストにあれば、yopmail.com のすべてのアドレスは使い捨てだ。メールボックスサーバーが何を言おうと関係ない。リストを改善する賢いアルゴリズムはない。あるのはリストだけで、それがどれだけ完全で最新かだ。

これが「使い捨て検出」が実践では「適切なドメインデータベースを持っているか」に帰着する理由だ。ローカルパートのパターンマッチングは多少役立つ — 12文字のランダムな文字列は疑わしい — が、パターンマッチング単独では正当な人間のメールに対して許容できない偽陽性率を生む。リストがすべてだ。

現在のオープンソースの状況

私たちは使い捨てドメインリストを公開した最初のプロジェクトではない。それを明確にしておきたい。既存のコミュニティは評価に値するし、適切なツールを選ぶには既に何があるかを理解する必要があるからだ。

最も広く使われているオープンリストは ivolo/disposable-email-domains で、もともとIvo Lukačがメンテし、現在は集合的に管理されている。数千のドメインのJSONファイルで、Mailinator、Guerrilla Mail、10MinuteMail、YOPmailのような有名プロバイダーが中心だ。ベースラインとして優秀で、無数のライブラリに組み込まれてきた。その限界はカバレッジで、長年稼働してきたブランド名の使い捨てサービスは捕捉するが、新しいプロバイダーのロングテールでは大きく遅れる。今日の汚染の大半はそこから来ている。

FGRibreau/mailchecker は最も多言語対応しており、約20言語のバインディングと複数ソースから集めたドメインリストを持つ。ivolo のリストより広く、合理的によくメンテされているが、使い捨て検出をパッケージ配布と束ねているため、更新は基盤となる脅威のペースではなく言語固有のリリースのペースで届く。

他のコミュニティの取り組みとして 7c/fakefilter(使い捨てフィルタリングに特化し、issueトリアージが活発)、amieiro/disposable-email-domains(WordPress向け、許可リストと拒否リストに整理済み)、martenson/disposable-email-domains(古くからのキュレートリストのひとつで今でも広く参照される)がある。それぞれにトレードオフがある。私たちのテストでは、どれも本番トラフィックで私たちが見る使い捨てドメインのごく一部しか捕捉できない。

これらのギャップの構造的な理由はメンテナーの努力ではなく、データフローだ。ボランティアキュレートリストは、誰かが新しい使い捨てサービスに気づいてプルリクエストを出したときに更新される。そのPRがマージされる頃には、サービスは数週間か数ヶ月ライブで、すでに数千のリード生成データベースにシードされている。このラグはモデルに本質的なものだ。

github.com/BillionVerify/disposable: 私たちのリストが違う点

私たちのリポジトリは毎日自動で更新される。BillionVerify の検証トラフィック全体と補完的なシグナルソース群を通じて新しい使い捨てサービスが出現するのを観察するパイプラインからだ。コミュニティのレポートを待たない。データセットはボランティアがメンテする代替手段のどれよりも大幅に大きく、過去2年間で私たちのお客様のバウンス率問題の実際の原因となってきたロングテールプロバイダーのカバレッジがより広い。

リポジトリはプレーンテキストとJSONで生のドメインリストを提供する。インストールするライブラリも、統合するSDKも、バージョンドリフトもない。ファイルを引っ張り、アプリケーションに組み込めば、使い捨てチェックが動く。ライセンスはMITで、商用製品で帰属表示なしで使えるし、自由にフォークして再配布できる。

収集・検証・重複排除の方法論も公開する。オープンデータセットの価値はその監査可能性にあるからだ。使い捨てドメインのクローズドリストは、たとえ大きくても、何が入っていてなぜかを調べられないので、オープンなものより価値が低い。このデータセットを研究者、詐欺対策チーム、競合する検証サービスが構築の基盤にするものにしたい。

他のベンダーがこのリストを使うことを期待し、歓迎する。誰かを締め出すためではない。使い捨て検出のフロアを全員に対して無料かつ最新にして、メール検証での競争が実際に重要なレイヤー — SMTPインテリジェンス、キャッチオール分類、役割ベースフィルタリング、インフラの信頼性 — に移行することが目的だ。

無料API: セルフホストを望まない場合

独自のコードベースにリストを組み込みたくないチームのために、同じデータをホストされたAPIの裏で動かしている。BillionVerify 検証プラットフォームには専用の /v1/verify/disposable エンドポイントがある。サインアップフォームとリアルタイム検証専用に構築された — 純粋なインメモリルックアップで、一桁ミリ秒のレスポンス。呼び出してもクレジットはゼロ、残りの検証ボリュームでどのプランを使っていても関係ない。BillionVerify アカウントとAPIキーは必要(プラットフォームの他のエンドポイントと同様)で、アカウントごとの標準レート制限の下で動くが、どれだけ頻繁に呼んでもクレジット残高に対するメータリングはない。

使い捨て検出はメインの検証エンドポイント — /verify/single/verify/bulk/verify/file でも無料だ。10万件のアドレスリストをアップロードして1万2000件が使い捨てだと判明した場合、SMTPキャパシティを消費する前の計画段階で使い捨てのものはフィルタリングされ、残りの8万8000件分だけ請求される。メール検証の残り — キャッチオール検出、SMTPプロービング、役割ベースフィルタリング、完全なメールボックス検証 — は通常のプラン料金で請求される。これらのチェックには実際の計算コストがかかるからだ。使い捨てレイヤーだけがアンバンドルされて無料になる。唯一の例外:使い捨てアドレスに対してSMTPプロービングを明示的にオプトインした場合(ほとんどのユーザーが触らない設定)、プローブを実行して確定的な結果が返ったらクレジットを1つ消費する。

このポリシーの理由は単純だ。使い捨て検出に課金することは、正しいことをしているお客様をペナルティにする。送信前に検証を走らせているお客様は、メールボックスプロバイダーのエコシステムをジャンクから守っている。リストがどれだけ汚いかによって請求が増えることでそれを抑制したくない。使い捨てルックアップの実際の計算コストはわずかだ。責任ある行動を無料にして、残りのサービス料金 — キャッチオール分類、SMTPプロービング、完全なメールボックス検証 — を実際の計算コストに基づかせる方がいい。

使い捨て汚染が最も痛い場所

使い捨てフィルタリング前後のメール到達率 — ギャップがすべてを物語る

使い捨てインボックスはメールリスト全体に均等に分布しない。特定の獲得チャネルに集まり、そのチャネルは送信者が最高ボリュームで最小のエラーマージンで動いているものと重なる。

コールドメール

コールドメールは使い捨て汚染において最高リスクのチャネルだ。前提そのもの — リストにオプトインしていないプロスペクトにリーチする — が、新しい送信者をゲートキープするためにメールボックスプロバイダーが使うバウンス率閾値以下で動くことにかかっているからだ。コールドメールバッチでの使い捨てヒットは、無駄なメッセージだけではない。ドメインレピュテーションイベントだ。SmartleadやInstantlyのような送信プラットフォームはバウンス率が2〜3%を超えると自動でキャンペーンを一時停止する。未検証のリードリストで私たちが日常的に見る5〜10%の使い捨て汚染は、確実にその閾値を超える。コストはバウンスのコストではない。クールダウン期間と良好な状態への緩やかな回復のコストだ。

Googleマップのリードスクレイピング

Googleマップは中小企業の連絡先データの最も豊富なソースのひとつだが、マップリスティングからスクレイピングしたメールアドレスは一貫性がないことで知られる。多くの中小企業は実在するが無関与のgeneric info@やcontact@アドレスを公開する。他は、基礎となるプロバイダーが時として使い捨てリストに掲載される安いメール転送サービス経由のアドレスを公開する。そして無視できない少数 — 特に新規または一人運営のビジネス — は使い捨てアドレスをそのまま公開する。ビジネスオーナーがリスティングを設定したときにthrowawayを使ったからかもしれない。マップスクレイプをアウトリーチプラットフォームにインポートする前に使い捨てリストと照合することは必須だ。

データプロバイダーからのB2Bリード

B2Bリードデータベース — Apollo、ZoomInfo、Cognism、Clay、Lusha — はウェブスクレイピング、公開ファイリング、ユーザー提供データから連絡先を集約する。品質はビンテージとソースによって劇的に異なる。私たちは主要プロバイダーのリストが最悪の部分で2〜5%の使い捨てを含むのを見てきた。特にコンタクトデータが、ユーザーが日常的にthrowawayアドレスを提供するフリーツールのサインアップフォームからソースされた場合だ。良いプロバイダーはこれを把握して配信前に検証する。残りはクリーンアップのコストをあなたに転嫁する。

地域ビジネスへのアウトリーチ

地域ビジネスへのアウトリーチ — レストラン、コントラクター、小売、サービスプロバイダーを対象とするエージェンシーとSaaSツール — は使い捨てリスクプロファイルでGoogleマップスクレイピングと構造的に似ている。地域ビジネスはエンタープライズの連絡先よりも非標準なセットアップでメールを運用している可能性が高い。Cloudflareメールルーティング、無料ホスティングプロバイダー、時にはビジネスディレクトリリスティングに記入するときのプライバシーバッファーとして使われる完全な使い捨てサービス。このセグメントのメールインフラの多様性から、ドメインリスト検証が唯一実用的な最初のフィルターになる。

スケールでアウトリーチを走らせるB2Bエージェンシー

B2Bエージェンシーはコールドアウトリーチの世界で最高ボリューム端に位置し、結果としてキャンペーンごとに最も多くのレピュテーションリスクを吸収する。100の送信ドメインをまたいで15クライアントのアウトバウンドを走らせるエージェンシーは、それらのドメインのどれかが汚染されたことを送信後に発見する余裕がない。単一の悪いキャンペーンの爆発半径はクライアントリスト全体に波及する。リストクリーニング段階での使い捨てフィルタリングが、スケールできるエージェンシーとレピュテーションの火消しを常にしているエージェンシーの差だ。

これら5つのシナリオ全体に共通するパターンはボリュームと不透明性だ。エンドツーエンドでコントロールしていないコンタクトセットに対してスケールで送信している。アドレスごとに、どの連絡先が本物でどれがthrowawayかを知る方法がない。ドメインリストは利用可能な最も安く、速く、再現率の高いフィルターであり、送信前にそれを適用することが、到達率のサクセスストーリーと到達率のインシデントの差だ。

メール検証市場の他と比較して

すべての主要なメール検証ベンダーが使い捨て検出を提供している。私たちの知る限り、無料にしているところも、リストをオープンソースにしているところもない。私たちの比較ページでフィールドとの一対一の詳細を見ることができる。ここでは各社が使い捨てをどう扱うかの短いバージョンを示す。

ZeroBounce、NeverBounce、Kickbox、Emailable、EmailListVerify、ClearOut、Bouncer (UseBouncer)、EmailHippo、Mailtester Ninja、Hunter.io、Verified.email — すべてコア検証結果の一部として使い捨てアドレスを検出する。使い捨てチェックはアドレスごとの価格に含まれる。10万件のメールを検証して2万件が使い捨てだった場合、10万件全部に課金される。これらのベンダーは基礎となるドメインリストを公開していない。一部は検出データベースに「数百万」の使い捨てドメインを主張するが、私たちが実際に観察したカバレッジはマーケティングコピーよりもオープンソースのベースラインに近い。

ここでの市場構造は単純だ。使い捨て検出は検証スタックで実行が最も簡単なチェックのひとつで、課金の利益率が最も高い。なぜならチェックの実行コストが本質的にゼロ — ハッシュマップルックアップ — で、お客様はどのスタックのレイヤーが判定を出したかにかかわらず「検証済み」ステータスに対して喜んで払うからだ。私たちはそのスプレッドを崩している。

私たちの立場は、メール検証のフロア — 構文、ドメイン存在確認、使い捨てステータス — はDNS自体がコモディティインフラであるのと同様に、コモディティインフラであるべきということだ。ベンダーは本物の専門知識と投資を必要とするスタックの部分で競争すべきだ。リアルタイムSMTPプロービング、キャッチオール分類、送信者レピュテーション分析、MCPとAIネイティブ統合、インフラレイテンシー、カスタマーサポート。使い捨てを無料にすることは、その主張に対して私たちが行動で示す方法だ。

始め方

データが欲しければリポジトリをクローンしてくれ。github.com/BillionVerify/disposable。リストは1つのファイルに入っていて、組み込むかビルド時にプルするのが簡単だ。APIが欲しければ BillionVerify アカウントを作って、APIキーで /v1/verify/disposable を呼んでくれ — 使い捨て検出のための別の請求設定は不要で、どのプランを選んでも無料のままだ。

より高いボリュームで動いていて、SMTPプロービング、キャッチオール分類、バルク処理を含む完全な検証フローに使い捨てチェックを折り込みたい場合も、同じアカウントで動く。それらのフロー内での使い捨てヒットは引き続き無料で、実際に深いチェックが必要な非使い捨てアドレスがあなたのプランクレジットを使う。

私たちはリポジトリを無期限にメンテし続ける。見逃している使い捨てドメインに気づいたら、プルリクエストを出すか連絡をくれ — その日のうちに取り込む。

BillionVerify — オープンソースの使い捨て検出と完全なメール検証

FAQ

BillionVerifyの使い捨てリストは本当に商用利用が無料ですか?

はい。ライセンスはMITで、データのコピーに元のライセンス通知を含めるという唯一の要件で、商用利用、改変、配布、プライベート利用が許可されています。クローズドソースのSaaS製品に直接組み込んだり、CLIに埋め込んだり、モバイルアプリの中に入れたり、競合する検証サービスの基盤として使ったりできます。エンドユーザーへの帰属表示要件はありません。

ivoloやmailcheckerよりリストが完全なのはなぜですか?

ボランティアがメンテするリストはプルリクエストのペースで更新されます。私たちのパイプラインはBillionVerify検証プラットフォーム全体で観察された使い捨てトラフィックと補完的なシグナルソース群から毎日更新されます。結果として、コミュニティリストが見逃しがちなロングテールと最近立ち上がった使い捨てプロバイダーのカバレッジが大幅に広くなっています。主要なオープン代替手段に対するカバレッジベンチマークはフォローアップ記事で公開します。

他のベンダーが課金している使い捨て検出をAPIで無料にするのはなぜですか?

正しいことをしているお客様をペナルティにしたくないからです。送信前に検証を走らせているお客様はメールボックスプロバイダーのエコシステムをジャンクから守っており、リストの汚染度に請求を結びつけてその行動を抑制したくありません。使い捨てルックアップの実際の計算コストはわずかです。責任あるワークフローを無料にして、残りのサービス — キャッチオール分類、SMTPプロービング、完全なメールボックス検証 — を実際の計算コストに基づいて価格設定する方を選びます。BillionVerifyのアカウントとAPIキーは必要で、残りの検証ボリュームは通常のプランで動きますが、使い捨てチェック自体はクレジットを消費しません。

APIを使うべきですか、それともリストをセルフホストすべきですか?

ホットパス — サインアップフォーム、CRMインポート、リアルタイムエンリッチメント — で大量に検証する場合、APIはリストの新鮮なコピーを自分でメンテするよりも速いです。毎日の更新を私たちが処理して一桁ミリ秒のレスポンスが得られるからです。オフラインまたはエアギャップで動いている場合、あるいはサインアップフローの中で外部APIコールを避けるポリシー上の理由がある場合は、セルフホストが正しい答えでデータは同じです。

無料の使い捨てチェックは check_smtp:true と組み合わせて使えますか?

専用の /v1/verify/disposable エンドポイントは使い捨て専用でSMTPプロービングをサポートしません — それには /v1/verify/single または /v1/verify/bulk を呼んでください。それらのエンドポイントでも使い捨てヒットはデフォルトで無料です。唯一の例外は、使い捨てアドレスに対してSMTPプロービングを明示的に要求してプローブが確定的な結果を返した場合で、そのケースだけプローブが1クレジットを消費します。これはオプトインで、ほとんどのユーザーは触りません。

コールドメールやB2Bアウトリーチのワークフローにどう統合しますか?

最も簡単な統合は、送信プラットフォームにインポートする前にコンタクトリストを /v1/verify/file に通すことです。使い捨てアドレスは計画段階でフィルタリングされ、キャンペーンには入りません。継続的な獲得の場合は、新しい連絡先を生成しているフォーム、スクレイパー、エンリッチメントステップに /v1/verify/disposable ルックアップを追加してください。使い捨てアドレスをCRMに蓄積してからではなく、ソースで捕捉できます。

Leo
LeoFounder, BillionVerify
メール検証のインサイト

今すぐ検証を開始

今日から BillionVerify でメール検証を開始しましょう。サインアップすると 100 個の無料クレジットが得られます。クレジットカード不要です。正確なメール検証で、メールマーケティングの ROI を向上させている何千もの企業に参加しましょう。

クレジットカード不要 · 毎日 100+ 無料クレジット · 30 秒で開始

99.9%
精度
Real-time
API 速度
$0.00014
1 通あたり
100/day
永久無料