公衆衛生博士学生が、結婚相談所の成婚率の定義について考えてみた

考察

最近、結婚相談所YouTuberの動画を視聴するのに嵌っていたのだが、「成婚率の定義が結婚相談所によってばらけている」という主張を何度も繰り返していた。あるときあと、結局どんな計算手法が結婚相談所の動態を表すことが出来るのだろう? 他の指標はどういう意味合いがあるのだろうか? と真面目に考えたくなった。

この記事では、結婚相談所の“成婚率”の定義に関して、公衆衛生の領域での研究者が実際に使われている指標等を比較して、それぞれの指標がどんな特徴があるのか数値実験して比較してみた記事となる。単に「定義が違うから参考になりません」というのではなく、どの計算方法がどんな意味を持ち、どれだけ誤差や見たい動態を捉えられているか、捉えられていないかを詳らかにしていきたい。出来るだけ事前知識がなくとも理解出来るように努めているつもりだが、他の結婚相談所関連の記事に比べてかなり難解になってしまっていることはご了承ください。統計の知識をある程度持っている人に向けて端的にこの記事の内容をまとめると、生存時間解析に加えて時系列解析の知識を組み合わせると理解が深まり、極論、生存時間解析を当ててしまおう、という話に終着する。

考え始めてみると、結婚相談所各社が定義がばらける理由もある程度分かってくるし、結婚相談所の会員動態を正確に捉えるような解析は一筋縄ではいかないことも分かる。だが、その結果、ほぼ全ての現在使われている指標は何かしらの問題点が存在し、会員動態を適切に捉えていないという結論に個人的にはなった。ある程度、バイアスが入っても問題ないと思う人もいるかもしれないが、動態を出来るだけ適切に表現する方法を学ぶことは、ユーザーよりも運営側にとって重要なことかと思う。具体的にはどんな施策が効果があるのか、どんな取り組みをしている結婚相談所が優秀な成績を挙げているのか、どんな集団に課題があるかなどを分析していくのに重要になっていく。

この記事では、様々な“成婚率”の指標に関して疫学という学問領域を背景に解釈を与え、シミュレーションを用いて定量的に分析を進めて行く。“成婚率”に関する知識を深めることによって、事業者はより良いサービスを提供し、利用者はより良い事業者を見つけられる一助になることを願っている。

なぜ、結婚相談所の“成婚率”の定義に興味を持ったのか?

この記事を書くに至った背景の一つとして、上記に挙げたもっともらしい理由も確かにあるのだが、実際のところ、この“成婚率”の統計指標としての性質自体が面白いテーマに思えたところが大きい。というのも、結婚相談所のサービスの特徴が、統計の世界のある概念と丁度構造が同じであり、その概念を援用して解釈出来そうだったということがある。具体的に説明していこう。

結婚相談所というのは、ある事業所に「入会」をして、その中で「結婚相手探し」をする期間があり、晴れて結婚相手が見つかれば「成婚退会」する。もし、「結婚相手探し」が上手く行かなければ「中途退会」をしてサービスが使えない状態になる。統計学的な言い方をすると、結婚相談所というのは「入会」という一次イベントが起きて、「結婚相手探し」という結婚に近づく確率過程があり、「成婚退会」もしくは「中途退会」という二次イベントが起きて結婚相談所内の会員動態から抜けるという表現が出来る。

このサービスの一つ一つの過程が他のサービス事業と際立って違う点が幾つかある。

  • その1: 成果(報酬)型のサービスであるにも関わらず、成果が達成される確率が100%には程遠い。つまり、サービスを使うにも関わらず、成婚して退会することが確約されていない。その結果として、人によって利用期間が大幅に異なる上に、成果(成婚)が達成出来るかは個人によって大きく可能性が異なる。
  • その2: 成果が1人に対して1回しか発生しない。結婚相談所というサービスを使う場合、結婚相手を一度見つけたら何度もその相談所のサービスを受けることはない。
  • その3: 良い相談所であるほど、結婚相手探しの期間は短くなる。例えば、Gmailなどのアプリならば良いサービスであれば長く利用するようになるのが一般的であるが、結婚相談所の場合、良い相談所であるほど在籍期間は短くなる。すなわち、平均在籍者数の多寡がサービスの品質に直結しない。

このような特徴を並べていったときに突然気付いたのが、この相談所内の会員の動態は疫学/生物統計で良く用いられる生存時間解析の枠組みと一致するということだ。例えば、「病気」という一次イベントが発生して、「病気の進行/治療」という経過を挟み、「死亡」もしくは「治癒」という二次イベントが起きる動態を解析する理論枠組みが生存時間解析である。

しかし、結婚相談所での “成婚率”の計算は一般的な生存時間解析よりもさらに難しい点がある。それは、入会者数の動態も気にする必要があるということだ。結婚相談所を評価するといったとき、大きく分けて2軸に分けて評価する必要があると思う。一つは、量的な面から新規入会者数の推移、これは如何にその事業所が人を集客出来ているかという側面を評価する。もう一つの軸が、 “成婚率”でサービスの質を評価する。ここで難しい点は、 “成婚率”を評価する際に適切な指標を選ばない限り、容易に新規入会者数が “成婚率”に影響を与えてしまうことにある。この辺りに関して本記事では丁寧に実際の数値を示しながら、機序について説明していこうと思う。

まとめると、”成婚率”という概念そのものが実は幾つかの公衆衛生上の統計解析の概念と類似性があり、かつ、結婚相談所というサービス形態の特異性から解析のテーマとして考えるのが面白そうだったから、記事を書いてみようと思った。

用語の整理とこの記事で触れないこと

冒頭から “成婚率”という言葉にダブルクオーテーションマーク(“”)を付けているのは、日本語の “率”という言葉は非常にややこしい用語だからだ。この”率”という言葉一つで似て非なる概念を同じように示してしまう。具体的には、 “率”という言葉で確率 (probability)、割合 (proportion)、比 (ratio)、発生率 (rate)のどれかを指しているが、冗長に言うか定義を確認しない限りどれかは判然としない。そのため、本記事では、”成婚率”という言葉は出来るだけ避けて、“率”という言葉を確率、割合、比、発症率それぞれに置き換えて記述する。そうすることにより、それぞれの指標の意味をより明瞭に出来ると考えるからだ。

また、結婚相談所における専門用語について以下にまとめておこう。

  • 結婚相談所: 大枠としてはマッチングサービスと分類され、結婚相談所や結婚情報サービス行などが含まれる。大きく次の3つに分類される: 仲人・結婚相談型、データマッチング型、インターネット型に大別される。本記事では、イメージしやすいように全ての事業を一括して結婚相談所と記述していく。
  • 成婚: あるサービス上においてカップルが結ばれたタイミングを指す。事業者ごとに成婚とみなす条件は異なり、一番条件が厳しい定義だとプロポーズをしたタイミング、軽い定義だと交際の開始などが挙げられる。
  • 退会: この記事で退会と書く場合、成婚退会と中途退会の二種類がある。成婚退会はカップルが成立して退会する場合、中途退会はそれ以外の理由でサービスを退会した場合を指す。 退会者数と言う場合は、成婚退会者数と中途退会者数の合計であることに注意。また、成婚退会者数は成婚者数と本記事の中では同義である。

本記事では、 “成婚率”の指標について焦点を当てて解説をしていく。その一方で、“成婚”の定義については一切触れない。そのため、 実際の結婚相談所を検討する際には、“成婚率”の定義だけでなく “成婚”の定義も考慮して比較する必要がある点について注意しよう。また、本記事においては、個別の相談所・サービスの数値については触れないようにし、いわんや、どのサービス・結婚相談所が良いかについては一切触れない。(ここで示したフレームワークを使えば、仮定を置きながら異なる指標を同じ土台で比較するように換算することは、限界はあるものの可能であることは指摘しておく。)

真の成婚率は観測し得ない

まず、”成婚率”の様々な指標について議論する前に真の“成婚率”とは何かについて考えてみよう。“成婚率”という指標では、各結婚相談所におけるサービスの質が評価したい。ここではサービスの質を「ある人が結婚相談所に入ったときの成婚しやすさ」と定義しよう。更に言い換えると「結婚相談所への入会後、どれくらいの確率で成婚出来るか」といえると思う。これを真の成婚確率と呼ぶことにしよう。もちろん、結婚相談所は人と人との出会いのため、個人の性格・容姿、社会ステータスによって成婚のしやすさは異なると思うが、平均してどれくらいの確率で結婚相手を見つけられるかという指標によって結婚相談所を評価したいものとする。

実は、この真の成婚確率を計算しようとすると途方もない時間が掛かるという結論になってしまう。例えば、ある人は入会してから1年後に成婚して退会したとする。これは成婚しているので分かりやすいだろう。では、入会してから5年経ってまだ成婚していない人は成婚するだろうか? 直感的には5年経っても成婚しないと一生成婚出来なさそうだが、入会して10年経ったら? 50年経ったら? 物事には万が一というものがあるので可能性の棄却は出来ないだろう。 そう、一人一人の真の成婚率を測定しようとすると、結婚相談所に入会した後、極端な話、その人の寿命が尽きるまで経過を追わなければならない。そして最後の最後に死ぬ瞬間まで結婚相談所で成婚出来なかった時に始めてその人は「成婚しなかった」と言うことが出来ると思う。このように一人が死ぬまでの経過を追い、成婚するかしないかを調べてようやく、成婚した人の人数を「成婚した人+成婚していない人」の数で割り算をして真の成婚確率を計算することが出来る。

・真の成婚確率は、全ての入会した人を死ぬまで追い続けて成婚しないことを見届ける必要がある。

だが、この真の成婚確率、実務上は甚だ意味のない指標と言ってしまって良いだろう。1世代経っても結果が出てこない指標など今を生きる我々にとっては何の価値もない。もし、真の成婚率を計算出来たとしても、その成婚率は自分よりも数十年、数百年前の人のデータであり直近の社会情勢を反映したものとは言えないだろう。そこで、もっと現実的な指標に関心を移す。例えば、1年後に成婚したかどうかを考えてみよう。これならば、結婚相談所に入会した人全員を追って、1年後に成婚したかどうかを調べ入会した人の総数で割れば1年後成婚率を計算することが出来る。つまり、時間によって条件付けることで我々は条件付け成婚確率ならば計算出来るということができる。ここで、n年後成婚確率を「入会してからn年後に成婚する確率」と定義しよう。

・n年後成婚確率 = 入会してからn年後に成婚する確率 

我々が全てのn (1年、2年、はたまた0.5年、1.5年など)に対してn年後成婚確率を知れるとしよう。その場合、横軸に入会からの年数、縦軸にn年後成婚確率を取ることで以下のような曲線を得ることが出来る。これを、結婚相談所における成婚率曲線と呼ぶことにしよう (注1)。

図1: 成婚率曲線の例。人が100人居れば、約22人が1年後に成婚、38人が2年後に成婚出来ることを表している。

・注1: 統計の専門用語としては、累積密度関数(cumulative density function, CDF)に真の成婚確率を掛けたものとなる。一般的な生存時間解析の文脈においては1-CDFで表される生存時間曲線(survival function)を描く。しかし、成婚というイベントはポジティブな意味合いを持つため、この記事では分かりやすさを優先し、累積密度関数で説明をしている。

この成婚率曲線の読み方としては、あなたがこの成婚率曲線を持つ結婚相談所に入会したならば、1年後に成婚出来る確率は 21.9%、2年後ならば38.0%ということになる。真の成婚確率は40%と仮定しているのだが、この結婚相談所においては2年経てばほとんどの人が成婚しているため、2年後成婚確率を真の成婚確率の近似として用いてもよいだろう。また、2年後成婚確率が高ければ、真の成婚確率も高く、良い結婚相談所ということができる。

この章のまとめとしては、私たちが興味のある”成婚率”というのを掘り下げて考えてみると、入会後どれくらいの確率で成婚出来るかといえるが、真の成婚率を正確に知ろうとするとそれぞれの人を死ぬまで経過観察する必要がある。そのため、現実的に我々が知れるのはn年後成婚確率という条件付けの確率であり、入会してからの時間を考慮する必要がある。この記事ではn年後成婚確率を連続的に描いたものを結婚相談所の成婚率曲線と呼ぶことにした。

便宜的に、真の成婚率曲線を描いたが、この成婚率曲線を求めることは単純な計算では出来ないし、時間と共に形状も変化してしまうことに注意しよう (注2)。また、結婚相談所の平均であって、あなたの場合は違う曲線を描くことになるだろう。例えば年収が高ければ早く高い確率で成婚が訪れるだろうが、条件が難しい人は遅く低い確率で成婚を勝ち取る必要がある。

・注2: 高度な統計手法と幾つかの仮定を置くとこの曲線を求めることが出来るが、この記事の本筋からずれてしまうためここでは触れない。興味のある方は生存時間解析の教科書を読んでみること。医学系のテキストで取り扱われることが多いため、結婚相談所の入会を病気の発症、成婚を病気による死亡とみなすと同様の枠組みで取り扱うことが可能なはずだ (退会という競合リスクを考える必要があるので入門からもう少し勉強する必要がある)。

n年後成婚確率の計算方法

我々は一つ前の章でn年後成婚確率という理論的な値を導入した。もし、観測した会員の数が十分に多く、中途退会の人の数が十分に少ない、もしくは中途退会の多くが成婚退会の平均よりも遅い場合が多ければ、n年後成婚確率は以下の計算で近似出来る。

・n年後成婚確率 =  (x年の入会者のうち)n年以内に成婚した人の数 / (x年における)入会者数

細かい話だが、なぜ太字の条件が入るかと言うと、上の式だと、入会してから入会してから1ヵ月で中途退会した人も5年在籍して中途退会した人も分母で同じ1人と計算している。もし、結婚相談所の質をみるために様子見で入会し、すぐ退会する人が多いならば、n年後成婚確率は過小評価されてしまうことになる。つまり、もし、1ヵ月で中途退会した人が継続的に同じ結婚相談所に居れば成婚する可能性があったはずだが、その可能性は考慮されていないことになってしまう。特に、インターネット型の事業者で入会の値段が非常に安い場合はこの点を補正しなければ誤った結論に陥ってしまうだろう。

ここで、実際に上の値の計算手順を説明することで、この指標は”入会日”ごとに考える必要があり、 “退会日”でまとめてはいけないことを示そうと思う。自分たちが結婚相談所を運営し、会員のデータをエクセルで管理していると仮定し、そのデータを用いて1年後成婚確率を計算してみよう。今回は、2025年12月31日時点における1年後成婚確率に興味があるとしよう。

使うカラムは、入会日、退会日、会員状態(在籍、成婚退会、中途退会)3つの項目だ。結婚相談所において、退会といった場合、成婚してから退会する場合(成婚退会)と何らかの事情によって相手を見つけられず退会する場合(中途退会)がある。Excelでデータを管理している場合(注3 )、最新のデータはこのようになっているだろう。恐らくやり勝ちなこととして、退会日でソートを掛けて最新の退会者の数を数えたくなるだろう。今回の場合、2025年9月に成婚退会者が1人、中途退会者が1人。これらの値を使って、“成婚率” 50%と言っている場合がよくある。

図2: 会員データの例。退会日でソート済み。

・注3: もちろん、筆者はエクセルでのデータ管理など全くお勧めしていない。顧客システムなどあれば全面的に依拠しよう。今回は作業をイメージしやすいようにExcelを取り上げているだけである。

しかし、1年後成婚確率を計算するにはこの方法ではダメだということを指摘する必要がある。なぜならば、入会した人が1年経過したときに成婚しているかどうかを確認したいため、そもそも1年経過していない人は計算から外す必要がある。つまり、上の表をしっかり入会日でソートを掛けて以下の表の状態にする。

図2: 会員データの例。入会日でソート済み。

つまり上の表で青掛けされた部分の会員たちは、1年が経過していないため、どんな結果であれ解析から外す必要がある。そのため、1年後成婚確率は正確な値を求められる一方で、直近のデータを全く使わないため直近の改善が一切指標に反映されないという弱点がある。

そして、1年以上経過している会員の中から、1年以内に成婚している人の数を数える。今回の場合は2025年12月31日時点での1年後成婚確率を求めたいため、計算に組み込める人は会員no6の人までで、そのうち1年以内に成婚した人は、3人。そのため、この結婚相談所における1年後成婚確率は50%ということが出来る。

つまるところ、成婚率の計算においては入会時期が同じグループごとに計算する必要があるということだ。もし、2024年で入会した人に焦点を当てれば、2024年入会組での1年後成婚率を計算することも出来る。

一方で、上の計算で外されたように2025年入会組で1年後成婚率は計算出来ない。これはかなり問題だ。例えば、より真の成婚確率に近い2年後成婚率を計算しようとすると、2025年12月31日時点では、2024年入会組を計算に組み込むことは出来なくなってしまう。これ恐らく結婚相談所を運営する人にとってもどかしい事実だろう。新しい取り組みを新規入会者や入会している人に対して行ったとしても、その評価を反映出来るのはそれぞれ1年後、2年後ということになってしまう。一応工夫としては、0.5年成婚率などを用いて短期的な比較をするといったことや、観測してない部分を補正して上記の成婚率曲線を推定する手法は存在する。

今回検討する指標について

ここまでで、真の成婚確率とn年後成婚確率を見てきた。これらの指標は、確率と呼ばれるもので、「結婚相談所やそれに類する事業所に入会した際にn年後に成婚出来る」というイベントの起こる度合を表している。だが、上でみたように、このn年後成婚確率は少し計算方法が厄介だ。それぞれの個人に対して、n年以上在籍が過ぎている、かつ、n年以内に結婚が行われているという事象を判断していく必要があるからだ。もし、大規模な結婚相談所の調査をしなければいけなくなった歳には、各相談所がこの指標を正しく計算出来ているか確認する方法も乏しいことも懸念点だ。

そこで、新たにn年成婚割合という指標も考えておきたい。n年成婚割合は「x-n年入会者のうちx年までに成婚者数 / x-n年入会者数」で計算出来ることとする。n年後成婚確率と非常に似ているのだが、n年後成婚確率は日付単位で経過日数を気にするのに対し、n年成婚割合では、入会年しか気にしないことにする。例えば、2024年5月入会した人が、2025年8月に成婚退会した場合、1年後成婚確率では、1年以上かけて成婚したためカウントしないが、n年成婚割合では、2024年に入会した人が2025年に成婚退会したのでカウントする。この指標の良いところは、各年度の入会者数と入会年度ごとの成婚者数を各相談所に報告させることで計算が可能になるということだ。厳密には数か月単位で数値がぶれてしまうのだが、正確さを損なってでも簡便さが保障されるのは良いことだ。

上の2つに加えて、結婚相談所でよく使われている計算手法それぞれに対して、筆者が勝手に命名をして表にまとめた。指標名は意味合いを考慮して名付けて、あたかもそういう名前のように説明していくがこの記事独自の命名であることに注してもらいたい。”成婚率”という言葉の混乱を避けるために “率”は確率 or割合 or比or発生率という冗長だが意味が明確になるようにしている。

指標名計算方法
n年後成婚確率入会してからn年後に成婚する確率。成婚率曲線から計算する”真の成婚率 (成婚確率)”。
n年成婚割合x-n年入会者のうちx年までに成婚者数 / x-n年入会者数
平衡近似成婚率(x年における)成婚者数/新規入会者数
成婚発生率年間成婚者数 / 年間在籍者数
退会者内成婚比年間成婚者数 / (年間成婚者数 + 年間退会者数)
1年以内成婚割合通算1年以内成婚者数 / 通算成婚者数 
通算退会者内成婚割合通算成婚退会者 / (通算成婚者数 + 通算退会者数)
表1: 今回の記事で比較する指標一覧。

何が問題なのか?

冒頭から、何度か述べている現在使われている指標に問題があると何度か述べてきている。物凄い単純化してこの点について説明してみたい。極端な事例として、入会した次の年に半分の人が半分が成婚退会、2年後に残りの半分の人が中途退会をする結婚相談所を考えたい。この結婚相談所においては、1年後成婚確率は50%で2年後成婚確率も50%である。なぜなら半分の人が1年後に成婚退会するからだ。そうすると、どんな指標を用いてもこの結婚相談所の “成婚率”は50%であってほしい。

しかし、次のようなシナリオを退会者内成婚比を用いて考えてみよう。この相談所において、2020年は入会者数が2人、2021年は4人、2022年は8人、2023年は16人だとする。このとき、各年における退会者を用いて退会者内成婚比を計算すると2021年は中途退会者が居ないので100%、2022年は2人成婚退会、1人中途退会で67%、2023年も67%となる。つまり、結婚相談所の真の成婚率は50%にも関わらず、退会者内成婚比を見ると67%と17%も高くなっていることが分かる。

図4: 単純化した結婚相談所動態の例。

上の図を見れば明らかなのだが、このような現象が起きるのは、入会者が増加局面において、成婚退会と中途退会の時間軸が違う場合、増加している会員のうちの成婚退会者の寄与が大きくなってしまうのだ。その結果、真の成婚率に比べて退会者内成婚割合の値が高くなってしまう。

今の例としては、結婚相談所の入会者数という量の側面では毎年2倍の高成長を遂げているものの質としての成婚率は全く改善していない。それにも関わらず、入会者数が増加局面においては、質を表しているはずの “成婚率”にも、不適切な指標を使うと影響を与えてしまう構造が存在しているのだ。このような誤った値を観測しないためにも、入会者コホートごとに丁寧にデータを見る必要があるのだ。

上の現象を説明するには、入会者数の増減と成婚率曲線と中途退会率曲線の長さの違いという二つの要素の組み合わせによって生じる。この影響を各指標ごとに定量的に見るために、現実により近い形でシミュレーションを行い、どの程度影響があるかを調べていく。

シミュレーションの設定

シミュレーションは以下の手順を踏んで、入会、退会(成婚退会or中途退会)の動態を生成する。ただし、結婚相談所に入会した人のうち、60%が最終的に成婚退会し、40%が中途退会するという仮定を置く。

  • 各月にx人の新規入会が入会する。
  • 各月に入会した人は、毎月、成婚率曲線or退会率曲線(注4)の確率に従って成婚退会or中途退会をする。
  • このプロセスを各月の入会者ごとに繰り返す。

このステップを踏んで得られた入会者数、在籍者数、成婚者数、中途退会者数を用いて各指標を計算する。シミュレーションは4年分実行した後に、4年目に注目して計算を行う。

先ほど示したとおり、入会者数は指標に影響を与える重要な要素のため、入会者数を時々刻々と変化させるパターンを作る。

  • 一定: 新規入会者数(x)は全期間を通して一定。
  • 増加: 新規入会者数(x)は1年で2倍になる。
  • 減少: 新規入会者数(x)は1年で半分になる。

一定はサービスの安定している事業所、増加は特にベンチャー企業などが当てはまるだろう。

  • 4: 成婚率曲線はワイブル分布で平均1年、95%分位点が2年, 中途退会率曲線はワイブル分布で平均2年、95%分位点が3年になるように仮定した。

今回シミュレーションによって得られたデータは以下の図で示している。時間が経過するにつれて成婚者数が増加して一定になるのは、サービス開始時点においては既存の会員がいないため入会者数が増えて成婚者数が積みあがっていくがある時点から、入会者数と退会者数が釣り合って動態が安定するという特徴があるからだ。

図5 : 入会者数、在籍者数、成婚者数、中途退会者数の数の推移。

このシミュレーションが、現実世界と乖離していると思われる仮定は、

  • 成婚率曲線と退会率曲線が常に一定。これは、サービスの質の向上/悪化、サポート体制の変化などが長期間全く変化していないという仮定に相当する。
  • 各会員の年齢や年収の違いは考慮していない。
  • 事業種類の違いによって、特に中途退会率曲線は大きな違いがあると考えられるが、ここでは仲人・結婚相談型サービスを想定して中途退会率曲線を仮定している。(といっても手元にデータがあるわけではないので、中途退会者の方が平均在籍期間が長いという事実しか盛り込めてはいないのだが…) 

シミュレーションには現実との乖離はつきもので、むしろ、上記の要素がない状態でどのような違いが生まれるか観察出来ることに強みがあると言えるだろう。

各指標のパフォーマンス比較

上のシミュレーションのデータを基にして、各指標がどのような値を示すか見ていきたいと思う。

シミュレーションで設定した真の値は以下のようになる。

  • 真の成婚率 (=100年成婚率): 40%、
  • 1年成婚率: 21.9%、
  • 2年成婚率: 38.0%。

これを踏まえた上で、シミュレーションのデータから各指標を計算した数値をまとめた図が以下になる。

図6: シミュレーションで使った設定から計算した理論値と実際の計算値。シミュレーションは各50回行った中央値と95%信頼区間を計算している。

各指標に書かれている横線は、理論値でここからずれているほど指標からずれていると言える。成婚発生率に関しては理論値が計算出来ないため横線が引かれていない。

この図から分かることは、予想された通り、1年後成婚確率、2年後成婚確率は、新規入会者数が増加していても減少していても正しい値を計算出来ていることだ。驚くべきことに1年成婚割合、2年成婚割合という年度で雑に計算した場合でもバイアスの影響はかなり少ないことが分かる。一方で、退会者内成婚割合は40%という理論値に対し、増加局面では60%近く、減少局面では25%と大きく値に差が出てしまっていることが分かる。

これ以降の章では、各指標の細かい解釈と、なぜバイアスが入るかなどについて解説していく。

n年成婚割合

簡単に紹介はしたが改めてこの指標について解説を入れる。n年成婚割合の計算式は以下のとおりになる。

・n年成婚割合 = x-n年入会者のうちx年までの成婚数 / x-n年入会者数

例えば、2025年における1年成婚割合を計算したい場合は、2024年入会者のうち2025年までの成婚数を2024年入会者で割れば求めることができる。

厳密に言えば1年成婚割合は、入会者数が一定ならば平均して1.5年後生存確率に値が近くなる。というのも、2024年入会した人の平均した日付は7月1日になり、2025年までの成婚というと2025年12月までなのでこれが丁度1.5年に該当する。入会者数が2024年の間に増加していると平均の入会日が2024年10月まで遅くなり、平均の婚姻まで観測できる期間が短くなる。これが入会者数増加と減少においてn年成婚割合の値がブレる理由となっている。

図7: n年成婚割合がn年後成婚確率とずれることの模式図。

この指標は図6で見た通り、n年後成婚確率並みに入会者数のバイアスが少ない。また、指標の計算の簡便性があり、小規模な結婚相談所でも手軽に計算出来るため業界として標準化しやすい指標なのではないかと思う。

平衡近似成婚率

次に紹介する指標には平衡近似成婚率という名前を付けてみた。計算式は次で与えられる。

・平衡近似成婚率= x年の成婚者数 / x年の新規入会者数

x年における成婚者数をx年の新規入会者数で割るという式だ。結婚相談所のように会員の入れ替えの動態が複雑であるときにこの指標は現実を反映していないと思う人もいるかと思う。しかし、指標の名前にある通り会員の入会退会が平衡(安定している)ときにはこの数値は特別な意味を持つ。

ここで指す平衡状態は、入会者数・成婚率曲線・中途退会率曲線が長期間の間一定で、成婚退会/中途退会の人数も長期間同じ状態になったときを指す。この仮定が満たされているもとであれば、平行近似成婚率は、真の成婚率を計算していることになる。例えば、先に述べた3つのパラメーター(入会者数・成婚率曲線・中途退会率曲線)が一定だったときの2025年の成婚退会者について考える。

2025年の成婚退会者数の内訳は、2020年に入会して5年経過して成婚した人、2021年に入会して4年経過して成婚した人、…、2024年に1年経過して成婚した人たちで構成される。もし、新規入会者数が一定で婚姻率曲線にこの期間全く変化がなければ逆に見ることが出来る。すなわち、2025年に成婚退会した人は、成婚率曲線のうちで1年以内の人たち(2024年入会)、1年から2年の人たち(2023年入会)、…、4年から5年の人たち(2020年入会)とみなすことが出来る。言い換えれば、2025年入会の人たちを母数としてx年経過後に成婚した人(実際にはx年前に入会した人)を数えるとみなしてあげると、n年後成婚率の定義と一致していることが分かる。

図8: 平衡近似成婚率が真の成婚率と一致する場合があることの図示。

しかし、改めて指摘しておくのは、先に述べた平衡状態の条件がみたされているときだけ、数値が一致するということ。実際には、3つのパラメーター全ては時間と共に大きく変化していくため、実データへの適応には多分にバイアスが入っている可能性があることに気を付ける必要がある。

成婚発生率

成婚発生率は次の式で与えられる。

・成婚発生率 = 年間平均成婚者数 / 年間平均在籍者数 

この式の名前を発生率と名付けた理由は、この数値が1を超えうる値であり、確率でも割合でもないという点を強調するためである。この指標は、結婚相談所に1年間在籍した際にどれくらいの人が成婚が起こるかという値を示している。例えば、全ての人が6ヵ月で成婚する非常にパフォーマンスの良い結婚相談所を考えてみよう。ある年では、年の初めに10人入会しただけだったとき、婚姻発生率は、10/(10*0.5)=2となる。すなわち、この結婚相談所においては1年間在籍すると理論的には2回結婚出来るという解釈になる。

この数値がn年後成婚確率やn年成婚割合と違う点は、入会してからの時間経過を考慮していない点にある。すなわち、入会してからどれくらいの時間が経っていたとしても成婚する確率は常に同じという仮定をしている。これは、今回のシミュレーションで仮定している婚姻率曲線では、1年目では21.9%が結婚出来るのに対し、2年目では38.0%, 3年目以降では2%しか結婚出来ない特徴を無視して指標を計算している点に注目しよう。

こう書くとこの指標は不適切なように思えるが、マッチングアプリに近いサービスほどこの指標の方が適切になり、むしろn年後成婚確率が不適切になってくる可能性もある。n年後成婚確率が特に仲人・結婚相談型サービスにおいて適切であるのは、入会の敷居が高く(例えば高い入会金)、直ぐに中途退会する人が多くないからという仮定があった。そのため、n年後成婚確率は1ヵ月で中途退会する人も5年で中途退会する人も等しく入会者数という形で扱われてしまうがその影響は少ないという仮定が存在していたことを思いだそう。一方で、インターネット型サービスのように入会の敷居が低く、サービスの様子見をして直ぐに辞める人が多数いた場合、直ぐに辞める人すべてを母数に入れることはフェアじゃないという見方も出来る。その際に、成婚発生率はそれぞれの会員の在籍期間を母数として取り扱うことで短い会員の寄与を少なく評価出来る指標となっている。

ただし、この成婚発生率は単純ではない。例えば、成婚出来る確率が入会したタイミングと関係なく一定であったとしても、この母数の年間平均在籍者数は中途退会する人の長さも影響してくる。すなわち、成婚者だけでなく中途退会の動態によっても指標が影響してしまう。以下に、退会率曲線の仮定を変えた場合のそれぞれの場合での成婚発生率を計算してみた。

図9: 成婚率曲線を一定のまま、中途退会率曲線の分布を変更したときの成婚発生率。

この指標は成婚率曲線が一定であったとしても、中途退会率曲線の仮定が変わるだけで、大きく値がぶれてしまうことが分かる。そのため、背景にある動態と合わせて注意深く解釈しなければ数値だけみても解釈はかなり難しいことが分かる。

カラム: 2005年経済産業省のデータからみる“成婚率”

結婚相談所における”成婚率”の定義が10%と言われる理由は、2005年(平成17)経済産業省実施の調査を元に言われている。ざっとデータを探してみたところ、計算に耐えうる信頼性のあるデータが他に見つからなかったので、このデータを丁寧にみていこう。調査においては、平成 16 年度(平成 16 年 4 月 1 日~平成 17 年 3 月 31 日)の値を聞いているようだ。

まず、よく引用される10%が算出されている部分は、p.27の暫定成婚率の算出のページにおいて、 「暫定成婚率 = 平均成婚者数 / 平均会員数」によって計算されている。この定義は、この記事において紹介した成婚発生率の定義と似ているが、母数の平均会員数の定義が違うことに注意しよう。経済産業省の調査では、会員数は”現時点における会員数”であって、年間平均在籍数と乖離がある点に注意しよう。しかし、筆者らにはデータの限りがあるので、ここで少し乱暴な仮定で調査に含まれて相談所全てが平衡状態に達していると仮定する (入会者数・成婚曲線、中途退会率曲線が長期間一定)。その場合においては、現時点における会員数を年間平均在籍数と見なすことが出来るので、これは”年間成婚発生率”を見ていることが分かる。全体では、”1年その結婚相談所に在籍した場合成婚が発生する確率”が男性8.5%, 女性10.1%ということになる。しかし、知りたいのは冒頭に述べた”結婚相談所に入った場合に成婚出来る確率”を表す成婚率である。今回、勝手に平衡状態を仮定していることと、平均新規加入者数が調査に存在するために平衡近似成婚率を計算することが可能である。以下が結果である。

成婚発生率(男)成婚発生率(女)平衡近似成婚率(男) 平衡近似成婚率(女)
全体8.4% (40.3/481.2)10.1% (40.9/405.8)20.2% (40.3/199.4)25.0% (40.9/163.7)
仲人・結婚相談型7.9% (16.9/214.0)8.6% (15.5/180.7)29.9% (16.9/56.5)30.8%(15.5/50.3)
データマッチング型8.8%
(262.2/2994.1)
12.1%
(289.9/2389.9)
28.1% (262.2/1202.3)32.2% (289.9/899.3)
インターネット型1.9%
(29.7/1564.3)
1.3%
(19.6/1547.5)
1.5% (29.7/1916.7)1.2% (19.6/1651.7)
表2: 2005年経済産業省のデータから計算した成婚発生率と平衡近似成婚率。

つまり、”仲人・結婚相談型” or “データマッチング型”であれば、結婚相談所に入った場合に約30%前後の確率で(どれくらい期間が掛かるかは分からないが)成婚することが出来るという解釈になる。一方でインターネット型だと1.2%である。ただし、インターネット型は成婚者数を41.7%の事業者数が把握していないことと、”成婚”の定義が恐らく違うことが挙げられる。また、インターネット型は標準的な料金が他の業種に比べ半分以下であること、5割近い事業者で入会金がないことから、会員になって辞めやすいことが影響していることを考慮する必要がある。それを反映してか、仲人・結婚相談型、データマッチング型では成婚発生率と平衡近似成婚率に大きな違いがあるにも関わらず、インターネット型では数値がさほど変わらない違いがみられている。

  • 注: 2017年度に一橋大学が事業所レベルで同様の調査を行っていた(https://www.ier.hit-u.ac.jp/Common/publication/DP/DPS-A687.pdf )。しかし、平衡近似成婚率を計算すると、非常に高い値が出たため、恐らく回答の値にばらつきが大きすぎて平均を用いるのが不適切だと考え今回取り上げていない。(例えば、全体の平衡近似成婚率が78.7%にまで到達している。)

退会者内成婚比

この指標は以下の式で計算される。

・退会者内成婚比 = (x年における)成婚者数 /(x年における)退会者数

ここでいう退会者数の中には成婚退会者と中途退会者のどちらも含むことになる。この指標は割合という言い方も出来るが、退会者の中での成婚と中途退会の数の比を見ているという言い方が最も適切だと感じる。

この指標は正直かなり解釈がトリッキーになる。というのも、分母が退会者(成婚+中途退会)であり最後のイベントに着目した比を見ているからだ。n年後成婚割合の計算でみたように、成婚率(成婚確率)を見たい場合は入会者の日付をグループとして計算すると良いという話があった。しかし、退会者内成婚比はその原則を破っている状態になる。幾つか例を上げて、この指標の解釈の難しさを見ていこう。

この記事では、入会からの経過年数による成婚率/成婚割合が大事であるというのが一つのメッセージとなっている。最終的に成婚出来る確率が同じならば、平均1年で成婚させる結婚相談所の方が、平均2年で成婚させる結婚相談所の方が良いという前提がある。しかし、もしどちらの結婚相談所も、平均成婚年数と平均中途退会年数が同じであったならば退会者内成婚比はどうなるだろうか? そう、全く同じ値が得られることになる。つまり、退会者内成婚比では入会からの経過年数の情報が失われてしまうことを意味する。例えば、以下のような全く違う性質を持つ結婚相談所であったとしても、退会者内成婚比がは同じであると算出されてしまう。

図10: 退会者内成婚比が全く同じ2つの結婚相談所。

二つ目の難しさは、成婚曲線が全く変わらなくとも、入会者数と中途退会率曲線が変化するとこの指標の値が変わってしまう点にある。これは、成婚発生率でも同様のデメリットとして挙げている。以下が数値実験の結果である。

図11: 中途退会率曲線を変化させたときの退会者内成婚比。

この図からは、入会者数が増加すると退会者内成婚比は上昇し、入会者数が減少すると退会者内成婚比は減少するため結婚相談所を評価する指標として好ましい特性にも思える。しかし、元来、成婚率を計算したかった動機としては、新規入会者数と成婚率(入会後のサービスの質)を区別して示したかったことが挙げられる。そのため、退会者内成婚比を用いると、新規入会者数を二重に評価している状態になる点でかなり好ましくないように思える。

逆に言えば、新規入会者数と成婚率の複合的な指標であるので、新規入会者数を大っぴらに言いたくないときはこの一つの指標で代替させるという戦法もあるのかもしれない。また、よく言われるように退会者内成婚比は退会しないほど上昇するため成婚率を表しているという表現もあるが、これはこの指標が中途退会率曲線の影響を受けているという見方が出来る。もちろん、成婚率曲線と中途退会率曲線は相補の関係性にあるためこの言説は間違ってはいない。しかし、成婚率自体が変化しなくとも中途退会率曲線の時間的な変化、また、新規入会者数の増減によっても値が変わってしまうという点には注意を払いたい。そういう意味では、n年後成婚率とn年後中途退会率を同時に比較する方が、より精度の高い事業評価が出来ると考える。

1年以内成婚割合

この指標は、次の式で得られる。

・1年以内成婚割合 = (ある期間における)1年以内の成婚者数 / 全成婚者数

これは成婚率曲線のうち、1年以内の部分がどれくらいの割合あるかをみていることになる。成婚の動態を調べる上で貴重な統計指標の一つではあるが、会員の動態を調べる上では退会するような人の情報(すなわち中途退会率曲線の情報)が一切入っていない点に注意する必要がある。以下がその意味合いを図示したものになる。

図12: 1年以内成婚割合の成婚率曲線との比較。

つまり、1年以内成婚割合は、成婚率曲線の最大値を真の成婚率ではなく100%にしたときに1年以内に成婚する人の割合をしめしている。つまるところ、1年後成婚確率を真の成婚率で割った値が1年以内成婚割合になる。図からも分かるように、これは本来知りたい “成婚率”に対して退会者の割合を考慮していないため非常に高く値が出る点に注意しよう。

各指標のバイアスの入り方 

最後に、様々な指標を見てきたところで、改めてメインの図6を基に各指標の良し悪しとバイアスの入り方についてまとめておこう。

指標名評価“成婚率”へのバイアスn年後成婚率との関係
入会者数の傾向中途退会曲線
n年後成婚率最も成婚確率を上手く評価できる指標。計算がやや煩雑。なしなしそのもの。
n年成婚割合大規模調査の際に適切。計算は楽。なしn年成婚割合は1年未満のズレがあるn年後成婚率と一致する。
平衡近似成婚率既存データからざっくり成婚率を算出する際に使える。なし
成婚発生率入会と退会の敷居が低い場合に適切。
退会者内成婚割合年間成婚者数 / (年間成婚者数 + 年間退会者数)
1年以内成婚割合通算1年以内成婚者数 / 通算成婚者数 なしなし最終的に成婚する確率が母数になっており、中途退会する確率が反映されていない点に注意。
表3: バイアスの入り方まとめ。

結論

この記事では、結婚相談所で使われる様々な成婚率がどのような特性を持つか説明してきた。特に、真の成婚率は観測し得なく、条件付きのn年後成婚確率を見る必要がある点を強調してきた。一方で、結婚相談所で広く使われている様座な指標は、新規入会者数の傾向と中途退会者の動向によって値の影響が出てしまう指標であることを述べてきた。結婚相談所を評価していくためには、新規入会者数と成婚率の2軸で評価することが大切であるにも関わらず、成婚率は新規入会者数によって簡単に値に歪みが出てしまう点が面白い点だと思う。様々なシミュレーションを通して見た結果、n年成婚割合の指標がその計算の簡便さと指標の性質の良さという2点から見る限り、業界標準として採用しても良いのではないかと考えている。ただし、入会と退会のハードルが著しく低いようなサービスではn年後成婚割合は不適切な指標になる場合があり、成婚発生率の指標の方が望ましい場合があるかもしれないことには注意する必要がある。

急激に少子化が進む社会情勢、かつ、マッチングアプリサービスに限界を感じる人が多くなってきている中、出会いを提供するオプションの一つとして出会い系サービス/結婚サービス事業が再脚光を浴びていると思う。サービスの質を向上させていくための適切な事後評価・事業評価のために、本記事が事業者の皆様の一助となれば幸いだ。また、人生のパートナーとの出会いを求めて結婚相談所を検討している皆さまが、”成婚率”の読み取り方について少し理解を深めることでより良いサービスを見つけられることを願っている。

—– おまけ —–

整理はそんなにされていないが、本記事で使用したR言語のコードは下からダウンロードできる。

コメント

タイトルとURLをコピーしました