Teams会議の音声が途切れる問題を解決!
NetFlow分析をサクッと導入する方法

株式会社エアーはメール監査のパイオニアとして1,340社、340万ユーザー(2024年3月末現在)を有する自社開発のソフトウェアを提供するテクノロジー企業だ。社員は多くが大阪と東京にあるいずれかのオフィスに出社しており、在宅勤務する者もいる。全社的にMicrosoft 365を導入しており、日常的に社内外とのTeams会議が行われているが、音声が途切れたり映像の遅延が頻繁に発生したりと、大きな問題となっていた。それについて、「拠点を結ぶ光回線を太くすることを考えました。ただ、その契約を見直す前にネットワークの流量を監視してその事実を確認することにしました」と語るのはエンジニアリングサービス部の津田氏だ。ところが、実際の問題は別のところにあった。

メールの監査や誤送信防止ならWISEシリーズ

株式会社エアー
エンジニアリングサービス部 部長
津田 和宏 氏

——事業やチームの体制、役割について教えてください。

津田氏 当社はパッケージソフトウェアやクラウドサービスの開発、販売をしています。一番の主力製品がメールをアーカイブして監査を支援する「WISE Audit」です。今、注目を集めているのがメールの誤送信を防止する「WISE Alert」で、こちらはAIがメールの内容をチェックして不適切な記載がある場合は通知する機能などを備えています。その他にもさまざまなプロダクトがあります。

我々、エンジニアリングサービス部のメイン業務は、社内の各部門や社外のお客様に対して技術支援をすることです。その一環で社内設備の開発や運用をしています。大阪本社と東京事業所、両方に人員を配置して、どちらの問題にも対応できるようにしています。

提供しているクラウドサービスの基盤にはAzureを採用しており、それらの設備は別の部門が運用しているので、それ以外の社内向けのサーバーやネットワークの運用を担っています。サーバーといってもこれもクラウド移行が進み、今はオンプレのものはほとんどなく、こちらもAzureを利用しています。

Teams会議が切れる原因がわからない

——抱えていた課題はどのようなものでしたか?

津田氏 サーバー監視は行っていたのですが、ネットワーク機器の監視は不十分だったんです。例えば、ネットワークが落ちたり遅延した際、利用者から「ネットワークが切れたんだけど」「ネットワークが急に重くなったんだけど」という問い合わせがあってから動き出すような状況でした。

特に多かったのが「Teams会議が切れる」です。これが非常に厄介でずっと原因がわかりませんでした。

会議に参加している全員が一斉に切れるならまだわかりやすいのですが、特定の端末だけ切れて会議から抜け落ちるということも頻発していて、「ネットワークが逼迫しているのかな?」といったところからいろいろな可能性をひとつずつ調べていくのですが、そうこうしている内に回復してしまうのでなかなか原因が特定できませんでした。

光回線の太さに問題があるのではないか

——どのような対策を取ることにしたのでしょうか?

津田氏 はじめは大阪と東京の2拠点を結ぶ光回線を太くすることを考えたのですが、その契約を見直す前に、ネットワークの流量を監視してその事実を確認することにしました。

そこで注目したのがNetFlowやsFlowです。これらに対応したルーターを導入しておけば流量の分析ができるので、ネットワークが急に重くなった時も誰が何をしているのか追跡できることを知っていました。

そこでいろいろと製品を調べてみたところ、10万円程度の日本製のルーターやスイッチにもsFlow対応のものがあることがわかり、提案することにしました。

sFlowを可視化するための監視ツールは、なるべくコストを抑えたかったので無料で使えるものを中心にいろいろ探した結果、オンプレミス型のPRTG Network Monitorをまずはじめに試すことにしました。

Site24x7を知ったのはこの時で、SaaS型で比較的安価ということで有力でしたが、あくまでも第二候補でした。

——なぜ、それがSite24x7になったのですか?

津田氏 私たちがPRTGを試した範囲では流量の正しい値が取れなかったからです。

sFlowはルーター側でサンプリングしてその統計情報として流量を出すのですが、そのサンプリングレートのチューニングに非常に手こずりました。機器側の設定に合わせて監視ツール側もどれだけのサンプリングレートで集計したデータかといった細かなデータを入れてあげないと正しい流量が出ないんです。

ひと月以上かけていろいろと試行錯誤したのですが最後まで合わず、諦めてSite24x7を試すことにしました。

そうしたら、感動しましたね。

Site24x7の場合は、おそらく機器から受け取ったサンプリングレートにツール側の設定をオートマチックに合わせているのだと思います。もうすぐに、一発で正しい値が出ました。

これまでの苦労は何だったのかと。これが決め手となったと言っても過言ではありません。

——SaaSへのこだわりもあったのでしょうか?

津田氏 無料でできるならオンプレミスのPRTGを選択するつもりでしたが、私の上司にあたるCTOからは「社内設備としてサーバーを運用するのは大変だからできる限りオンプレミス製品ではなくSaaSベースのものを選択してほしい」という要望を受けていました。

というのも、やはりセキュリティパッチが頻繁に出て、そのメンテナンスもあることや、サーバー機器もすぐに3年や5年で保守契約が切れて設備を更改、再構築しなくてはいけない。その手間とコストが大きいことを私もこれまでの経験で痛感していました。

もうひとつは、部分的に適用しているISMSの運用の負荷です。当然設備を持つとそれに対する定期的な保守のルールはどうなっているかなど、細かくいろいろ要求事項があるのですが、それを運用するのが大変なんです。

これらの削減できる運用コストとSite24x7を導入して得られる効果、それとSite24x7の導入コストを天秤にかけた時、メリットの方が大きいのは明らかでした。

異常トラフィックの発信元社員をその場で特定

——運用して実感したその効果を教えてください。

津田氏 合計の流量にしきい値を設定してアラートを発報し、Site24x7のスマホアプリやメール、Slackでその通知を受け取れるようにしているのですが、はじめてアラート通知を受け取った時に2度目の感動がありました。

通知を受けて、思わぬところでアラートが上がったなと思いながらSite24x7の画面を見てみると、誰のどういう通信が原因かというのをパパパパっと表示できました。どこを見たら欲しい情報があるのか、とてもわかりやすかったです。

air-image

NetFlow分析 - 装置パフォーマンス

インターフェースの総トラフィック量がどう変わったかわかる。

air-image

NetFlow分析 - アプリケーション

アプリケーション別のトラフィックの内訳が一目でわかる。

air-image

NetFlow分析 - 会話

誰が帯域を占有しているか一目でわかる。

「会話」タブの画面が知りたいことを知れるので一番よく見ます。DHCPサーバーが割り当てた把握しきれていないIPアドレスが大きな通信をしていれば、それが誰か確認してその場ですぐに「誰々さん?今何してる?」と連絡することもあります笑。

そんなことをしているので、社員も皆、「なんだか監視が始まったらしい」と噂をしているんでしょうね。それが結果的に無駄な通信の抑止効果にもなっていると思います。

光回線の太さは十分だった

——日常的に帯域幅を占めていた通信トップ3を教えていただけますか?

津田氏 1位はオフィスカメラでした。

2位はAzureと当社ネットワーク間をつなぐAzure VPNの通信で、Azure Virtual Desktopに接続するRDP通信とAzure上のファイルサーバーとの通信。

そして、3位がTeams会議の通信でした。

ちなみに、RDP通信が想定と違う経路を通っていることもわかりました。それは今後見直す予定です。

ただ、そういったことがわかると同時に、肝心の疑っていた拠点間の光回線の帯域幅は十分ということもわかりました。なので契約を見直す必要はなくなりました。

——そうなると、Teams会議が切れる原因は何だったのですか?

津田氏 結論から言うと、Wi-Fi干渉でした。

sFlowを活用してSite24x7で通信を可視化したことでさまざまなことが明らかになったので、そこではじめて「Teams会議が途切れる原因は、他社とのWi-Fi干渉なのではないか?」という仮説にたどり着くことができたんです。

例えば、この東京事務所ですとテナントビルなので他社のWi-Fiとけっこう干渉して通信が不安定になるんですね。

2.4 GHz帯と5 GHz帯の両方を使っているんですが、Wi-FiルーターのログやWiFi Analyzerを確認して調べてみたところ、2.4 GHz帯はほとんど他社のWi-Fiと干渉していて、接続が切れたり不安定になることが多いとわかりました。さらに、5 GHz帯もチャンネルが混雑していて、通信速度が出ないことがよくありました。

5 GHz帯には、空いてるチャンネルもあるのですが、上の方の高いチャンネルはレーダー波と干渉する可能性があるんですね。法律で、レーダー波を検出したら1分間通信を止めなきゃいけないと決まってるので、そこを使うとそれが原因でWi-Fiが切れるリスクがあるんです。

それでも、その分空いていることが多いので、最近は混んでいるチャンネルを避けて、あえて上の方のチャンネルを使ったりして、少しでも安定するように工夫しています。

それでもたまにWi-Fiが切れることはあります。

そういう時もまずSite24x7を確認すればすぐに、例えば「トラフィックには問題ないな」とわかって、次にWi-Fiルーターのログを見ると「レーダー波を検知したため通信を一時停止した」とあるので「今回はこれか」と原因がわかります。

こんな風に、社内ネットワークに問題が発生した際に何が原因となっているのか、その切り分けが即座に行えるようになったことが最大の効果と言えます。

今は切り分けをする一番の入口がSite24x7になっていますね。

——大変勉強になりました。最後に、Site24x7を検討している方に一言お願いします。

津田氏 すごく導入しやすいので、まずは無料の評価版で試してその効果を実感してみてください。

 

※この記事は、2025年2月現在のインタビューをもとに作成されています。