SNSによるアクセス集中予測を利用した サーバの自動スケール制御手法


個人の軽率な行為によって多数のインターネット利用者が誹謗中傷を行うインターネット上の炎上(ネット炎上)が発生すると,アクセスが集中する.これによってサービスを提供するサーバに負荷が掛かり,サービスの続行が困難になる場合がある.これを防ぐために,サーバリソースを増強する必要があるが,管理者がアクセス集中の発生を常に監視することは困難である.アクセス集中時に自動的にサーバの数を増減する手法の1つとして,Amazon Web ServiceによるAuto-Scalingがあるが,予期しないアクセスの上がり下がり(ノイズ)によるサーバのプロビジョニングが原因でコストが無駄に増大する問題がある.この問題を解決するため,SNS(Social Networking Service)における集合知に対し機械学習の技術を用いて,ネット炎上に起因するサーバ負荷の突発的な増大による障害の予測を行う手法を提案する.具体的には,(1)Twitterにおける集合知に対し機械学習を用いて,ネット炎上の事象を予測する新規手法と,(2)事象を予測したら,サーバのプロビジョニングをAuto-Scalingからノイズ耐性の高い方式に切り替える新規手法である2つの組み合わせを提案する.(1)に関しては,「炎上」や「バカッター」の言葉を含むツイートを集め機械学習による分類を行ったり,これらの言葉を含まないツイートを捉えて,ネット炎上に関連するツイートを検知し,ツイートの集合に占めるネット炎上に関連するツイートの割合を評価する.(2)に関しては,Twitterによる検知をした後にAuto-Scalingから,サーバのCPU使用率の計測値を平滑化する手法を用いてノイズによるサーバのプロビジョニングを抑える方式へ切り替えを行い,無駄なコストが発生することなくサーバ負荷への対処が可能であることを評価する.

A flaming act in the Internet, or a hostile and insulting interaction between the Internet users, caused by an inappropriate personal behavior results in a large number of accesses, thus, high load generated on the part of servers as well as network equipment hosting the Internet services, and often causes a denial of service situa- tion. Automatically provisioning server resources is a solution for mitigating such situation, and one such example is Amazon Web Service (AWS) Auto-Scaling. However, we posit that frequent fluctuation of workload (so called noise) around the threshold for scaling may incur extra cost in hosting services caused by superficial provisioning in the current auto-scaling methods. In order to solve this problem, it is necessary to automatically predict such flaming acts via collective knowledge on people’s behavior in the Internet, e.g., on Social Network Services (SNS). Therefore, in this paper, we propose a method for automatically detecting the Internet flaming acts in Twitter, and changing the algorithm of auto-scaling from the traditional server workload basis to workload fitting one so that the provisioning endures noise. In more detail, we collect tweets including words such as ”Enjyo” or ”Bakatter”, classify these tweets using machine learning techniques and attempt to detect the Internet flaming acts. Once such flaming acts are detected, we start filtering noise using EWMA in measured values of CPU utilization of the servers to detect the optimal point of provisioning resources. We evaluate how effectively our proposed method infers the Internet flaming acts, and also prevents extra cost caused by noise dealing with server load efficiently.

田原俊一, 中尾彰宏. “SNSによるアクセス集中予測を利用したサーバの自動スケール制御手法”. 信学技報, vol. 115, no. 483, NS2015-254, pp. 499-504, 2016年3月. copyright©2016 IEICE