Abstract in Turkish
Bulut bilişim, bilgi
teknolojileri çözümlerini, talep üzerine sanal cihazlarla aracılığı ile
İnternet üzerinden sunarak kaynakları paylaşma ve tüketme yeteneği sayesinde,
yakın zamanda cazip bir konu haline gelmiştir. Bahsedilen bu hizmetlerin hızlı
gelişimi sonucunda, bulut bilişimde daha kritik olan güvenilirlik ve bulunurluk
hizmetleriyle, hata dayanıklılığı gerekliliği, bu hizmet tipinde önemli bir
kaygı konusudur. Bu çalışmada, bulut hizmetlerinin hata dayanıklılığı yöntem ve
teknikleriyle birlikte bulut hizmeti alan müşterilerin sistemlerinin ve/veya
işletmelerinin bulut üzerinde hatadan etkilenmeyecek şekilde çalışması
incelenmiştir. Bulut üzerinde çalışan sistemlerde hata beklenmelidir ve hata
oluştuğunda da giderilmelidir. Hata dayanıklılığı stratejilerini oluşturmaktaki
temel amaç iş sürekliliğini sağlamak, parasal kayıplardan kaçınmak,
sistemlerdeki arızaları gidermek ve felaketlerden kurtarmaktır. Çalışmanın özel
odağı, yedeklilik, denetim noktası kullanma ve çoklama kullanarak hatalardan
kaçınma ya da hataları giderme senaryoları üzerindedir. Ticari altyapı hizmeti
(IaaS) sunan Amazon'un AWS ve Google'ın GCE hizmetleri, altyapılarının hatalara
karşı dayanıklı olduğu için örnek olarak alınmıştır. Bu sayede bir sistem ya da
işletme için hata dayanıklılığı olan güçlü bir mimari yapı kurulabilir. Bu
çalışmada hata dayanıklılığı için gerekli genel kavramsal adımlar önerilmiştir.
teknolojileri çözümlerini, talep üzerine sanal cihazlarla aracılığı ile
İnternet üzerinden sunarak kaynakları paylaşma ve tüketme yeteneği sayesinde,
yakın zamanda cazip bir konu haline gelmiştir. Bahsedilen bu hizmetlerin hızlı
gelişimi sonucunda, bulut bilişimde daha kritik olan güvenilirlik ve bulunurluk
hizmetleriyle, hata dayanıklılığı gerekliliği, bu hizmet tipinde önemli bir
kaygı konusudur. Bu çalışmada, bulut hizmetlerinin hata dayanıklılığı yöntem ve
teknikleriyle birlikte bulut hizmeti alan müşterilerin sistemlerinin ve/veya
işletmelerinin bulut üzerinde hatadan etkilenmeyecek şekilde çalışması
incelenmiştir. Bulut üzerinde çalışan sistemlerde hata beklenmelidir ve hata
oluştuğunda da giderilmelidir. Hata dayanıklılığı stratejilerini oluşturmaktaki
temel amaç iş sürekliliğini sağlamak, parasal kayıplardan kaçınmak,
sistemlerdeki arızaları gidermek ve felaketlerden kurtarmaktır. Çalışmanın özel
odağı, yedeklilik, denetim noktası kullanma ve çoklama kullanarak hatalardan
kaçınma ya da hataları giderme senaryoları üzerindedir. Ticari altyapı hizmeti
(IaaS) sunan Amazon'un AWS ve Google'ın GCE hizmetleri, altyapılarının hatalara
karşı dayanıklı olduğu için örnek olarak alınmıştır. Bu sayede bir sistem ya da
işletme için hata dayanıklılığı olan güçlü bir mimari yapı kurulabilir. Bu
çalışmada hata dayanıklılığı için gerekli genel kavramsal adımlar önerilmiştir.
Keywords in Turkish:
bulut bilişim; hata dayanıklılığı; güvenilirlik; bulunurluk; yedeklilik; denetim noktası; çoklama; AWS; GCE
Abstract in English
Cloud computing has recently become an
attractive topic due to its ability to offer information technology solutions
through virtual machines as on-demand services to share and consume resources
over the Internet. As a result of rapid development in such services, the
necessity of fault tolerance in the cloud is a major concern with
reliability, availability and dependability which are more
critical to this new service type. This work investigates techniques and means
of tolerating cloud services as well as cloud customers' systems/enterprises execution
over the cloud safe from failures. Failures in cloud enabled services should be
expected to occur hence they should be handled.
The essential features of implementing fault tolerance strategies
guarantee the business continuity, avoid financial lost, recovering systems
from failures, and provide disaster recovery as well. The specific focus is to
explore scenarios of avoiding/recovering from failures through redundancy,
checkpoint and replication. Commercial IaaS providers such as Amazon's AWS and
Google's GCE are taken as examples as they tolerate their infrastructure from
failures; in this way a robust architecture with fault tolerance property could
be built for a system/enterprise. Hence, general conceptual steps with fault
tolerance considerations have been proposed.
attractive topic due to its ability to offer information technology solutions
through virtual machines as on-demand services to share and consume resources
over the Internet. As a result of rapid development in such services, the
necessity of fault tolerance in the cloud is a major concern with
reliability, availability and dependability which are more
critical to this new service type. This work investigates techniques and means
of tolerating cloud services as well as cloud customers' systems/enterprises execution
over the cloud safe from failures. Failures in cloud enabled services should be
expected to occur hence they should be handled.
The essential features of implementing fault tolerance strategies
guarantee the business continuity, avoid financial lost, recovering systems
from failures, and provide disaster recovery as well. The specific focus is to
explore scenarios of avoiding/recovering from failures through redundancy,
checkpoint and replication. Commercial IaaS providers such as Amazon's AWS and
Google's GCE are taken as examples as they tolerate their infrastructure from
failures; in this way a robust architecture with fault tolerance property could
be built for a system/enterprise. Hence, general conceptual steps with fault
tolerance considerations have been proposed.
Keywords in English:
cloud computing; fault tolerance; reliability; availability; dependability; redundancy; checkpoint; replication; AWS; GCE