社内se × プログラマ × ビッグデータ

プログラミングなどITに興味があります。

(自分用) Elasticsearch Quiz 1

Q1. Elasticsearch 用のメイン設定ファイル名は ?

Q2. データやログのディレクトリを Elasticsearch がインストールされているディレクトリの外部に配置することが推奨される理由は ?

Q3. jvm.options ではヒープサイズの設定が重要だが、最低でも ? GB以上の設定が要求されるか ? (バージョン 7.6.3)

Q4. Elasticsearchはデータ量をどのようにスケーリングしますか?

Q5. Shard とは何か?

Q6. Elasticsearch バージョン7以上では、デフォルトでいくつの Shard が1インデックスに追加されるか?

Q7. Elasticsearch はどのようにして高可用性を保証しているか?

Q8. Primary shard とは何か?

Q9. replica shard とは何か?

Q10. replication group とは何か?

Q11. 1つの shard 毎ににデフォルトの replica 数はいくつか?

Q12. 1つの index 毎ににデフォルトの shard 数(primary shard と replica shard を合わせて)はいくつか ?

(解答例)
=================================
A1.
elasticsearch.yml

A2.
Elasticsearch のバージョンアップ時がしやすい(ディレクトリが独立しているため)

A3.
1 GB 以上

A4.
Sharding
ノードを追加することも助けにはなるが、ある程度以上になると Sharding が無いと対処できない。

A5.
Index データの一部
Sharding によって、Index が複数の Shard に分割されます。

A6.
1つ
バージョン7未満では5つがデフォルトであった。

A7.
Replication (レプリケーション)
Replication によって、仮に1台のノードが壊れたとしても、他のノードからデータを取得し続けることが可能。
※当然ながらそのクラスタは2台以上で構成されていなければならない

A8.
documentはprimary shardに保存される。
documentをインデックスするとき、まずprimary shardに保存され、その後replica shardに反映される。

A9.
primary shardのコピー。primary shardは0個以上のreplicaを持てる。
primaryが死んだ時にreplicaがprimaryに昇格できるため、フェイルオーバーできる。

A10.
primary shardの replica(replica shard) とそのprimary shard自身の集合体。

A11.
1つ

A12.
2つ (1 primary shard と 1 replica shard)