Trong thế giới kỹ thuật số mở rộng, nhiều công cụ tìm kiếm không đáp ứng được nhu cầu nâng cao của người dùng. Hướng dẫn này giới thiệu cho bạn Elaticsearch, một công cụ tìm kiếm và phân tích mạnh mẽ. Sử dụng Ubuntu, chúng tôi sẽ hướng dẫn bạn cách cài đặt Elaticsearch trên Ubuntu 22.04, giúp việc truy xuất và phân tích dữ liệu hiệu quả hơn cho các nhà phát triển, nhà phân tích dữ liệu cũng như các nhà khoa học dữ liệu mới nổi.
Vì vậy, nếu bạn đã sẵn sàng khám phá thế giới Elaticsearch và giải phóng tiềm năng dữ liệu của mình, hãy bắt đầu với một số thông tin cơ bản về Elaticsearch trước khi đi sâu vào quá trình cài đặt. Đến cuối hướng dẫn này, bạn sẽ có thiết lập Elaticsearch đầy đủ chức năng trên hệ thống Ubuntu của mình, sẵn sàng bắt tay vào cuộc phiêu lưu dựa trên tìm kiếm của bạn.
Elaticsearch là gì?
Hãy cùng tìm hiểu định nghĩa cơ bản của Elaticsearch và nêu chi tiết sức mạnh của nó API RESTful trước khi đến phần hướng dẫn Elaticsearch của chúng tôi! Elaticsearch là một công cụ tìm kiếm và phân tích có khả năng mở rộng quy mô dễ dàng và được xây dựng dựa trên Apache Lucene. Nó vượt trội trong việc xử lý khối lượng dữ liệu khổng lồ và mang lại khả năng tìm kiếm nhanh như chớp. Được áp dụng rộng rãi cho các trường hợp sử dụng như phân tích nhật ký, tìm kiếm toàn văn bản và phân tích thời gian thực, Elaticsearch lưu trữ dữ liệu theo cách phân tán, chia dữ liệu thành các phân đoạn được phân bổ trên một cụm nút. Cách tiếp cận phân tán này đảm bảo tính sẵn sàng cao và khả năng chịu lỗi.
Elaticsearch được công nhận đáng chú ý nhờ API RESTful toàn diện. API này cho phép người dùng tương tác với Elaticsearch thông qua các yêu cầu HTTP đơn giản. Thường được cấu trúc dưới dạng tải trọng JSON, những yêu cầu này hỗ trợ các hoạt động như lập chỉ mục, tìm kiếm, cập nhật và xóa tài liệu.
API RESTful tuân thủ các nguyên tắc Chuyển giao trạng thái đại diện (REST), một kiểu kiến trúc để thiết kế các ứng dụng nối mạng. Nó sử dụng tiêu chuẩn phương thức HTTP như GET, POST, PUT, DELETE, v.v. để tương tác với các tài nguyên Elaticsearch.
Để lập chỉ mục một tài liệu mới, hãy gửi yêu cầu POST với tài liệu có định dạng JSON tới /index_name/_doc điểm cuối. Ngược lại, nếu bạn đang tìm kiếm tài liệu, hãy gửi yêu cầu GET với các tham số tìm kiếm của bạn tới /index_name/_search điểm cuối để lấy kết quả.
Hơn nữa, API RESTful cung cấp khả năng truy vấn mở rộng. Nó hỗ trợ các tìm kiếm phức tạp bằng cách sử dụng nhiều loại truy vấn, bộ lọc, tổng hợp và tùy chọn sắp xếp khác nhau. Tất cả đều có thể tùy chỉnh mức độ liên quan, thực hiện tìm kiếm toàn văn hoặc dựa trên địa lý, v.v. Cuối cùng, để tạo điều kiện tích hợp với các ứng dụng, Elaticsearch cung cấp thư viện máy khách bằng nhiều ngôn ngữ lập trình. Nhìn chung, kiến trúc phân tán của Elaticsearch, kết hợp với API RESTful thân thiện với người dùng, khiến nó trở thành một công cụ mạnh mẽ để xây dựng các giải pháp tìm kiếm và phân tích.
Hướng dẫn Elaticsearch: Cách cài đặt Elaticsearch trên Ubuntu
Cuối cùng, đã đến lúc tìm hiểu cách thực hiện cài đặt Elaticsearch cho Ubuntu. Trước tiên, tôi sẽ đề cập đến vấn đề này và cài đặt Elaticsearch trên Ubuntu 22.04 theo định dạng từng bước, cách này sẽ dễ thực hiện và dễ thực hiện. Sau đó, tôi cũng sẽ đề cập đến một số chức năng cơ bản của nó để bạn hiểu rõ các chức năng cơ bản của nó nếu bạn chưa biết! Hãy bắt đầu với nó.
Bước 1: Cập nhật Ubuntu của bạn
Trước khi thực hiện bước thực tế đầu tiên để cài đặt Elaticsearch Ubuntu, bạn nên kiểm tra và cài đặt các bản cập nhật mới nhất liên quan đến gói hệ thống. Chỉ cần chạy hai dòng lệnh tiếp theo trong terminal để thực hiện cập nhật:
sudo apt update
sudo apt upgrade
Bước 2: Cài đặt Java
Elaticsearch chạy trên Java, vì vậy chúng tôi cần cài đặt nó trên Ubuntu của mình để đảm bảo quá trình cài đặt Elaticsearch Ubuntu diễn ra suôn sẻ. OpenJDK là phiên bản mã nguồn mở của Java, không chỉ dễ cài đặt hơn mà còn hoạt động tốt hơn. Sử dụng lệnh sau để cài đặt Java thông qua OpenJDK:
sudo apt install openjdk-11-jdk
Bước 3: Tải xuống Elaticsearch
Với một hệ thống mới được cập nhật và cài đặt Java mạnh mẽ, chúng tôi đã sẵn sàng bắt đầu cài đặt Elaticsearch trên Ubuntu. Bắt đầu bằng cách truy cập trang web Elaticsearch chính thức để nhận liên kết tải xuống mới nhất. Sau khi bảo mật liên kết, hãy sử dụng “quên" để tải xuống nhanh chóng Elaticsearch. Dưới đây là ví dụ từng bước:
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.14.0-amd64.deb
Bước 4: Cài đặt Elaticsearch Ubuntu và cấu hình
Sau khi quá trình tải xuống Ubuntu Elaticsearch hoàn tất, đã đến lúc cài đặt các tệp đã tải xuống. Bạn có thể dễ dàng kích hoạt bước này bằng cách nhập lệnh sau:
sudo dpkg -i elasticsearch-7.14.0-amd64.deb
Lệnh được cung cấp sẽ xác định tệp Elaticsearch đã tải xuống và bắt đầu giải nén nó để cài đặt Elaticsearch trên Ubuntu. Sau khi quá trình cài đặt hoàn tất, bạn sẽ cần quyết định xem bạn có muốn Elaticsearch chỉ nghe máy cục bộ hay không. Mặc dù nó không bị hạn chế theo mặc định nhưng nhiều người chọn cấu hình hạn chế hơn. Để điều chỉnh cài đặt này, hãy mở tệp được chỉ định trong trình soạn thảo văn bản:
sudo nano /etc/elasticsearch/elasticsearch.yml
Sau đó, trong tệp, tìm dòng bắt đầu bằng cụm từ “# mạng.host” và loại bỏ # ở đầu dòng. Điều này sẽ đặt giá trị thành localhost để hạn chế Elaticsearch chỉ nghe trên máy cục bộ. Nếu bạn không muốn thực hiện thay đổi phổ biến này, hãy bỏ qua phần thứ hai của bước 4.
Bước 5: Bắt đầu Elaticsearch và kiểm tra nó
Bây giờ bạn có thể chạy chương trình sau khi hoạt động thành công và cài đặt Elaticsearch Ubuntu 22.04. Bắt đầu dịch vụ Elaticsearch bằng dòng lệnh này:
sudo systemctl start elasticsearch
Đợi chương trình tải. Bạn cũng có thể kích hoạt chương trình như một phần của quá trình khởi động hệ thống bằng dòng này:
sudo systemctl enable elasticsearch
Để xác minh rằng cài đặt Elaticsearch của bạn đang hoạt động chính xác với máy chủ của bạn, hãy thực thi lệnh đã cho. Lệnh này sẽ gửi yêu cầu HTTP đến máy chủ của bạn, gợi ra phản hồi JSON. Nếu bạn nhận được phản hồi JSON này, đó là dấu hiệu cho thấy quá trình cài đặt Elaticsearch của bạn đã thành công và đang hoạt động như mong đợi. Hãy nhớ nhập dòng không phải trong terminal mà trong trình duyệt:
http://localhost:9200
Bước 6: Bảo mật Elaticsearch trên Ubuntu
Cụm Elaticsearch của bạn có thể nhanh chóng phát triển để đòi hỏi dữ liệu máy chủ và dự án quan trọng mà bạn không muốn rơi vào tay kẻ xấu. Do đó, bạn nên dành thời gian bảo mật Elaticsearch sau khi hoàn thành phần chính của hướng dẫn cài đặt Elaticsearch Ubuntu. Phần đầu tiên của việc bảo mật phiên bản Elaticsearch của bạn được thực hiện bằng cách mở lại tệp cấu hình sau bằng trình soạn thảo văn bản:
sudo nano /etc/elasticsearch/elasticsearch.yml
Tìm dòng sau và xóa # lúc đầu:
xpack.security.enabled: true
Điều này sẽ kích hoạt các biện pháp bảo mật cơ bản của Elaticsearch. Lưu các thay đổi và thoát khỏi trình chỉnh sửa. Bây giờ là lúc xác định mật khẩu của bạn cho người dùng tích hợp của Elaticsearch. Sử dụng dòng này để mở shell tương tác Elaticsearch:
sudo /usr/share/elasticsearch/bin/elasticsearch-setup-passwords interactive
Tại đây, bạn sẽ được nhắc tạo mật khẩu cho từng phiên bản người dùng tích hợp của Elaticsearch. Đảm bảo đặt mật khẩu khó đoán nhưng không khó nhớ! Bây giờ, biện pháp cuối cùng để làm cho Elaticsearch trở nên an toàn nhất có thể bằng cách bật tường lửa, mặc dù điều này có thể là quá mức cần thiết. Vì vậy, hãy xem xét biện pháp cuối cùng này là tùy chọn:
sudo apt install ufw
sudo ufw enable
Sau khi tường lửa được mở và kích hoạt, hãy sử dụng các dòng sau để hạn chế kết nối ở hai cổng mà Elaticsearch sử dụng nhằm ngăn chặn mọi lưu lượng truy cập đến không mong muốn và có khả năng gây hại:
sudo ufw allow 9200
sudo ufw allow 9300
Cuối cùng, thực hiện khởi động lại Elaticsearch để xác nhận các thay đổi:
sudo systemctl restart elasticsearch
Chúc mừng! Bạn không chỉ cài đặt thành công Elaticsearch trên Ubuntu mà còn củng cố tính bảo mật của nó. Để sử dụng Elaticsearch và API RESTful của nó, hãy đảm bảo bạn nhập đúng thông tin xác thực (tên người dùng và mật khẩu) cho người dùng bạn đã thiết lập. Luôn cập nhật Elaticsearch của bạn và tuân thủ các biện pháp bảo mật hàng đầu để duy trì môi trường an toàn.
Gói lại
Việc cài đặt thành công Elaticsearch trên Ubuntu mang lại cơ hội nâng cao cho việc tìm kiếm và phân tích dữ liệu. Bằng cách làm theo hướng dẫn cài đặt và thêm cấu hình bảo mật, bạn đảm bảo được bảo vệ dữ liệu. Sau khi hoạt động, API RESTful của Elaticsearch cho phép tương tác dễ dàng, từ lập chỉ mục đến tìm kiếm và cập nhật tài liệu. Mặc dù việc khai thác triệt để Elaticsearch có thể là một thách thức nhưng tài liệu chi tiết của nó sẽ hỗ trợ bạn tìm hiểu các tính năng nâng cao. Đi sâu vào Elaticsearch trên Ubuntu để hưởng lợi từ khả năng mở rộng, tốc độ và các tính năng phong phú của nó, mở khóa những hiểu biết và khám phá dữ liệu tuyệt vời.
Trước khi tiếp tục, bạn có muốn đưa việc sử dụng Elaticsearch của mình trên Ubuntu lên một tầm cao mới không? Bạn có thể chạm tay vào sức mạnh mạnh mẽ của Cloudzy VPS Linux. Bằng cách sử dụng phiên bản Ubuntu của VPS Linux của chúng tôi, bạn có thể lưu trữ một máy chủ mạnh mẽ được tăng cường Elaticsearch ở hơn 12 địa điểm trên khắp thế giới, đảm bảo độ trễ tốt trong khi các biện pháp bảo mật của chúng tôi sẽ bảo vệ bạn! Sử dụng một loạt các phương thức thanh toán thông thường và ẩn danh để có được cho mình một ưu đãi VPS Ubuntu, với tỷ lệ thời gian hoạt động 99,95% và sử dụng tối đa những gì bạn đã học được trong hướng dẫn Elaticsearch này!
Sự lựa chọn hiển nhiên
Phần lớn các máy chủ chạy Linux đang sử dụng Ubuntu; tại sao không phải là bạn? Khám phá lý do tại sao mọi người đều yêu thích Ubuntu — sở hữu một VPS Ubuntu được tối ưu hóa
Nhận VPS Ubuntu của bạnCâu hỏi thường gặp
Sự khác biệt giữa Elaticsearch và Apache Lucene là gì?
Elaticsearch được thành lập trên Apache Lucene, một thư viện tìm kiếm toàn văn bản mạnh mẽ. Lucene xử lý các chức năng tìm kiếm và lập chỉ mục cơ bản, nhưng Elaticsearch tăng cường chức năng này bằng các tính năng như điện toán phân tán, khả năng mở rộng và API RESTful thân thiện với người dùng, tối ưu hóa nó cho các cài đặt phân tán.
Elaticsearch xử lý tình trạng dư thừa dữ liệu và khả năng chịu lỗi như thế nào?
Elaticsearch đạt được khả năng dự phòng dữ liệu và khả năng chịu lỗi thông qua kiến trúc phân tán của nó. Nó chia dữ liệu thành nhiều phần chia sẻ và phân phối chúng trên nhiều nút trong một cụm. Mỗi phân đoạn có bản sao tích hợp, đảm bảo dữ liệu được sao chép trên nhiều nút. Nếu một nút bị lỗi, Elaticsearch vẫn có thể truy xuất dữ liệu từ các phân đoạn được sao chép trên các nút khác, đảm bảo tính sẵn sàng cao.
Elaticsearch có thể được sử dụng để phân tích thời gian thực không?
Có, Elaticsearch rất phù hợp cho việc phân tích thời gian thực. Khả năng lập chỉ mục gần thời gian thực của nó cho phép cập nhật và truy xuất dữ liệu nhanh chóng. Được kết hợp với các tính năng tổng hợp mạnh mẽ, Elaticsearch cho phép phân tích và trực quan hóa dữ liệu nhanh chóng, khiến nó trở thành lựa chọn phổ biến cho các trường hợp sử dụng phân tích thời gian thực.
Elaticsearch có thể được sử dụng cho dữ liệu không gian địa lý không?
Elaticsearch thực sự cung cấp hỗ trợ mạnh mẽ cho dữ liệu không gian địa lý. Nó cung cấp các tính năng như lập chỉ mục và tìm kiếm không gian địa lý, có nghĩa là người dùng có thể lập chỉ mục tài liệu bằng cách sử dụng tọa độ địa lý, thực hiện tính toán khoảng cách cũng như triển khai các bộ lọc và tập hợp tập trung vào vị trí. Khả năng không gian địa lý của nó đã được ghi chép rõ ràng và được công nhận rộng rãi trong ngành.
Tôi có thể sử dụng Elaticsearch để ghi nhật ký và phân tích nhật ký không?
Tuyệt đối. Elaticsearch được sử dụng rộng rãi để phân tích nhật ký và ghi nhật ký tập trung. Bằng cách nhập nhật ký vào Elaticsearch, bạn có thể tìm kiếm, phân tích và trực quan hóa dữ liệu nhật ký gần như theo thời gian thực. Kết hợp với các công cụ như Logstash và Kibana, Elaticsearch tạo thành ngăn xếp ELK (Elasticsearch, Logstash, Kibana), phổ biến để quản lý và phân tích nhật ký.