apache zeppelin 예제

아파치 제플린은 처리하려는 데이터에서 탐색 분석을 실행하는 강력한 노트북을 만들 수 있을 뿐만 아니라 데이터 품질이나 측정값을 모니터링하는 대시보드를 설계하여 분석된 내용에 따라 결정을 내릴 수 있습니다. 그러면 새 인터프리터 만들기 옵션이 나타납니다. 쉘 인터프리터를 예로 들어 보겠습니다. 아파치 제플린은 팀이 협업을 위해 다양한 시각화 옵션, 테이블 및 공유 가능한 링크를 사용하여 데이터를 관리하고 분석할 수 있는 대단히 유용한 도구입니다. 다음은 시작하는 데 유용한 링크입니다: 이 문서에서는 MongoDB 및 MySQL에 대한 사용자 지정 인터프리터를 추가하는 방법과 수집 데이터를 쿼리하고 시각화하는 데 사용하는 방법을 알아봅니다. 먼저, 아파치 제플린의 개요와 기능 세트의 개요로 시작하자 : hortonworks – 갤러리 / 제플린 노트북의 새로운 릴리스에 대한 알림을 받고 싶어? 아파치 제플린은 분석 결과를 즉시 확인하고 생성과 즉각적으로 연결할 수 있는 대화형 인터페이스를 제공합니다: 다양하고 활기찬 개발자 커뮤니티를 통해 지속적으로 진행되는 새로운 데이터 소스에 액세스할 수 있습니다. 추가 및 오픈 소스 아파치를 통해 배포 2.0 라이센스. 참고: 이 예제에서는 셸, jdbc 및 파이썬을 강조 표시합니다. 그러나 커뮤니티 지원 통역사를 이러한 방식으로 설치할 수 있습니다. 아파치 제플린 인터프리터 개념은 모든 언어 /데이터 처리 백 엔드를 제플린에 연결할 수 있습니다. 현재 아파치 제플린은 아파치 스파크, 파이썬, JDBC, 마크다운, 쉘 과 같은 많은 통역사를 지원하고 있습니다.

아파치 제플린 플랫폼에서 오른쪽 상단의 드롭다운 메뉴로 이동하여 인터프리터를 클릭합니다: 아파치 제플린은 대화형 데이터 분석을 가능하게 하는 웹 기반 노트북입니다. Zeppelin을 사용하면 스칼라 (아파치 스파크), 파이썬 (아파치 스파크 사용), 스파크 SQL, 하이브, 마크 다운, 각도 및 셸을. Zeppelin을 탐색할 때 하나 이상의 외부 라이브러리를 사용할 수 있습니다. 예를 들어 Magellan을 실행하려면 해당 종속성을 가져와야 합니다. 사용자 환경에 마젤란 라이브러리를 포함해야 합니다. Zeppelin 노트북에 외부 종속성을 포함하는 세 가지 방법이 있습니다: 여기에 메모에 있는 몇 가지 MongoDB 데이터의 예입니다: 아파치 프로젝트 스파크, Flink, 하이브, 점화, 렌즈 및 타성과 같은 많은 다른 오픈 소스와 통합. Zeppelin.Make와 함께 Spark를 더 자세히 살펴볼 수 있을 만큼 흥미롭고 기대되는 스파크 SQL 모듈과 스트리밍 및/또는 기계 학습 작업에 사용되는 다른 스파크 모듈을 확인해 보시길 바랍니다. 또한 미리 선택된 비디오, 자습서 및 백서가 있는 매우 유용한 데이터 과학 스타터 키트가 있습니다. Zeppelin 앱에 액세스하면 제목 없는 메모 1 전자 필기장이 표시됩니다.

GIT_URI 매개 변수에 지정된 GitHub 리포지토리의 예제 전자 필기장입니다. 제플린의 현재 메인 백엔드 처리 엔진은 아파치 스파크입니다. 시스템을 새로 접하는 경우 Zeppelin을 최대한 최대한 얻기 위해 데이터를 처리하는 방법에 대한 아이디어를 얻는 것으로 시작할 수 있습니다. 이 예제에서는 OpenShift 위에서 실행되도록 만든 Zeppelin OpenShift 템플릿을 사용하는 방법과 OpenShift 클러스터 위에 실행할 예제 노트북을 제공하는 방법을 보여 줍니다. 아파치 제플린은 최종 사용자에게 데이터에 대한 개요를 보여주거나 심지어 일부 탐색 분석을 수행하고 데이터를 사용하여 일부 그래프를 플롯하기 위해 데이터 및 플롯 그래프를 통해 분석을 실행하는 노트북을 제공하는 프로젝트 Jupyter에 대한 대안입니다. 중앙 조각은 노트북을 만드는 데 사용되는 아파치 제플린 포드입니다. 제플린에서 우리는 오신코 프로젝트가 관리하는 스파크 클러스터에 연결하고 일부 분석을 실행합니다. 이 예제에서는 Zeppelin 인스턴스에 대 한 포드와 아파치 스파크 클러스터에 대 한 두 개의 다른 포드를 사용 합니다 (1 마스터와 1 작업자).