「Jupyter」に関連する技術ブログ

全 79 件中 31 - 45 件目

2023年12月04日

Vertex AI Workbench を使ってデータの傾向を統計分析で把握する

はじめにこんにちは、クラウドエースデータ ML ディビジョン所属の中村です。クラウドエースの IT エンジニアリングを担うシステム開発部の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのがデータ ML ディビジョンです。本記事では BigQuery および VertexAI Workbench（Python3.10）を使って、データセットの傾向を把握する流れを記載します。データ分析の参考になれば幸いです。 VertexAI　Workbench

Python, Jupyter, API

クラウドエース

2023年12月04日

Vertex AI Workbench を使ってデータの傾向を統計分析で把握する

Google Cloud, Python, 機械学習, Google BigQuery, データ分析, Jupyter, API, 統計

クラウドエース

2023年10月31日

Colab Enterprise を解説

はじめにこんにちは、クラウドエースデータ ML ディビジョン所属の坂田です。データ ML ディビジョンでは、Google Cloud が提供しているデータ領域のプロダクトについて、新規リリースをキャッチアップするための調査報告会を毎週実施しています。新規リリースの中でも、特に重要と考えるリリースを記事としてまとめ、本ページのように公開しています。今回は、Google Cloud の Vertex AI に新登場したプロダクト「Colab Enterprise」について解説します。 Colab E

Python, Jupyter, Google Colab

クラウドエース

2023年09月26日

rinna の日本語大規模言語モデルが AWS にワンクリックでデプロイできるようになりました

生成系 AI の発展と共にモデルの規模はどんどん大きくなり、デプロイするためのインフラの選択や設定はますます複雑になっています。 Amazon SageMaker JumpStart は大規模言語モデルを最適な設定、かつワンクリックでデプロイする機能を提供します。オープンソースコミュニティとの連携を通じ、AWS はこれまで Meta の Llama2 や TII の Falcon などを JumpStart で提供してきましたが、この度 rinna 株式会社から公開されている大規模言語モデルも Ju

AWS, ハンズオン, Jupyter

AWS

2023年09月07日

Amazon SageMakerのノートブックインスタンスや推論エンドポイントを自動停止・自動削除するLambda

機械学習をあれこれしていると、SageMakerのノートブックインスタンスや推論エンドポイントをしばしば使います。なのですが、ノートブックインスタンスはJupyterを閉じても起動し続けていることを忘れがち、推論エンドポイントは以外と気軽に作れてしまうのでいつの間にか増えがちです。（個人の感想です）放っておくとかなりのコストがかかってしまうので、これらを停止・削除するためのLambdaを作ってみました。

AWS, 機械学習, Jupyter

サーバーワークス

2023年08月28日

Jupyter notebook をはてなブログのマークダウンに変換する

MathJax = {tex: {inlineMath: [['$', '$']]}}; Insight Edgeのデータサイエンティストのki_ieです。今日の記事ではJupyter notebookをはてなブログで公開できるマークダウンに変換する方法を紹介します。はじめに数式とコード、さらにコードの実行結果を含む技術的な記事を書くには、Jupyter notebookが便利です。しかしJupyter notebookは、そのままでははてなブログに公開できる形ではありません。下書きだけJupy

Python, HTML, Jupyter

株式会社Insight Edg...

2023年07月26日

Step Functions から Lambda を呼び Jupyter Notebook の実行まで繋げてみる

Step Functions から Lambda を呼び Jupyter Notebook の実行まで繋げてみました。本記事の目的は、Step Functions から Lambda を呼び出し、終了条件を満たすまで待機させるための構成を作る流れを掴んでもらうことです。 Step Functionsの個々のパラメータについて詳しくは触れていません。

AWS, Jupyter

サーバーワークス

2023年07月24日

Vertex AI Model Gardenを活用した効果的なモデル開発プロセスの紹介

クラウドエース宮崎です。こんにちは！暑い季節が続いていますが、涼しい場所でリフレッシュする方法を見つけましたか？私はサウナ後の外気浴と水風呂で癒されています。今回は6月9日にGAとなったVertex AI Model Gardenを活用して効果的なモデル開発プロセスを構築する方法を紹介します。はじめに本記事の趣旨は、「Vertex AI Model Gardenを活用して効果的なモデル開発プロセスを構築する方法を紹介」といったものになります。標準サポートされているJupyter Notebook

TensorFlow, Jupyter, Google Colab

クラウドエース

2023年06月30日

Lambda関数とPapermillでJupyterノートブックをバッチ実行する

AWSにおいてJupyterノートブックを実行する場合は、通常はSageMakerの画面でノートブックインスタンスを起動してJupyterを画面を開いて実行します。つまり、手作業なりますが、Papermillというツールを使えばバッチ実行が可能です。本記事ではPapermillを利用し、Lambda関数でJupyterノートブックをバッチ実行する方法を紹介します。

AWS, Jupyter

サーバーワークス

2023年05月31日

Dataproc Serverlessを利用してPySparkを触ってみた

はじめにこんにちは、クラウドエースデータ/MLディビジョン所属の金です。前回はDataprocを利用してJupyter notebook上、PySparkでデータ処理を試してみました。そこで一つ残念だったのがやはりクラスタ管理が面倒なことでした。今回はDataproc Serverlessを利用して前回面倒だったクラスタ管理などもせずにPySparkでデータ処理を試してみます。前回の記事が気になる方は下記のURLからご覧ください。 https://zenn.dev/cloud_ace/arti

Python, Apache Spark, Jupyter

クラウドエース

2023年05月12日

Dataprocを利用してPySparkを触ってみた(feat.Jupyter Notebook)

はじめにこんにちは、クラウドエースデータ/MLディビジョン所属の金です。最近ビッグデータの重要度が高くなっているのでビッグデータ処理ができるさまざまな方法の一つのPySparkを試してみます。今回はGoogle CloudサービスのDataprocでクラスタを起動し、そこからJupyter Notebookを起動してPySparkを試してみます。 Cloud Dataprocとは？ Dataprocは、「Apache Hadoop、Apache Sparkなどのクラスタを簡単かつ効率が高い方法で実

Apache Spark, Jupyter, ビッグデータ

クラウドエース

2023年01月20日

BERTとSageMakerによる検索アルゴリズムの実装とデプロイ例の紹介

概要スマートキャンプでエンジニアをしている佐々木です。本記事では、自然言語処理モデルを用いて新規サービスを作れないか試行錯誤した話をしようと思います。今回は精度の良い検索はうまく実装できませんでしたが、機械学習モデルをインフラで動かす流れは学ぶことができました。実際に実装したコード例ともに紹介します。概要経緯検索の仕組み MLモデルのトレンド採用した文章の類似度計算のアルゴリズム類似度計算モデルのデプロイ実際のコードの紹介モデルの取得とデプロイ必要なライブラリのimport 事前学

AWS, Python, 機械学習, Deep Learning, 自然言語処理, TensorFlow, Jupyter, インフラ, Serverless

スマートキャンプ株式会社

2022年12月24日

時系列データ分析コンテンツ「ごちきか」を公開します

この記事は、 NTT Communications Advent Calendar 2022 24日目の記事です。はじめにイノベーションセンターの木村と申します。初めてのアドベントカレンダー&Engineers’blog投稿です。普段の業務は、機械学習をもちいた時系列データ分析の研究開発やお客様データ分析案件支援を主として行っています。プライベートでは自転車にお熱でZwiftでバーチャルライドをしたり、最近ではテクニック向上のためバニーホップの練習に励んでいます（なかなか上達しません…）。今

AWS, GitHub, JavaScript, Python, アルゴリズム, Jupyter, インフラ, テスト, OSS, ノーコード/ローコード

NTTドコモビジネス

2022年12月22日

データ分析の健全性を保つために行っている機械的データチェック（Pandera）の話

この記事は、Luup Advent Calendar の 22日目の記事です。こんにちは、Data Scienceチームの長谷川（@chase0213）です。 Data Scienceチームでは、社内の様々な部署からデータ分析に関する依頼を受けたり、自ら課題を見つけ仮説検証したりして、単純な集計から複雑なモデリングまでデータにまつわることを幅広く行っています。分析用のデータは基本的にデータウェアハウス（BigQuery）に格納されており（参考: 冪等性を担保したGoogle Cloud Compose

Python, Google BigQuery, Jupyter