「Apache Spark」に関連する技術ブログ

AWS Weekly Roundup: Amazon Bedrock、AWS Amplify Gen 2、Amazon RDS などの新機能 (2024 年 5 月 13 日)

2024/05/15

AWS Summit は世界各国で最高潮を迎えており、最近では AWS Summit Singapore が開催されました! こちらは、Developer Lounge ブースでの AWS スタッフと ASEAN コミュニティメンバーの様子です。これには、サーバーレス、 Amazon Elastic Kubernetes Service (Amazon EKS) 、セキュリティ、生成 AI などに関するライトニングトークを行う AWS コミュニティ講演者が参加しました。 5月6日週のリリース

PostgreSQL, Apache Spark, TypeScript

Ray on Vertex AI 入門

2024/05/08

ブックマーク

はじめにこんにちは、クラウドエースデータソリューション部の松本です。普段は、データ基盤や MLOps を構築したり、Google Cloud 認定トレーナーとしてトレーニングを提供しております。クラウドエースデータソリューション部についてクラウドエースのITエンジニアリングを担うシステム開発統括部の中で、特にデータ基盤構築・分析基盤構築からデータ分析まで

Azure, Hadoop, Apache Spark

Databricks Container ServiceでTensorRT-LLMを動かしてみた

2024/04/26

ブックマーク

本記事では Databricks のDatabricks Container Serviceを用いてNVIDIA社の推論ライブラリであるTensorRT-LLMを実行可能なNotebook環境を構築する方法を紹介します。目次目次はじめに Databricks Container Service NVIDIA TensorRT-LLM 解決したいこと TensorRT-LLM Container Imageの作成 Databricks Containers ベースイメージの変更 Pytorch バージョンの変更 TensorRT-LLMのインストール動作確認 Databricks環境設定 TensorRT-

Python, Apache Spark, 機械学習

Optimize your machine learning applications using BigQuery DataFrames（Google Cloud Next '24セッションレポート）

2024/04/11

ブックマーク

G-gen の堂原です。本記事は Google Cloud Next '24 in Las Vegas の 2 日目に行われた Breakout Session「 Optimize your machine learning applications using BigQuery DataFrames 」のレポートです。他の Google Cloud Next '24 の関連記事は Google Cloud Next '24 カテゴリの記事一覧からご覧いただけます。セッションの概要背景 BigQuery DataFrames デモユースケース関連記事セッションの概要本セッションでは、この

Python, Apache Spark, Google BigQuery

【初級編】 Amazon EMRとはなんぞや？（概要と他社SaaS比較）

2024/03/12

ブックマーク

こんにちは、近藤（りょう）です！社内で複数の近藤さんがいますので識別するために（）付きにしています。ソリューションアーキテクトでも問題としてピックアップされていますね。EMRについていくつ調べましたので概要と他社SaaS比較についてご紹介していきます～！ EMRとは？ Hadoop, Spark, Hive, Presto などのオープンソースフレームワークを使⽤したペタバイトスケ

Hadoop, Apache Spark, SQL

Apache Beam と TensorFlow SavedModel に翻弄された記録

2024/01/19

ブックマーク

はじめに 2023年10月の1ヶ月間、AI事業本部、極予測AI予測チームで CA Tech Job ...

Go, Java, Apache Spark

AWS Glue サーバーレス Spark UI導入によるモニタリングとトラブルシューティングの改善

2023/12/31

ブックマーク

AWS では、何十万ものお客様がサーバーレスデータ統合サービスである AWS Glue を使用して、アナリティクスや機械学習のためにデータを発見、結合、準備をしています。複雑なデータセットや負荷の高い Apache Spark ワークロードを使用している場合、Spark ジョブの実行中にパフォーマンスのボトルネックやエラーが発生することがあります。このような問題のトラブルシュ

AWS, Docker, Apache Spark

持続可能性の為のモダンデータアーキテクチャ最適化 : 第二部 – 統合データガバナンス、データ移動、目的別分析

2023/12/26

ブックマーク

このブログは Sam Mokhtari, Dr. Ali Khoshkbar, Sandipan Bhaumik によって執筆された内容を翻訳したものです。原文はこちらを参照して下さい。このブログシリーズの第一部「持続可能性の為のモダンデータアーキテクチャ最適化 : 第一部 – データ取り込みとデータレイク」では、モダンデータアーキテクチャにおける 1) データ取り込み、2) データレイクの柱に焦点を当てまし

AWS, Apache Spark, テスト

AWS re:Invent 2023における AWS for Games のアップデート

2023/12/19

ブックマーク

この記事は AWS for Games updates from re:Invent 2023 を翻訳したものです。 AWS re:Invent 2023において、AWS for Games チームはお客様が AWS のゲーム開発ツールを使用している最新の方法を紹介し、現在 AWS Games Solutions Library で利用可能ないくつかの新しい専門的なガイダンスとパートナーソリューションを紹介しました。 AWS re:Invent 2023 における AWS for Games のお客様セッション動画には以

AWS, Apache Spark, Unreal Engine

AWS re:Invent 2023 Amazon EKS and Kubernetes セッションガイド

2023/11/21

ブックマーク

この記事は Amazon EKS and Kubernetes sessions at AWS re:Invent 2023 (記事公開日: 2023 年 11 月 15 日) を翻訳したものです。 Introduction AWS re: Invent 2023 が間近に迫っており、Kubernetes とクラウドネイティブ関連のトピックに焦点を当てた全セッションが公開されました。適切なセッションを見つけて選択しやすくするために、セッションを主要な重点分野別にグループ化し、re: Invent セッシ

Java, Apache Spark, OpenShift

新しい AWS コースで機械学習モデルをより迅速に構築、トレーニング、反復する方法を学びましょう

2023/11/14

ブックマーク

このブログは Kumar Kumaraguruparan による “ Learn to build, train, and iterate machine learning models faster with new AWS course ” を翻訳+加筆修正したものです。機械学習（Machine Learning: ML）が、潜在的な COVID ワクチン候補の数を数万から 26 に減らす上で重要な役割を果たしたことをご存知ですか ( PMC )？ ML によって生産性が向上することで、COVID ワクチンの開発においては多くの人々の命を

AWS, Apache Spark, オンプレミス

Dataplexを徹底解説！

2023/11/08

ブックマーク

G-gen の神谷です。本記事では、Google Cloud のスケーラブルでサーバレスなデータ管理ツールである Dataplex を徹底解説します。 Dataplex の概要 Dataplex とは Dataplex Catalog メリットデータメッシュとは構成とオブジェクトアクセス制御機能認証・認可（IAM） IAM の基本的な理解アセットと IAM プロジェクトをまたぐ権限管理権限管理の詳細 VPC Service Controls データの品質チェッ

Apache Spark, SQL, Google BigQuery

2023 年 9 月の AWS Black Belt オンラインセミナー資料及び動画公開のご案内

2023/10/25

ブックマーク

2023 年 9 月に公開された AWS Black Belt オンラインセミナーの資料及び動画についてご案内させて頂きます。動画はオンデマンドでご視聴いただけます。また、過去の AWS Black Belt オンラインセミナーの資料及び動画は「 AWS サービス別資料集」に一覧がございます。 YouTube の再生リストは「 AWS Black Belt Online Seminar の Playlist 」をご覧ください。 AWS Batch 入門編 HPC や機械学習

AWS, Apache Spark, SQL

オープンソースのAmazon SageMaker Distributionを使い始める

2023/09/19

ブックマーク

このブログ記事は Get started with the open-source Amazon SageMaker Distribution を翻訳したものです。データサイエンティストは、機械学習（ML）およびデータサイエンスのワークロードに対して、セキュア且つ一貫性のある、依存関係の管理と再現可能の環境が必要です。 AWS Deep Learning Containers は、既にTensorFlow、PyTorch、MXNetなどのモデルトレーニングのフレームワークを事前構築され

AWS, Docker, GitHub, Apache Spark, 機械学習, Deep Learning, TensorFlow, ネットワーク, テスト, OSS

ETL ワークフローに Aurora DB Cluster Export を導入してみた

2023/09/11

ブックマーク

はじめにこんにちは、カケハシの坂本です。「AI 在庫管理」というプロダクトの ETL ワークフローに Amazon Aurora のマネージドサービスである Aurora DB Cluster Export という機能を導入したことについてお話しします。 AI 在庫管理では、医薬品などの需要予測を行うために深夜に日次バッチを実行しています。日次バッチでは、バックエンドの Aurora MySQL に格納されているデー

AWS, Apache Spark, プログラミング, Embulk, 人工知能, データベース

AWS Weekly Roundup: Amazon Bedrock、AWS Amplify Gen 2、Amazon RDS などの新機能 (2024 年 5 月 13 日)

Ray on Vertex AI 入門

Databricks Container ServiceでTensorRT-LLMを動かしてみた

Optimize your machine learning applications using BigQuery DataFrames（Google Cloud Next '24セッションレポート）

【初級編】 Amazon EMRとはなんぞや？（概要と他社SaaS比較）

Apache Beam と TensorFlow SavedModel に翻弄された記録

AWS Glue サーバーレス Spark UI導入によるモニタリングとトラブルシューティングの改善

持続可能性の為のモダンデータアーキテクチャ最適化 : 第二部 – 統合データガバナンス、データ移動、目的別分析

AWS re:Invent 2023における AWS for Games のアップデート

AWS re:Invent 2023 Amazon EKS and Kubernetes セッションガイド

新しい AWS コースで機械学習モデルをより迅速に構築、トレーニング、反復する方法を学びましょう

Dataplexを徹底解説！

2023 年 9 月の AWS Black Belt オンラインセミナー資料及び動画公開のご案内

オープンソースのAmazon SageMaker Distributionを使い始める

ETL ワークフローに Aurora DB Cluster Export を導入してみた

アクセス数ランキング

地味に嬉しい！Geminiを使ってGoogleドキュメントを瞬間的に要約する機能

「人を活かすAI」が明日の医療を切り拓く。カケハシの生成AI研究開発チームが描くビジョン

ソートアルゴリズムの基礎を深める

技術ブログに書けることがないわけない！

「なんでできないの？」と感じたときに、そっと読みたい話

タグから技術ブログをさがす

ソフトウェア開発

プログラミング

領域

TECH PLAY でイベントをはじめよう

エラータイトル