「Deep Learning」に関連する技術ブログ
企業やコミュニティが発信する「Deep Learning」に関連する技術ブログの一覧です。
全232件中 91 - 105件目
さくらのクラウド高火力プランを使って大規模言語モデル(LLM)を動かしてみよう 〜前編〜
2023/07/05
ブックマーク
この記事は、2023年6月17日(土)に行われたオープンソースカンファレンス 2023 Online/Hokkaidoにおける発表を編集部にて記事化したものです。 はじめに さくらインターネットの芦野と申します。 この記 […]
大規模言語モデルを使って自動車走行時の状況説明をさせてみる? -社内LLMハッカソン記-
2023/06/30
ブックマーク
Turing株式会社の自動運転MLチームでエンジニアをしている岩政です。 Turingの自動運転MLチームでは、完全自動運転の開発に向けて、走行データから自動走行が可能な深層学習モデルの作成およびデータ基盤の整備、視覚情報以外にも言語を活用したマルチモーダルな基盤モデルの作成に取り組んでいます。 本記事では、視覚情報を認識するモデルと大規模言語モデルを組
大規模言語モデル(LLM)の作り方 Megatron-DeepSpeed編 Part1
2023/06/29
ブックマーク
はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。 大規模言語モデル(Large Language Model: LLM)への注目がGPT-4のリリース以降高まっていますが、LLMを作るための知見は十分に共有されているとは言い難いと個人的に感じています。 Turingでは、Vision and Language, Video and Languageなどのマルチモーダルなモデルの研究開
日本語の音声コーパスCSJでE-Branchformerの音声認識モデルを作って性能を評価する
2023/06/21
ブックマーク
こんにちは、RevCommでMiiTelの音声解析機能に関する研究開発を担当している石塚です。 2023年1月に開催された国際会議 IEEE Workshop on Spoken Language and Technology (SLT) 2022 で発表された E-Branchformer: Branchformer with Enhanced Merging for Speech Recognition (Kim et al., 2023) *1 という論文で、音声認識タスクで高い性能を発揮する E-Branchformer という新しい深層学習モデルが提案されました。論文中で
大規模モデルを支える分散並列学習のしくみ Part1
2023/06/20
ブックマーク
はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。 自然言語処理分野における大規模深層学習の重要性は日に日に高まっていますが、GPT-3, GPT-4 などのモデルの学習には膨大な計算コストがかかり、容易に学習できなくなっています。実際、モデルサイズが近年急速に大きくなっていることにより、学習に必
潜在意識も刺激する、AIを用いたレコメンデーション
2023/06/02
ブックマーク
潜在意識も刺激する、AIを用いたレコメンデーション 2023.6.2 株式会社Laboro.AI リードマーケター 熊谷勇一 概 要 顧客に商品やサービス、コンテンツをおすすめする「レコメンデーション」。実店舗やウェブサイトを問わず、その形態はさまざまです。レコメンデーションエンジンが使われ、AIも多く活用されてきました。最近ではChatGPTを使ったレコメンデーションの在
ChatGPTを活用した文章生成機能のシステム構成
2023/06/02
ブックマーク
はじめに みなさん、こんにちは。BASEでエンジニアをしております田村( taiyou )です。 2023年4月6日に、ChatGPTを活用してショップオーナー向けに文章の作成をサポートする機能「 BASE AI アシスタント 」をリリースしました。そのため、この記事では、BASE AI アシスタントのシステム構成について紹介します。 今回は、システム設計についてのテックブログなのでChatGPTのプ
ブラックボックス化を防げ。「説明可能なAI(XAI)」の重要性
2023/04/28
ブックマーク
ブラックボックス化を防げ。「説明可能なAI(XAI)」の重要性 2023.4.28 株式会社Laboro.AI リードマーケター 熊谷勇一 概 要 ChatGPTが急速に普及したり、政府がAIに関わる国家戦略を検討する新たな「AI戦略会議」を設ける方針を固めたりするなど、日本でのAI活用が一段と加速しています。中でも、AIの根幹的な技術の一つであるディープラーニング(深層学習)の弱点を
登壇社員インタビュー 中部経済連合会×デジタルリテラシー協議会「デジタル人材育成セミナーin中部」
2023/04/18
ブックマーク
KINTOテクノロジーズ株式会社 開発支援部の有留です。 全社会議体などの運営や、エンジニア育成、研修などを担当しています。 KINTOテクノロジーズ(以下、KTC)では、業務を通じたエンジニア自身の成長を、会社として応援しています。そのため、社外コミュティ参加や、外部イベントでの登壇も積極的に後押ししています。(社長の小寺、副社長の景山も、外部主催のイ
正解のない課題にこそ生きる「強化学習」の基本
2023/04/07
ブックマーク
正解のない課題にこそ生きる「強化学習」の基本 2023.4.7 株式会社Laboro.AI リードマーケター 熊谷勇一 概 要 AIは学習によって精度が左右強化されるため、取り組むべき課題に最適な学習方法を選ぶことは非常に重要です。学習方法の一つである「強化学習」について、特徴や代表的なアルゴリズム、教師あり・なし学習との違い、進化の過程、導入のメリットや課題、
実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?
2023/03/03
ブックマーク
こんにちは。Turing株式会社の機械学習チームでインターンをしている九州大学修士1年の岩政(@colum2131)です。 Turingは完全自動運転EVの開発をするスタートアップです。 自動運転技術において、カメラやセンサ情報は正確な制御をする上で不可欠な要素である一方、自然言語やマルチモーダルな処理が必要となる状況もしばしば存在します。特に完全自動運転車においては、
コンピュータビジョン分野のトップカンファレンスであるECCV2022の論文紹介(後編)
2023/02/28
ブックマーク
目次 目次 はじめに ECCV2022のトラッキング論文 ピックアップした論文 Towards Grand Unification of Object Tracking Tracking Objects As Pixel-Wise Distributions Particle Video Revisited: Tracking through Occlusions Using Point Trajectories XMem: Long-Term Video Object Segmentation with an Atkinson-Shiffrin Memory Model 最後に はじめに この記事は前回の記事の後編です。ECCV2022で紹介されたトラッキングに関する論文をいくつかご紹
Developers Summit 2023に登壇しました(ファーストペンギンでやりきる力)
2023/02/21
ブックマーク
はじめに 会員システムグループ N1!Machine Learning Product Engineerの中村です。 2023年2月9日に国内最大級のデベロッパーカンファレンスであるDevelopers Summit 2023に登壇しました。 https://event.shoeisha.jp/devsumi/20230209/session/4151/ この記事ではこの登壇に至るまでの経緯や内容についてお話していきます。 なぜ登壇したのか? ニフティにはN1!というスペシャリスト制度があります。 この
新卒エンジニアにおすすめの技術本は?セーフィーエンジニアにアンケート!
2023/02/13
ブックマーク
こんにちは!エンジニアの大林です。 先日セーフィーのエンジニアにアンケートを取ったので、今回はその内容をお届けします。 アンケートのテーマは「新卒エンジニアにおすすめの〇〇は?」ということで、以下の3つについて聞いてみました! 技術本 技術以外の本 本以外の学習媒体 新卒エンジニアにおすすめの技術本は? 新卒エンジニアにおすすめの技術以外の本
Physics-Informed Neural Networks (PINNs)を減衰振動の運動方程式に適用してみた!
2023/02/13
ブックマーク
こんにちは!Insight EdgeのData Scientistの石倉です。私は以前、地球物理学を専攻していて偏微分方程式を扱っていたのですが、最近NeurIPSやその他学会などで見られるPhysics-informed neural networks(以下、PINNs)の"Physics"に思わずアンテナが反応してしまい、色々と文献を調査してみました。そこで今回は、簡単に解析解の分かる微分方程式を用いてPINNsをTensorflowで実装してみた