
Google Cloudサービスをフル活用した転倒検知システム
本記事では、クラウドサービス未経験の大学院生2人が、Furious Green合同会社にて1年間インターンを経験し、1年間で学んだことの集大成として、Google Cloudサービスをフル活用した転倒検知システムを開発した際の記録をご紹介します。
サービスの特徴
一日完結のワークショップから長期のプログラムまで、お客様のニーズに合わせた研修を提供します。
生成AI分野の変化のスピードが目まぐるしく企業内だけでは負えないが最新のトレンドを理解して必要の応じて取り入れたい。
6ヶ月のトレーニングにてデータ分析の経験があるメンバーに対して機械学習エンジニアに必要な開発手法やベストプラクティスを提供。
機械学習要員を増やす必要があるが採用が難しい。社内のメンバーを育成する必要がある。
月1の1日ワークショップにて事業責任者とエンジニアを交えたディスカッション。最新モデルのリリースや生成AI技術の動向、開発中のプロジェクトに対するアドバイスやベストプラクティスの共有。
AI技術の専門知識と経験を持つエンジニアの不在であり、AI技術を活用したソリューションを提供する能力を欠いている。その結果、AI関連の高単価案件を獲得することができない。
3ヶ月のトレーニングとメンタリングで初めての受注案件を達成。
生成AIに関する知識を持ってないコンサルタントがお客様に対して的確な提案ができず、受注率が下がってしまっている。
半日のワークショップにてRAG技術を説明し、様々なケーススタディやアウトプット重視の課題により、コンサルタントの提案力を向上させることができました。
本記事では、クラウドサービス未経験の大学院生2人が、Furious Green合同会社にて1年間インターンを経験し、1年間で学んだことの集大成として、Google Cloudサービスをフル活用した転倒検知システムを開発した際の記録をご紹介します。
本日は、Googleが新たにリリースした最新のオープンモデル「Gemma 3」についてご紹介いたします。Gemmaは、多様な生成AIタスクに対応する強力なモデルファミリーであり、質問応答、要約、推論など、幅広い用途で活用可能です。今回のGemma 3は前バージョンから大幅に進化し、より高性能かつ使いやすくなっております。 Gemma 3の主な特長 マルチモーダル入力対応 Gemma 3の最大の特長の一つは、画像とテキストの両方を入力として扱えるようになったことです。これにより、画像の解釈、オブジェクトの識別、画像内のテキスト抽出など、より複雑な分析や生成タスクが可能となりました。 128Kトークンのコンテキストウィンドウ 従来のGemmaモデルと比較して16倍となる128,000トークンの長大なコンテキストウィンドウをサポートしています。これにより、複数の記事、長文のドキュメント、あるいは多数の画像を一度に処理し、より複雑な問題解決に貢献します。 広範な言語サポート 140以上の言語をサポートしており、グローバルな展開を視野に入れたAIアプリケーションの開発を強力
OpenAIは大規模言語モデルの最新版「GPT-4.5」を発表しました。現在利用可能なGPTシリーズの中で最大かつ最強の性能を誇るこのモデルは、現在研究プレビュー版として提供されています。 主な特徴 GPT-4.5は以下の点において大幅な進化を遂げています: * 深い知識とユーザー意図理解の向上:より広範な知識ベースを持ち、ユーザーの意図をより正確に把握する能力を獲得 * 創造性と高いEQの実現:ライティング、コーチング、ブレインストーミングなど、創造性や共感性を必要とするタスクにおいて卓越した性能を発揮 * エージェント的計画・実行能力:複雑なタスクを計画し実行する能力が大幅に向上 * 事実の正確性向上:従来モデルと比較して、事実に基づいた正確さが向上し、ハルシネーション(誤情報生成)が減少 * 自然な会話の実現:より自然な対話が可能となり、微妙なニュアンスや暗黙の期待を理解する能力が向上 技術詳細 GPT-4.5の主要な技術仕様は以下の通りです: * 大規模教師なし学習の採用:教師なし学習をスケールアップすることで、パターン認識、関連性抽出、創造的洞察の
大規模言語モデルがもたらす業界の平準化 大規模言語モデル(LLM)技術は、ビジネス環境における能力の平準化をもたらす重要な転換点となっています。この技術革新により、従来の個人間のスキルギャップが縮小し、多くの業務領域において基本的な実行能力が向上するという構造変化が進行しています。 専門性の再定義 従来のビジネス環境では、各職種における専門性のばらつきが大きく、特定分野において高い能力(8-10レベル)を持つ人材と基礎的な知識しか持たない人材(1-2レベル)の差が明確でした。LLM技術の導入により、基礎レベルが全体的に引き上げられ(3-5レベル)、市場における標準的な期待値が上昇しています。 検索エンジン普及から得られる教訓 この変化は、検索エンジンが情報アクセスを民主化した際の変革に類似しています。当時、検索技術を深い学習のための足がかりとして活用したグループと、単純な情報収集ツールとしてのみ利用したグループに二極化しました。現在のLLM技術においても同様の分岐が見られます。 実際のビジネスリスク 多くの企業が懸念するのはAIによる雇用の代替ですが、
はじめに マイクロソフトが発表した最新のPhiファミリーモデル「Phi-4-multimodal」および「Phi-4-mini」は、エッジデバイスを含む様々な環境での高度なAI機能の実現を目指して開発されました。今回は、これらの革新的なモデルの技術的特徴と実用的な活用事例について詳しく解説します。 Phi-4-multimodal:マイクロソフト初のマルチモーダルモデル 技術的特徴 Phi-4-multimodalは、マイクロソフトが初めて提供するマルチモーダル言語モデルであり、56億のパラメータという比較的コンパクトなサイズながら、音声、視覚、テキストを統合的に処理する能力を持っています。 このモデルの最大の特徴は、単一のモデル内で複数のモダリティを同時に処理できる点です。従来のAIシステムでは、異なる種類の入力(音声、画像、テキスト)に対して個別のモデルや複雑なパイプラインが必要でしたが、Phi-4-multimodalはこれらを一つのモデルで統合的に処理することが可能です。 また、効率性とスケーラビリティを向上させる新しいアーキテクチャを採用しており、より大きな語
2025年1月31日、弊社代表であるフランシスコ・ソアレスが、SHIBUYA STARTUP SUPPORT主催のイベント「SSS Growth Hub」にて登壇いたしました。 本イベントは、ソアレスが運営するコミュニティTokyo Startup Lunchclubの活動の一環として行われました。「日本の企業文化を理解し、強固な関係を築くための戦略」というテーマでディスカッションのファシリテーションを務め、日本でのビジネス経験を基に議論をリードし、参加者が自身の視点を共有できる場を提供しました。 また、EDGEof INNOVATION, LLCのCEOである Taisuke Alex Odajima氏を特別ゲストとしてお迎えし、信頼関係を築くための実践的なヒントや文化への適応方法について、具体的な事例を交えて貴重な知見を共有いただきました。 参加者は、SHIBUYA STARTUP SUPPORTに所属する起業家たちで、活発な意見交換とネットワーキングが行われ、大変盛況でした。ご参加いただいた皆様に心より感謝申し上げます。 今後もこうしたイベントを通じて、スタートアップエコ
2024年11月27日に弊社代表であるフランシスコ・ソアレスが、新しくできたYOKOHAMA TECH HUBにてVENTURE CAFEのイベント「YOKOHAMA CONNECT #2」で登壇いたしました。 本イベントでは、日本でビジネスを展開する起業家たちとの率直な対話が行われ、ソアレスは自身の経験を交えながら、日本での起業における実践的な知見を共有いたしました。特に、スタートアップビザの取得プロセスや規制対応、そして日本特有のビジネス文化への適応について、具体的な事例を基に説明を行いました。
弊社は2024年11月20日から22日まで、パシフィコ横浜で開催されたEdgeTech+ 2024に出展いたしました。 本展示会では、JOHOKA.AIプラットフォームをはじめ、生成AIを活用したエンジニアリング学習サービスを紹介する機会を得、多くの業界関係者との有意義な意見交換を行うことができました。弊社ブースでは、生成AIチャットボットやAI活用による効率的なシステム開発プロセスなど、革新的な技術デモンストレーションを実施し、おかげさまで来場者の皆様から大きな関心をお寄せいただきました。 今回の出展を通じて、新たなビジネスパートナーシップの可能性も広がり、今後の事業展開における貴重な機会となりました。引き続き、AI技術を駆使した革新的なサービスの提供に努めてまいります。