3 bộ AI hợp thời nhất năm 2017 - Hướng dẫn nhanh về bộ Google Vision, DeepLens & BerryNet

Vài tuần qua đã rất thú vị đối với chúng tôi. Amazon giới thiệu máy quay video hỗ trợ học tập sâu đầu tiên - DeepLens. Google đã công bố Dự án AIY mới nhất của họ - Bộ công cụ Tầm nhìn. Tại DT42, chúng tôi luôn tin rằng mang lại sự học hỏi sâu sắc cho các thiết bị cạnh là chìa khóa cho tương lai. Chúng tôi cũng tin rằng công nghệ AI không nên chỉ bị chi phối bởi những người khổng lồ công nghệ lớn, mà sẵn sàng cho mọi người. Đó là lý do tại sao chúng tôi phát hành dự án BerryNet [1] nửa năm trước. BerryNet là Dự án FLOSS AI Gateway đầu tiên phát hành sức mạnh của AI trên các thiết bị cạnh.

Với 3 sức mạnh tầm nhìn AI tuyệt vời mới nhất này - hay tôi nên nói là đồ chơi, bạn có thể xây dựng dự án của riêng mình bằng AI để giải quyết vấn đề trong cuộc sống. Hãy nói với nếu bạn muốn xây dựng một camera cảnh báo khỉ để ngăn chặn những con khỉ gây rối với sân sau của bạn và ăn hết trái cây của bạn. Những gì bạn cần thực hiện bằng cách sử dụng Google AIY Vision Kit, DeepLens hoặc BerryNet?

Ở đây chúng tôi muốn thực hiện một hướng dẫn ngắn.

Hình 1. Hệ thống báo động khỉ

Hình 2 minh họa ngắn gọn về thiết bị và phần mềm mà bạn sẽ sử dụng với các công cụ khác nhau.

Hình 2. Các thành phần chính của hệ thống báo động Monkey

Toàn bộ hệ thống báo động Monkey bao gồm năm thành phần chính: Bộ thu dữ liệu: camera

(a) Máy thu dữ liệu: máy ảnh
(b) Phần cứng tính toán: thành phần phần cứng chính cho tính toán tenxơ
(c) Hệ thống phần mềm: bao gồm các thư viện học sâu và hệ điều hành chạy trên phần cứng cục bộ.
(d) Mô hình AI: mô hình học sâu được sử dụng để phân tích dữ liệu đầu vào
(e) Hệ thống kích hoạt báo động: cung cấp kết quả phát hiện cho người dùng

Tiếp theo chúng tôi sẽ giải thích thêm về các bước sử dụng ba công cụ riêng biệt.

Bộ tầm nhìn Google AIY

Hình 3. Các thành phần của hệ thống sử dụng bộ tầm nhìn

Phần cứng bạn cần chuẩn bị: Pi camera 2 (a), Vision kit (b), Raspberry Pi zero w.

Các bước:
 1 - Lắp ráp bộ theo hướng dẫn từ trang web Dự án AIY [2] và tải hình ảnh (3) vào thẻ SD.
 2 - Huấn luyện một mô hình học tập sâu như một máy dò khỉ (d) và biên dịch nó,
 3 - Tải mô hình được đào tạo vào VisionBonnet để xây dựng phát hiện khỉ
 4 - Sử dụng SDK để xây dựng trình kích hoạt báo động (e) và điều khiển nó thông qua Ứng dụng Android.

Trong trường hợp đối tượng bạn muốn phát hiện đã được đóng gói cùng với hình ảnh, bạn chỉ cần bỏ qua bước 2.

DeepSens AWS

Hình 4. Các thành phần của hệ thống sử dụng DeepLens

Phần cứng bạn cần chuẩn bị: AWS DeepLens, bao gồm các thành phần (a), (b) và (c)

Các bước:
 1 - Đăng ký, kết nối và thiết lập DeepLens trực tuyến.
 2 - Sử dụng AWS SageMaker để huấn luyện mô hình phát hiện khỉ (d).
 2.1 Tạo dự án phát hiện khỉ khỉ trên trên bảng điều khiển DeepLens
 2.2 Nhập mô hình được đào tạo ở bước 2.1 và triển khai dự án vào DeepLens
 3 - Sử dụng Bảng điều khiển quản lý AWS để xây dựng trình kích hoạt báo động (e).

Bằng cách sử dụng AWS DeepLens, không giống như hai bộ dụng cụ khác, bạn không cần phải tự chuẩn bị tất cả phần cứng. Tuy nhiên, điều này cũng hạn chế sự linh hoạt quá.

BerryNet

Hình 5. Các thành phần của hệ thống sử dụng BerryNet

Phần cứng bạn cần chuẩn bị: Raspberry Pi 3 (b), camera IP / Nest / Pi (a). Bạn cũng có thể mua Nhãn dán tính toán thần kinh Movidius để có hiệu suất suy luận tốt hơn. Các bước:

1 - Huấn luyện một mô hình học tập sâu như một máy dò tiền (d)
 2 - Cài đặt và định cấu hình BerryNet (c) với mô hình được đào tạo trên Raspberry Pi
 3 - Thiết lập máy khách đầu vào làm máy thu dữ liệu (có thể là camera pi, camera IP hoặc thậm chí là camera Nest) và máy khách đầu ra làm trình kích hoạt cảnh báo.

Hiện tại, đào tạo mô hình yêu cầu người dùng thiết lập môi trường bằng tay. Ví dụ: theo trang web YOLO [3] để huấn luyện máy dò khỉ. Một dịch vụ mới dễ sử dụng, Epeuva [4] sẽ sớm ra mắt để giúp khách hàng đào tạo mô hình. Nhấn vào đây để đăng ký lời mời sớm.

Trên Epeuva, bạn có thể mang dữ liệu của riêng mình và các mô hình AI tùy chỉnh mà không cần bất kỳ nỗ lực mã hóa nào. Bằng cách lặp lại bước 1, người dùng dễ dàng xây dựng một hệ thống phát hiện họ muốn.

Chúng tôi hình dung một thế giới nơi học tập sâu và AI sẽ được dân chủ hóa cho mọi người và mọi thiết bị. Dự án BerryNet được cấp phép với GPL vì chúng tôi muốn lấy AI từ các tháp ngà và làm cho nó có thể truy cập được cho tất cả mọi người.

Điện toán đã đi theo chu kỳ lớn, chuyển từ tập trung sang phân phối và trở lại. Chúng tôi tin rằng AI cạnh là chìa khóa để phát triển ngày càng nhiều ứng dụng hữu ích trong tương lai gần.

[1] https://github.com/DT42/ BlackBerryNet
[2] https://aiyprojects.withgoogle.com/vision#assinstall-guide-7-now-what
[3] https://pjreddie.com/darknet/yolo/
[4] http://www.dt42.io/epeuva/index.html#contact-section