Kĩ sư Google tự chế phần mềm nhận diện giọng nói, chỉ cần ra lệnh là máy tính tự viết code thay mình
Hiện tại, tốc độ "viết" code bằng giọng nói của anh kĩ sư này đã nhanh hơn tốc độ gõ phím bình thường.
Khi nhắc đến lập trình viên, đa số chúng ta đều cho rằng công việc của họ là ngồi cả ngày bên máy tính, tay thì gõ phím liên hồi và não cũng phải nhảy số liên tục để giải quyết những vấn đề IT hóc búa nhất. Thế nhưng với kĩ sư phần mềm James Stout lại không làm thế.
Là kĩ sư phần mềm đã cống hiến 10 năm cho gã khổng lồ lớn như Google nhưng anh kĩ sư phần mềm James Stout lại không hề phải gõ phím như những đồng nghiệp khác.
Là một nhân viên có thâm niên 10 năm tại Google, mỗi lần lập trình, James không hề động tay vào bàn phím, mà chỉ sử dụng giọng nói của mình để ra lệnh cho máy tính là xong. Bàn làm việc của anh cũng khá đặc biệt khi được trang bị thêm cả hệ thống theo dõi hoạt động mắt, micro, màn hình và một chiếc bàn phím được thiết kế đặc biệt. Phía dưới chân anh là hệ thống pedal, cứ mỗi lần giẫm vào là sẽ hiện số trên màn hình.
Nghe thì có vẻ dễ dàng và đơn giản, nhưng đằng sau phương thức làm việc độc đáo này là cả một câu chuyện nghị lực đầy xúc động. James mắc phải hội chứng Ehlers-Danlos, hội chứng cực kỳ hiếm gặp với tỉ lệ chỉ khoảng 1/2500 - 1/5000. Căn bệnh quái ác gây ảnh hưởng nghiêm trọng đến các mô kết nối của bệnh nhân, khiến họ liên tục gặp chấn thương cơ dai dẳng. Chính nó cũng từng ngăn cản ước mơ trở thành lập trình viên của James khi cứ gõ phím một thời gian là đôi bàn tay lại đau nhức đến mức không thể cử động được.
Chiếc bàn phím được thiết kế chuyên biệt cho James.
Hiện tại, James cùng các cộng sự của mình đang nghiên cứu những phương thức giúp người dùng dễ dàng tiếp cận và sử dụng các sản phẩm của Google hơn, ví dụ như điều khiến các ứng dụng bằng giọng nói chẳng hạn. Ngoài ra, anh còn sáng lập nên trang blog Hands-Free Coding, chuyên chia sẻ về quá trình lập trình bằng giọng nói thay vì gõ phím như truyền thống.
Chia sẻ với trang Business Insider, James cho biết: “Tôi đã vượt qua được khó khăn của bản thân, và giờ là lúc tôi giúp đỡ những người gặp phải tình cảnh tương tự như tôi lúc trước. Đã có rất nhiều người bình luận trên blog rằng những chia sẻ của tôi đã cứu giúp sự nghiệp lập trình của họ. Chỉ là 1 trang blog nhỏ nhoi làm cho vui mà đã có ích như vậy rồi, tôi mới nghĩ đến việc cống hiến toàn bộ thời gian, công sức của mình cho khía cạnh mới này - điều khiển bằng giọng nói”.
Và thời gian đã minh chứng những suy nghĩ của James là hoàn toàn chính xác, với rất nhiều trợ lý ảo trên thị trường hiện nay như Amazon Alexa, Google Assistant và Apple Siri. Cuộc sống của người dùng giờ đây trở nên dễ dàng và tiện lợi hơn rất nhiều, khi họ chỉ cần nói ra vài câu lệnh là đã có thể nghe nhạc, xem tin tức hay thậm chí là book vé xem phim, lên lịch cắt tóc, đi chợ,... Hệ thống lập trình bằng giọng nói do James tự chế ra không những đã giúp anh tiếp tục với công việc trong mơ của mình, mà còn mở ra một cơ hội mới, một sáng kiến mới giúp con người vượt qua những rào cản về mặt thể chất.
Tất nhiên là cũng đã có nhiều thời điểm, James cảm thấy tuyệt vọng cùng cực và cho rằng sự nghiệp kĩ sư phần mềm của mình sắp vứt đi đến nơi rồi, lập trình viên mà không thể gõ phím thì còn làm ăn được gì.
James cho biết: “Điều tôi lo lắng nhất chính là những cơn đau tay sẽ làm giảm tốc độ và năng suất của mình. Tôi có thể sẽ mất việc, có thể sẽ không chạy kịp deadline và tệ nhất là không thể phát huy hết những gì bản thân có”.
Thế nhưng sau tất cả, Google và đồng nghiệp vẫn luôn ủng hộ và giúp đỡ anh, quản lý của anh cũng không ngần ngại “bật đèn xanh” cho anh bắt đầu thử nghiệm lập trình bằng giọng nói.
Những bất lợi về mặt thể chất lại mở ra những cơ hội mới dành cho James Stout tại Google.
James bắt đầu công việc ở Google với vai trò kĩ sư hạ tầng, rồi sau đó chuyển sang Waymo - dự án xe tự lái của công ty. Nhưng đây cũng là thời điểm căn bệnh của anh trở nên tồi tệ hơn, khi những cơn đau thấu xương liên tục kéo đến thay vì chỉ hơi tê tê như trước, gõ một phím thôi cũng vô cùng khó khăn.
“Đối với một kĩ sư phần mềm, thì đây thực sự là một cơn ác mộng”.
Trên thực tế, hội chứng Ehlers-Danlos vẫn luôn dai dẳng bám theo James kể từ khi anh còn nhỏ. Bằng chứng là anh luôn cảm thấy những khớp xương của mình lỏng lẻo, và đặc biệt là anh có thể bẻ gập những ngón tay ra phía sau mà không cảm thấy đau đớn gì.
Thế nhưng chỉ đến lúc gõ phím thường xuyên với cường độ cao, căn bệnh này mới bộc phát. Không chỉ ảnh hưởng đến công việc, mà cả đời sống hàng ngày của James cũng rất khó khăn khi anh luôn phải chịu đau đớn mỗi khi nấu ăn, lái xe hay chỉ đơn giản là nghe điện thoại. Ngoài ngón tay ra, khi còn là sinh viên, anh đã từng phải nhiều lần đối mặt với cơn đau đến từ những lần trật khớp vai, trật khớp đầu gối.
Căn bệnh này nghiêm trọng đến nỗi đã có thời điểm James cho rằng anh sắp mất việc đến nơi rồi. Nhiều bác sĩ cũng lắc đầu bó tay, có người thậm chí còn khuyên anh nên cân nhắc đến việc chuyển sang nghề khác để đảm bảo sức khỏe cho bản thân.
Nhưng đã gọi là đam mê thì dễ gì mà từ bỏ. James chia sẻ: “Tôi lựa chọn ngành khoa học máy tính vì đó là ước mơ của tôi. Tôi luôn thích những gì mình làm, tôi muốn được trở thành một kĩ sư phần mềm. Khi mà nghe bác sĩ bảo nên chuyển ngành, tôi thực sự tuyệt vọng và cố gắng không nghe theo lời khuyên của ông ấy. Khi mọi thứ trong cuộc đời của bạn bắt đầu xuống dốc, chắc chắn bạn sẽ luôn tự nghi ngờ bản thân mình. Nó sẽ luôn ám ảnh tâm trí bạn, và chỉ biến mất khi bạn thực sự tự mình vượt qua được”.
Một ngày làm việc bình thường của James: Đến công ty và ra lệnh cho máy tính gõ code.
Bỏ ngoài tai những lời khuyên từ bác sĩ, James bắt tay và thí nghiệm điều khiển máy tính bằng giọng nói, bắt đầu với những tác vụ đơn giản như lướt web, và sau đó là đến viết code. Anh cho biết nguồn cảm hứng của anh chính là lập trình viên Tavis Rudd - người đã chia sẻ những kinh nghiệm, trải nghiệm của cá nhân khi lập trình Python bằng giọng nói của mình. Rudd thậm chí còn khẳng định việc kết hợp giữa gõ phím và giọng nói sẽ giúp quá trình viết code diễn ra nhanh hơn rất nhiều.
James cho biết: “Tôi đã từng nghĩ dù gì mình cũng chẳng còn gì để mất nữa. Đúng là nói thì dễ hơn làm, nhưng việc xem video của những người đi trước, những người đã thành công dù không sở hữu tình trạng thể chất hoàn hảo, đã thực sự giúp tôi thức tỉnh và cho tôi động lực để tiếp tục chiến đấu”.
Thế là James đã mạnh đề xuất với quản lý, cho phép anh được sử dụng giọng nói để lập trình thay vì gõ phím 1 lần/tuần. Và có lẽ cả đời anh sẽ không bao giờ quên ơn được người này, khi quản lý của anh đã cực kỳ tâm lý: “Cậu có thể nghỉ ngơi và thử phương pháp này bao nhiêu lần cũng được. Sức khỏe của cậu mới là điều quan trọng nhất. Nếu muốn, đừng nói là 1 lần chứ 5 lần/tuần cũng được” (tức là lập trình bằng giọng nói hoàn toàn luôn, không cần gõ phím nữa).
Sếp tâm lý đã cho phép James được thử nghiệm gõ code bằng giọng nói bất cứ lúc nào anh muốn.
Ban đầu, James sử dụng phần mềm nhận diện giọng nói Dragon, cho phép ghi âm lời thoại và chuyển nó thành dạng văn bản. Nghe thì có vẻ khá ổn, nhưng phần mềm này vẫn còn quá nhiều hạn chế, chỉ có thể hoạt động tốt với những tác vụ đơn giản như viết mail hay soạn thảo Microsoft Word, chứ để mà viết code thì vẫn chưa đủ tầm.
Không nản chí, James tiếp tục nghiên cứu, tự tự ra một phần mềm cho riêng mình và liên tục update những tính năng mới cao cấp hơn. Ngoài ra, anh còn chế luôn một bộ câu lệnh đặc biệt để giúp quá trình viết code trở nên dễ dàng hơn. Ví dụ như thông thường, các lập trình viên thường sử dụng dấu ngoặc tròn khi lập trình (left parentheses/right parentheses). Thay vì dài dòng như vậy, James đã rút ngắn thành 2 câu lệnh “leap” và “reap” đơn giản hơn rất nhiều.
Phải mất đến 3 tháng, phần mềm lập trình bằng giọng nói của James mới có thể viết code với tốc độ nhanh bằng một nửa tốc độ gõ phím của anh. Nhưng chỉ cần thế thôi là cũng đủ để anh có thêm niềm tin rằng: Mình vẫn có thể là một kĩ sư phần mềm chuyên nghiệp!
“Với tôi, đó là một khoảnh khắc bước ngoặt, vì những cải tiến trong công nghệ đã thực sự ảnh hưởng quá lớn đến cuộc sống của tôi, nó quyết định đến cả sự nghiệp của tôi. Dần dần, tôi nghĩ đến cả những người khác đang gặp phải khó khăn tương tự như mình. Làm thế nào để tôi có thể giúp họ đây?”
Dù gặp rất nhiều khó khăn nhưng những gì thu về được cho thấy anh vẫn có thể là một kĩ sư phần mềm chuyên nghiệp.
Lúc này, chiếc blog tưởng chừng như viết cho vui của James lại trở nên cực kì hữu ích. Đã có không ít độc giả bình luận rằng những chia sẻ của anh thực sự đã giúp cứu vãn sự nghiệp của họ.
Ví dụ, một độc giả chia sẻ rằng cô em gái 12 tuổi của mình cũng mắc phải chứng bệnh quái lạ, không thể gõ phím được. Thế là James đã gọi video cho 2 anh em nhà này, chia sẻ về những gì anh đã thu được từ việc nghiên cứu lập trình bằng giọng nói để họ có thể vượt qua khó khăn về mặt thể chất.
Nhận ra sức ảnh hưởng to lớn từ trang blog, James mới nảy ra ý định biến nó thành một sự nghiệp chính thức của mình. Và thế là anh quyết định rời khỏi dự án Waymo và gia nhập đội Accessibility của Google. Anh cũng đặc biệt hứng thú với machine learning - một chương trình trí tuệ nhân tạo cho phép máy tính tự nạp kiến thức cho mình. Mặc dù sở trường là điều khiển bằng giọng nói, nhưng James cho rằng machine learning mới là chìa khóa để giúp đỡ những người khuyết tật khác.
Anh chia sẻ: “Machine learning cho phép chúng ta hiểu sâu hơn về những gì đang diễn ra bên trong “bộ não” của một chiếc máy tính. Đó là điều tuyệt vời nhất ở Google. Những gì tôi đã và đang làm được là rất thú vị, nhưng cũng còn rất nhiều hạn chế. Tôi muốn một dự án gì đó bùng nổ hơn nữa”.
Hiện tại, ngoài công việc chính thức ra, James vẫn kiên trì chế tạo những tính năng mới cho Dragon - phần mềm “phao cứu sinh” đã từng giúp anh rất nhiều trước đây: “Tôi dự định sẽ tiếp tục chia sẻ miễn phí những gì tôi làm được và những gì tôi khám phá ra được. Tôi hy vọng những gì tôi đang thực hiện ở Google sẽ giúp cho tất cả mọi người trên thế giới, chứ không chỉ giới hạn ở lập trình viên. Tôi cũng mong những ý tưởng, tham vọng mà tôi đang ấp ủ về machine learning có thể truyền cảm hứng cho cả ngành lập trình thế giới”.
Hiện tại, khả năng điều khiển máy tính bằng giọng nói của James đã đạt đến mức đỉnh cao, khi anh có thể viết mail và gõ code nhanh hơn gõ phím bằng tay. Tuy nhiên, với những phần mềm liên quan đến chỉnh sửa hình ảnh như Photoshop, hay làm slide như Powerpoint thì vẫn còn khá nhiều hạn chế.
Một khó khăn khác mà James đang phải đối mặt chính là đa tác vụ - anh không thể vừa ra lệnh cho máy tính, vừa lên kế hoạch cho công việc của mình vì cả hai quá trình này diễn ra đồng thời trên cùng một bán cầu não. Người bình thường thì ngược lại, họ có thể dễ dàng nghĩ đến việc khác mà vẫn gõ phím ngon lành.
Nhưng nói đi cũng phải nói lại, năng suất làm việc của James đã được cải thiện rõ rệt: Không chỉ gõ code nhanh hơn, anh còn có thể hiểu sâu hơn mọi khía cạnh trong công việc của mình. Anh cho biết: “Tôi luôn suy nghĩ về mỗi câu lệnh mình đưa ra và tự hỏi làm thế nào để mình có thể thực hiện tác vụ này một cách nhanh hơn và đơn giản hơn?”
Quan trọng nhất, James sẽ không bao giờ phải lo sợ đến việc từ bỏ giấc mơ kĩ sư phần mềm của mình nữa, và những gì anh đang làm vẫn còn rất nhiều tiềm năng để phát triển trong tương lai: “Tôi đã tự mình vượt qua được khó khăn, nhưng vẫn còn nhiều thứ cần cải thiện để công việc trở nên nhanh hơn, thuận lợi hơn và đơn giản hơn. Tôi cảm thấy mình vẫn còn nhiều thiếu sót, và đó là động lực để tôi tiếp tục phấn đầu mỗi ngày”.
Laptop sinh viên, loa kẹo kéo, máy trợ giảng, linh kiên máy tính, máy bộ hp, iphone, surface, quạt hơi nước, tivi, GoPro, máy in...