304 ສະແຕນເລດ welded coiled tube / tubing zomponent zhemical, ທ່າແຮງທາງຊີວະວິທະຍາຂອງຈຸລິນຊີນ້ໍາທົ່ວໂລກ

ຂໍ​ຂອບ​ໃຈ​ທ່ານ​ສໍາ​ລັບ​ການ​ຢ້ຽມ​ຢາມ Nature.com​.ທ່ານກໍາລັງໃຊ້ເວີຊັນຂອງຕົວທ່ອງເວັບທີ່ມີການສະຫນັບສະຫນູນ CSS ຈໍາກັດ.ເພື່ອປະສົບການທີ່ດີທີ່ສຸດ, ພວກເຮົາແນະນຳໃຫ້ທ່ານໃຊ້ບຣາວເຊີທີ່ອັບເດດແລ້ວ (ຫຼືປິດການນຳໃຊ້ໂໝດຄວາມເຂົ້າກັນໄດ້ໃນ Internet Explorer).ນອກຈາກນັ້ນ, ເພື່ອຮັບປະກັນການສະຫນັບສະຫນູນຢ່າງຕໍ່ເນື່ອງ, ພວກເຮົາສະແດງເວັບໄຊທ໌ທີ່ບໍ່ມີຮູບແບບແລະ JavaScript.
ຕົວເລື່ອນສະແດງສາມບົດຄວາມຕໍ່ສະໄລ້.ໃຊ້ປຸ່ມດ້ານຫຼັງ ແລະປຸ່ມຕໍ່ໄປເພື່ອເລື່ອນຜ່ານສະໄລ້, ຫຼືປຸ່ມຄວບຄຸມສະໄລ້ຢູ່ທ້າຍເພື່ອເລື່ອນຜ່ານແຕ່ລະສະໄລ້.

ລາຍລະອຽດຂອງຜະລິດຕະພັນ

304 ສະແຕນເລດ welded coiled tube / tubing
1. Specification: Stainless steel coil tube / tubing
2. ປະເພດ: welded ຫຼື seamless
3. ມາດຕະຖານ: ASTM A269, ASTM A249
4. ທໍ່ທໍ່ສະແຕນເລດ OD: 6mm ຫາ 25.4MM
5. ຄວາມຍາວ: 600-3500MM ຫຼືຕາມຄວາມຕ້ອງການຂອງລູກຄ້າ.
6. ຄວາມຫນາຂອງກໍາແພງ: 0.2mm ຫາ 2.0mm.

7. ຄວາມທົນທານ: OD: +/-0.01mm;ຄວາມຫນາ: +/-0.01%.

8. ຂະຫນາດຂຸມພາຍໃນ: 500MM-1500MM (ສາມາດປັບໄດ້ຕາມຄວາມຕ້ອງການຂອງລູກຄ້າ)

9. ຄວາມສູງຂອງ Coil: 200MM-400MM (ສາມາດປັບໄດ້ຕາມຄວາມຕ້ອງການຂອງລູກຄ້າ)

10. ດ້ານ: ສົດໃສຫຼື annealed
11. ວັດສະດຸ: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, ໂລຫະປະສົມ 625, 825, 2205, 2507, ແລະອື່ນໆ.
12. ການຫຸ້ມຫໍ່: ຖົງທໍໃນກໍລະນີໄມ້, pallet ໄມ້, shaft ໄມ້, ຫຼືຕາມຄວາມຕ້ອງການຂອງລູກຄ້າ.
13. ການທົດສອບ: ອົງປະກອບທາງເຄມີ, ຄວາມເຂັ້ມແຂງຜົນຜະລິດ, ຄວາມເຂັ້ມແຂງ tensile, ການວັດແທກຄວາມແຂງ
14. ການ​ຮັບ​ປະ​ກັນ​: ພາກ​ສ່ວນ​ທີ​ສາມ (ຕົວ​ຢ່າງ​: SGS ໂທລະ​ພາບ​) ການ​ກວດ​ກາ​, ແລະ​ອື່ນໆ​.
15. ຄໍາຮ້ອງສະຫມັກ: ການຕົກແຕ່ງ, ເຟີນີເຈີ, ການຂົນສົ່ງນ້ໍາມັນ, ເຄື່ອງແລກປ່ຽນຄວາມຮ້ອນ, ການເຮັດລາງລົດໄຟ, ການເຮັດເຈ້ຍ, ລົດໃຫຍ່, ການປຸງແຕ່ງອາຫານ, ການແພດ, ແລະອື່ນໆ.

ອົງປະກອບທາງເຄມີທັງໝົດ ແລະ ຄຸນສົມບັດທາງກາຍະພາບຂອງສະແຕນເລດດັ່ງລຸ່ມນີ້:

ວັດສະດຸ ASTM A269 ອົງປະກອບທາງເຄມີ % ສູງສຸດ
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 ງ 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

ວັດສະດຸ ການປິ່ນປົວຄວາມຮ້ອນ ອຸນຫະພູມ F (C) ຕ່ຳສຸດ. ຄວາມແຂງ
Brinell Rockwell
TP304 ການແກ້ໄຂ 1900 (1040) 192HBW/200HV 90HRB
TP304L ການແກ້ໄຂ 1900 (1040) 192HBW/200HV 90HRB
TP316 ການແກ້ໄຂ 1900(1040) 192HBW/200HV 90HRB
TP316L ການແກ້ໄຂ 1900(1040) 192HBW/200HV 90HRB
TP321 ການແກ້ໄຂ 1900(1040) ຟ 192HBW/200HV 90HRB
TP347 ການແກ້ໄຂ 1900(1040) 192HBW/200HV 90HRB

 

OD, ນິ້ວ OD ຄວາມທົນທານນິ້ວ(ມມ) WT ຄວາມທົນທານ % ຄວາມຍາວ Tolernace ນິ້ວ(ມມ)
+ -
≤ 1/2 ± 0.005 (0.13 ) ± 15 1/8 ( 3.2 ) 0
> 1/2 ~ 1 1/2 ± 0.005(0.13) ± 10 1/8 (3.2) 0
> 1 1/2 ~< 3 1/2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1/2 ~< 5 1/2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1/2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

ຊຸມຊົນຈຸລິນຊີທໍາມະຊາດແມ່ນມີຄວາມຫຼາກຫຼາຍທາງດ້ານ phylogenetically ແລະ metabolically.ນອກເຫນືອໄປຈາກກຸ່ມທີ່ບໍ່ມີການສຶກສາຂອງສິ່ງມີຊີວິດ 1, ຄວາມຫຼາກຫຼາຍນີ້ຍັງຖືທ່າແຮງທີ່ອຸດົມສົມບູນສໍາລັບການຄົ້ນພົບ enzymes ທີ່ສໍາຄັນທາງດ້ານນິເວດວິທະຍາແລະຊີວະວິທະຍາແລະທາດປະສົມທາງຊີວະເຄມີ2,3.ຢ່າງໃດກໍ່ຕາມ, ການສຶກສາຄວາມຫຼາກຫຼາຍນີ້ເພື່ອກໍານົດເສັ້ນທາງ genomic ທີ່ສັງເຄາະທາດປະສົມດັ່ງກ່າວແລະຜູກມັດພວກມັນກັບເຈົ້າພາບຂອງພວກເຂົາຍັງຄົງເປັນສິ່ງທ້າທາຍ.ທ່າແຮງທາງຊີວະວິທະຍາຂອງຈຸລິນຊີໃນມະຫາສະໝຸດເປີດຍັງບໍ່ຮູ້ຈັກເປັນສ່ວນໃຫຍ່ ເນື່ອງຈາກມີຂໍ້ຈຳກັດໃນການວິເຄາະຂໍ້ມູນຄວາມລະອຽດຂອງ genome ທັງໝົດໃນຂອບເຂດທົ່ວໂລກ.ທີ່ນີ້, ພວກເຮົາຄົ້ນຫາຄວາມຫຼາກຫຼາຍແລະຄວາມຫຼາກຫຼາຍຂອງກຸ່ມ gene biosynthetic ໃນມະຫາສະຫມຸດໂດຍການລວມເອົາປະມານ 10,000 genomes ຈຸລິນຊີຈາກຈຸລັງວັດທະນະທໍາແລະຈຸລັງດຽວທີ່ມີຫຼາຍກ່ວາ 25,000 genomes ຮ່າງທີ່ສ້າງຂຶ້ນໃຫມ່ຈາກຫຼາຍກວ່າ 1,000 ຕົວຢ່າງນ້ໍາທະເລ.ຄວາມພະຍາຍາມເຫຼົ່ານີ້ໄດ້ກໍານົດປະມານ 40,000 putative ສ່ວນຫຼາຍແມ່ນກຸ່ມ gene biosynthetic ໃຫມ່, ບາງອັນໄດ້ຖືກພົບເຫັນຢູ່ໃນກຸ່ມ phylogenetic ທີ່ບໍ່ສົງໃສໃນເມື່ອກ່ອນ.ໃນປະຊາກອນເຫຼົ່ານີ້, ພວກເຮົາໄດ້ກໍານົດສາຍພັນທີ່ອຸດົມສົມບູນໃນກຸ່ມ gene biosynthetic ("Candidatus Eudormicrobiaceae") ທີ່ເປັນຂອງ phylum ເຊື້ອແບັກທີເຣັຍທີ່ບໍ່ໄດ້ປູກຝັງແລະລວມເອົາຈຸລິນຊີທີ່ມີຄວາມຫຼາກຫຼາຍທາງດ້ານຊີວະວິທະຍາຫຼາຍທີ່ສຸດໃນສະພາບແວດລ້ອມນີ້.ໃນບັນດາສິ່ງເຫຼົ່ານີ້, ພວກເຮົາໄດ້ກໍານົດເສັ້ນທາງ phosphatase-peptide ແລະ pytonamide, ກໍານົດຕົວຢ່າງຂອງໂຄງສ້າງທາດປະສົມທາງຊີວະພາບທີ່ຜິດປົກກະຕິແລະ enzymology, ຕາມລໍາດັບ.ສະຫລຸບລວມແລ້ວ, ການສຶກສານີ້ສະແດງໃຫ້ເຫັນວິທີການຍຸດທະສາດທີ່ໃຊ້ microbiome ສາມາດເຮັດໃຫ້ການຂຸດຄົ້ນຂອງ enzymes ທີ່ບໍ່ໄດ້ອະທິບາຍກ່ອນຫນ້ານີ້ແລະອາຫານທໍາມະຊາດໃນ microbiota ແລະສະພາບແວດລ້ອມທີ່ເຂົ້າໃຈບໍ່ດີ.
ຈຸລິນຊີຂັບເຄື່ອນວົງຈອນຊີວະເຄມີທົ່ວໂລກ, ຮັກສາເສັ້ນໃຍອາຫານ, ແລະຮັກສາສຸຂະພາບຂອງພືດ ແລະສັດ5.ຄວາມຫຼາກຫຼາຍທາງດ້ານ phylogenetic, metabolic ແລະຄວາມຫຼາກຫຼາຍທາງດ້ານການທໍາງານຂອງເຂົາເຈົ້າສະແດງໃຫ້ເຫັນເຖິງທ່າແຮງທີ່ອຸດົມສົມບູນສໍາລັບການຄົ້ນພົບຂອງ taxa1 ໃຫມ່, enzymes ແລະທາດປະສົມທາງຊີວະເຄມີ, ລວມທັງຜະລິດຕະພັນທໍາມະຊາດ6.ໃນຊຸມຊົນທາງດ້ານນິເວດວິທະຍາ, ໂມເລກຸນເຫຼົ່ານີ້ໃຫ້ຈຸລິນຊີທີ່ມີຫນ້າທີ່ຫຼາກຫຼາຍທາງດ້ານຊີວະວິທະຍາແລະລະບົບນິເວດ, ຈາກການສື່ສານກັບການແຂ່ງຂັນ 2, 7 .ນອກເຫນືອໄປຈາກຫນ້າທີ່ຕົ້ນສະບັບຂອງພວກເຂົາ, ຜະລິດຕະພັນທໍາມະຊາດເຫຼົ່ານີ້ແລະເສັ້ນທາງການຜະລິດລະຫັດພັນທຸກໍາຂອງພວກເຂົາສະຫນອງຕົວຢ່າງສໍາລັບການນໍາໃຊ້ເຕັກໂນໂລຢີຊີວະພາບແລະການປິ່ນປົວ2,3.ການກໍານົດເສັ້ນທາງແລະການເຊື່ອມຕໍ່ດັ່ງກ່າວໄດ້ຮັບການອໍານວຍຄວາມສະດວກຢ່າງຫຼວງຫຼາຍໂດຍການສຶກສາ microbes ວັດທະນະທໍາ.ເຖິງຢ່າງໃດກໍ່ຕາມ, ການສຶກສາດ້ານວິຊາສະເພາະຂອງສະພາບແວດລ້ອມທໍາມະຊາດໄດ້ສະແດງໃຫ້ເຫັນວ່າຈຸລິນຊີສ່ວນໃຫຍ່ບໍ່ໄດ້ຖືກປູກຝັງ.ຄວາມລໍາອຽງທາງວັດທະນະທໍານີ້ຈໍາກັດຄວາມສາມາດຂອງພວກເຮົາທີ່ຈະຂຸດຄົ້ນຄວາມຫຼາກຫຼາຍທີ່ເປັນປະໂຫຍດທີ່ຖືກເຂົ້າລະຫັດໂດຍ microbes ຈໍານວນຫຼາຍ4,9.
ເພື່ອເອົາຊະນະຂໍ້ຈໍາກັດເຫຼົ່ານີ້, ຄວາມກ້າວຫນ້າທາງດ້ານເຕັກໂນໂລຢີໃນທົດສະວັດທີ່ຜ່ານມາໄດ້ອະນຸຍາດໃຫ້ນັກຄົ້ນຄວ້າໂດຍກົງ (ເຊັ່ນ, ໂດຍບໍ່ມີວັດທະນະທໍາກ່ອນ) ລໍາດັບ microbial DNA fragments ຈາກຊຸມຊົນທັງຫມົດ (metagenomics) ຫຼືຈຸລັງດຽວ.ຄວາມສາມາດໃນການປະກອບຊິ້ນສ່ວນເຫຼົ່ານີ້ເຂົ້າໄປໃນຊິ້ນສ່ວນ genome ທີ່ໃຫຍ່ກວ່າແລະສ້າງໃຫມ່ genomes ປະກອບ metagenomically ຫຼາຍ metagnomically assembled (MAGs) ຫຼື genomes ຂະຫຍາຍດຽວ (SAGs), ຕາມລໍາດັບ, ເປີດໂອກາດທີ່ສໍາຄັນສໍາລັບການສຶກສາ taxocentric ຂອງ microbiome (ie, microbial ຊຸມຊົນແລະ microbiome).ປູທາງໃໝ່.ພັນທຸ ກຳ ຂອງຕົນເອງໃນສະພາບແວດລ້ອມທີ່ໃຫ້) 10,11,12.ແທ້ຈິງແລ້ວ, ການສຶກສາທີ່ຜ່ານມາໄດ້ຂະຫຍາຍການເປັນຕົວແທນຂອງ phylogenetic ຂອງຄວາມຫຼາກຫຼາຍຂອງຈຸລິນຊີໃນ Earth1, 13 ແລະໄດ້ເປີດເຜີຍຄວາມຫຼາກຫຼາຍຂອງການເຮັດວຽກຢູ່ໃນຊຸມຊົນຈຸລິນຊີສ່ວນບຸກຄົນທີ່ບໍ່ໄດ້ກວມເອົາກ່ອນຫນ້ານີ້ໂດຍລໍາດັບ genome ອ້າງອີງຂອງຈຸລິນຊີວັດທະນະທໍາ (REFs)14.ຄວາມສາມາດໃນການວາງຄວາມຫຼາກຫຼາຍທີ່ເປັນປະໂຫຍດທີ່ບໍ່ໄດ້ຄົ້ນພົບໃນສະພາບການຂອງ genome ເຈົ້າພາບ (ເຊັ່ນ, ການແກ້ໄຂຂອງ genome) ແມ່ນສໍາຄັນສໍາລັບການຄາດເດົາວ່າສາຍຈຸລິນຊີທີ່ຍັງບໍ່ທັນມີຄຸນສົມບັດທີ່ສົມມຸດວ່າເຂົ້າລະຫັດຜະລິດຕະພັນທໍາມະຊາດໃຫມ່ 15,16 ຫຼືສໍາລັບການຕິດຕາມທາດປະສົມດັ່ງກ່າວກັບຄືນສູ່ຜູ້ຜະລິດຕົ້ນສະບັບ 17.ຕົວຢ່າງ, ວິທີການວິເຄາະ genomic metagenomic ແລະຈຸລັງດຽວໄດ້ນໍາໄປສູ່ການກໍານົດຕົວຂອງ Candidatus Entotheonella, ກຸ່ມຂອງເຊື້ອແບັກທີເຣັຍທີ່ກ່ຽວຂ້ອງກັບ sponge ທີ່ອຸດົມສົມບູນທາງໂພຊະນາການ, ເປັນຜູ້ຜະລິດຂອງຄວາມຫລາກຫລາຍຂອງທ່າແຮງຂອງຢາເສບຕິດ18.ຢ່າງໃດກໍຕາມ, ເຖິງວ່າຈະມີຄວາມພະຍາຍາມທີ່ຜ່ານມາໃນການສໍາຫຼວດ genomic ຂອງຊຸມຊົນ microbial ຫຼາກຫຼາຍຊະນິດ, 16,19 ຫຼາຍກ່ວາສອງສ່ວນສາມຂອງຂໍ້ມູນ metagenomic ທົ່ວໂລກສໍາລັບມະຫາສະຫມຸດທີ່ໃຫຍ່ທີ່ສຸດຂອງໂລກຂອງລະບົບນິເວດ16,20 ຍັງຂາດຫາຍໄປ.ດັ່ງນັ້ນ, ໂດຍທົ່ວໄປ, ທ່າແຮງ biosynthetic ຂອງ microbiome ທະເລແລະທ່າແຮງຂອງມັນໃນຖານະເປັນບ່ອນເກັບຮັກສາຂອງ enzymatic ໃຫມ່ແລະຜະລິດຕະພັນທໍາມະຊາດຍັງຄົງ understudied ສ່ວນໃຫຍ່.
ເພື່ອຄົ້ນຫາທ່າແຮງທາງຊີວະວິທະຍາຂອງຈຸລິນຊີທາງທະເລໃນຂອບເຂດທົ່ວໂລກ, ພວກເຮົາທໍາອິດໄດ້ລວບລວມພັນທຸ ກຳ ຂອງຈຸລິນຊີທະເລທີ່ໄດ້ຮັບໂດຍໃຊ້ວິທີການທີ່ຂື້ນກັບວັດທະນະ ທຳ ແລະບໍ່ແມ່ນວັດທະນະ ທຳ ເພື່ອສ້າງຖານຂໍ້ມູນທີ່ກວ້າງຂວາງຂອງ phylogenetics ແລະການເຮັດວຽກຂອງ gene.ການກວດສອບຖານຂໍ້ມູນນີ້ເປີດເຜີຍໃຫ້ເຫັນຫຼາກຫຼາຍຊະນິດຂອງກຸ່ມ gene biosynthetic (BGCs), ເຊິ່ງສ່ວນໃຫຍ່ເປັນຂອງຄອບຄົວກຸ່ມ gene (GCF) ທີ່ຍັງບໍ່ທັນມີລັກສະນະ.ນອກຈາກນັ້ນ, ພວກເຮົາໄດ້ກໍານົດຄອບຄົວເຊື້ອແບັກທີເຣັຍທີ່ບໍ່ຮູ້ຈັກທີ່ສະແດງໃຫ້ເຫັນຄວາມຫຼາກຫຼາຍຂອງ BGCs ທີ່ຮູ້ຈັກສູງສຸດໃນມະຫາສະຫມຸດເປີດຈົນເຖິງປະຈຸບັນ.ພວກເຮົາໄດ້ເລືອກສອງເສັ້ນທາງການສັງເຄາະ ribosomal ແລະ peptide (RiPP) ທີ່ຖືກດັດແປງຫລັງການແປເພື່ອການກວດສອບຄວາມຖືກຕ້ອງຂອງການທົດລອງໂດຍອີງໃສ່ຄວາມແຕກຕ່າງທາງພັນທຸກໍາຂອງພວກເຂົາຈາກເສັ້ນທາງທີ່ຮູ້ຈັກໃນປັດຈຸບັນ.ລັກສະນະທີ່ເປັນປະໂຫຍດຂອງເສັ້ນທາງເຫຼົ່ານີ້ໄດ້ເປີດເຜີຍຕົວຢ່າງທີ່ບໍ່ຄາດຄິດຂອງ enzymology ເຊັ່ນດຽວກັນກັບທາດປະສົມທີ່ຜິດປົກກະຕິທີ່ມີໂຄງສ້າງທີ່ມີກິດຈະກໍາ inhibitory protease.
ທໍາອິດ, ພວກເຮົາມີຈຸດປະສົງເພື່ອສ້າງຊັບພະຍາກອນຂໍ້ມູນທົ່ວໂລກສໍາລັບການວິເຄາະ genome, ສຸມໃສ່ອົງປະກອບຂອງແບັກທີເລຍແລະ archaeal ຂອງມັນ.ຕໍ່ກັບບັນຫານີ້, ພວກເຮົາໄດ້ລວມເອົາຂໍ້ມູນເມຕານາໂນມ ແລະ ນໍ້າທະເລ 1038 ຕົວຢ່າງຈາກ 215 ສະຖານທີ່ເກັບຕົວຢ່າງທີ່ແຈກຢາຍໃນທົ່ວໂລກ (ໄລຍະເສັ້ນຂະໜານ = 141.6°) ແລະ ຊັ້ນເລິກຫຼາຍຊັ້ນ (ຄວາມເລິກແຕ່ 1 ຫາ 5600 ມ, ກວມເອົາເຂດ pelagic, mesopelagic ແລະ abyssal).ຄວາມເປັນມາ21,22,23 (ຮູບ 1a, ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 1a ແລະຕາຕະລາງເສີມ 1).ນອກເຫນືອຈາກການສະຫນອງການຄຸ້ມຄອງພູມສັນຖານທີ່ກວ້າງຂວາງ, ຕົວຢ່າງການກັ່ນຕອງທີ່ເລືອກເຫຼົ່ານີ້ໄດ້ອະນຸຍາດໃຫ້ພວກເຮົາປຽບທຽບອົງປະກອບຕ່າງໆຂອງຈຸລິນຊີໃນທະເລ, ລວມທັງເຊື້ອໄວຣັດທີ່ອຸດົມສົມບູນ (<0.2 µm), ອຸດົມສົມບູນ prokaryotic (0.2–3 µm), ອຸດົມສົມບູນອະນຸພາກ (0.8 µm. ).–20 µm) ແລະອານານິຄົມທີ່ໝົດໄວຣັດ (> 0.2 µm).
a, ທັງໝົດ 1038 genomes ທີ່ມີຢູ່ສາທາລະນະ (metagenomics) ຂອງຊຸມຊົນຈຸລິນຊີໃນທະເລທີ່ເກັບກໍາຈາກ 215 ສະຖານທີ່ແຈກຢາຍທົ່ວໂລກ (62°S ຫາ 79°N ແລະ 179°W ຫາ 179°E .).ແຜ່ນແຜນທີ່ © Esri.ແຫຼ່ງຂໍ້ມູນ: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, ແລະ Esri.b, metagenomes ເຫຼົ່ານີ້ໄດ້ຖືກນໍາໃຊ້ເພື່ອ reconstruct MAGs (ວິທີການແລະຂໍ້ມູນເພີ່ມເຕີມ), ເຊິ່ງແຕກຕ່າງກັນໃນປະລິມານແລະຄຸນນະພາບ (ວິທີການ) ໃນຊຸດຂໍ້ມູນ (ຫມາຍເປັນສີ).MAGs ທີ່ສ້າງຂຶ້ນໃຫມ່ໄດ້ຖືກເສີມດ້ວຍ genomes ທີ່ມີຢູ່ສາທາລະນະ (ພາຍນອກ), ລວມທັງເຄື່ອງຫັດຖະກໍາ MAG26, SAG27 ແລະ REF.27 ລວບລວມ OMD.c, ເມື່ອປຽບທຽບກັບບົດລາຍງານທີ່ຜ່ານມາໂດຍອີງໃສ່ພຽງແຕ່ SAG (GORG)20 ຫຼື MAG (GEM)16, OMD ປັບປຸງລັກສະນະ genomic ຂອງຊຸມຊົນຈຸລິນຊີໃນທະເລ (ອັດຕາການອ່ານແຜນທີ່ metagenomic; ວິທີການ) ສອງຫາສາມເທື່ອໂດຍການສະແດງທີ່ສອດຄ່ອງກັນຫຼາຍຂຶ້ນໃນຄວາມເລິກແລະ ເສັ້ນຂະໜານ..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n=132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, ການຈັດກຸ່ມ OMD ເຂົ້າໄປໃນກຸ່ມຊະນິດພັນ (95% ຫມາຍເຖິງຕົວຕົນ nucleotide) ກໍານົດຈໍານວນທັງຫມົດ. ປະມານ 8300 ຊະນິດ, ຫຼາຍກວ່າເຄິ່ງຫນຶ່ງຂອງທີ່ຍັງບໍ່ທັນໄດ້ຖືກກໍານົດໄວ້ກ່ອນຫນ້ານີ້ຕາມຄໍາບັນຍາຍ taxonomic ໂດຍໃຊ້ GTDB (version 89) e, ການຈັດປະເພດຂອງຊະນິດພັນຕາມປະເພດຂອງ genome ສະແດງໃຫ້ເຫັນວ່າ MAG, SAG ແລະ REFs ປະກອບເຊິ່ງກັນແລະກັນໄດ້ດີໃນການສະທ້ອນເຖິງຄວາມຫຼາກຫຼາຍທາງດ້ານ phylogenetic ຂອງ. microbiome ທະເລ.ໂດຍສະເພາະ, 55%, 26% ແລະ 11% ຂອງຊະນິດແມ່ນສະເພາະສໍາລັບ MAG, SAG ແລະ REF, ຕາມລໍາດັບ.BATS, Bermuda Atlantic Time Series;GEM, genomes ຂອງ microbiome ໂລກ;GORG, genome ກະສານອ້າງອີງມະຫາສະຫມຸດທົ່ວໂລກ;ຮ້ອນ, ຊຸດເວລາມະຫາສະໝຸດຮາວາຍ.
ການນໍາໃຊ້ຊຸດຂໍ້ມູນນີ້, ພວກເຮົາໄດ້ສ້າງໃຫມ່ຈໍານວນ 26,293 MAGs, ສ່ວນຫຼາຍແມ່ນແບັກທີເລຍແລະ archaeal (ຮູບ 1b ແລະຂໍ້ມູນຂະຫຍາຍ, ຮູບ 1b).ພວກເຮົາສ້າງ MAGs ເຫຼົ່ານີ້ຈາກການປະກອບຈາກແຍກຕ່າງຫາກແທນທີ່ຈະເປັນຕົວຢ່າງ metagenomic ລວມເພື່ອປ້ອງກັນການລົ້ມລົງຂອງການປ່ຽນແປງລໍາດັບທໍາມະຊາດລະຫວ່າງຕົວຢ່າງຈາກສະຖານທີ່ທີ່ແຕກຕ່າງກັນຫຼືຈຸດເວລາ (ວິທີການ).ນອກຈາກນັ້ນ, ພວກເຮົາໄດ້ຈັດກຸ່ມ genomic fragments ໂດຍອີງໃສ່ຄວາມກ່ຽວຂ້ອງກັນຂອງພວກມັນໃນທົ່ວຈໍານວນຕົວຢ່າງຈໍານວນຫລາຍ (ຈາກ 58 ຫາ 610 ຕົວຢ່າງ, ຂຶ້ນກັບການສໍາຫຼວດ; ວິທີການ).ພວກເຮົາພົບວ່ານີ້ແມ່ນຂັ້ນຕອນທີ່ໃຊ້ເວລາຫຼາຍແຕ່ສໍາຄັນທີ່ຂ້າມໄປໃນຫຼາຍໆວຽກງານການຟື້ນຟູຂະຫນາດໃຫຍ່ຂອງ MAG16, 19, 25 ແລະປັບປຸງປະລິມານຢ່າງຫຼວງຫຼາຍ (ສະເລ່ຍ 2.7 ເທົ່າ) ແລະຄຸນນະພາບ (+ 20% ໂດຍສະເລ່ຍ) ຂອງ. genome.reconstructed ຈາກ metagenome ທະເລທີ່ໄດ້ສຶກສາຢູ່ທີ່ນີ້ (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 2a ແລະຂໍ້ມູນເພີ່ມເຕີມ).ໂດຍລວມແລ້ວ, ຄວາມພະຍາຍາມເຫຼົ່ານີ້ເຮັດໃຫ້ MAG microbial ທະເລເພີ່ມຂຶ້ນ 4.5 ເທົ່າ (6 ເທົ່າຖ້າພຽງແຕ່ MAGs ທີ່ມີຄຸນນະພາບສູງຖືກພິຈາລະນາ) ເມື່ອທຽບກັບຊັບພະຍາກອນ MAG ທີ່ສົມບູນແບບທີ່ສຸດທີ່ມີຢູ່ໃນມື້ນີ້ 16 (ວິທີການ).ຊຸດ MAG ທີ່ສ້າງຂຶ້ນໃຫມ່ນີ້ໄດ້ຖືກລວມເຂົ້າກັບ MAG26s ທີ່ເລືອກດ້ວຍມື 830, 5969 SAG27s ແລະ 1707 REFs.27 ຊະນິດຂອງເຊື້ອແບັກທີເຣັຍທາງທະເລ ແລະ archaea ປະກອບດ້ວຍການລວບລວມຂອງ 34,799 genomes (ຮູບ 1b).
ຫຼັງຈາກນັ້ນພວກເຮົາໄດ້ປະເມີນຊັບພະຍາກອນທີ່ສ້າງຂຶ້ນໃຫມ່ເພື່ອປັບປຸງຄວາມສາມາດໃນການເປັນຕົວແທນຂອງຊຸມຊົນຈຸລິນຊີໃນທະເລແລະປະເມີນຜົນກະທົບຂອງການລວມເອົາປະເພດພັນທຸກໍາທີ່ແຕກຕ່າງກັນ.ໂດຍສະເລ່ຍແລ້ວ, ພວກເຮົາພົບວ່າມັນກວມເອົາປະມານ 40-60% ຂອງຂໍ້ມູນ metagenomic ທະເລ (ຮູບ 1c), ສອງຫາສາມເທົ່າຂອງການຄຸ້ມຄອງຂອງບົດລາຍງານທີ່ຜ່ານມາ MAG ເທົ່ານັ້ນໃນທັງຄວາມເລິກແລະເສັ້ນຂະຫນານຫຼາຍ serial 16 ຫຼື SAG20.ນອກຈາກນັ້ນ, ເພື່ອວັດແທກຄວາມຫຼາກຫຼາຍຂອງ taxonomic ຢ່າງເປັນລະບົບໃນການເກັບກໍາທີ່ສ້າງຕັ້ງຂຶ້ນ, ພວກເຮົາໄດ້ອະທິບາຍເຖິງ genomes ທັງຫມົດໂດຍໃຊ້ຊຸດເຄື່ອງມືຂອງ Genome Taxonomy Database (GTDB) (ວິທີການ) ແລະນໍາໃຊ້ຕົວຕົນ nucleotide ກວ້າງ genome ໂດຍສະເລ່ຍຂອງ 95%.28 ເພື່ອກໍານົດ 8,304 ກຸ່ມຊະນິດ (ຊະນິດ).ສອງສ່ວນສາມຂອງຊະນິດພັນເຫຼົ່ານີ້ (ລວມທັງ clades ໃຫມ່) ບໍ່ໄດ້ປາກົດຢູ່ໃນ GTDB ກ່ອນຫນ້ານີ້, ໃນນັ້ນ 2790 ໄດ້ຖືກຄົ້ນພົບໂດຍໃຊ້ MAG ທີ່ສ້າງຂຶ້ນໃຫມ່ໃນການສຶກສານີ້ (ຮູບ 1d).ນອກຈາກນັ້ນ, ພວກເຮົາພົບວ່າປະເພດຕ່າງໆຂອງ genomes ມີຄວາມສົມດູນກັນສູງ: 55%, 26%, ແລະ 11% ຂອງຊະນິດແມ່ນປະກອບດ້ວຍ MAG, SAG, ແລະ REF ທັງຫມົດ, ຕາມລໍາດັບ (ຮູບ 1e).ນອກຈາກນັ້ນ, MAG ໄດ້ກວມເອົາທັງຫມົດ 49 ປະເພດທີ່ພົບເຫັນຢູ່ໃນຖັນນ້ໍາ, ໃນຂະນະທີ່ SAG ແລະ REF ພຽງແຕ່ເປັນຕົວແທນ 18 ແລະ 11 ຂອງພວກເຂົາ, ຕາມລໍາດັບ.ຢ່າງໃດກໍຕາມ, SAG ດີກວ່າເປັນຕົວແທນຂອງຄວາມຫຼາກຫຼາຍຂອງ clades ທົ່ວໄປທີ່ສຸດ (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 3a), ເຊັ່ນ Pelagic Bacteriales (SAR11), SAG ກວມເອົາເກືອບ 1300 ຊະນິດແລະ MAG ພຽງແຕ່ 390 ຊະນິດ.ໂດຍສະເພາະ, REFs ບໍ່ຄ່ອຍຈະທັບຊ້ອນກັນກັບ MAGs ຫຼື SAGs ໃນລະດັບຊະນິດພັນແລະເປັນຕົວແທນ > 95% ຂອງປະມານ 1000 genomes ທີ່ບໍ່ພົບຢູ່ໃນຊຸດ metagenomic ມະຫາສະຫມຸດເປີດທີ່ໄດ້ສຶກສາຢູ່ທີ່ນີ້, ສ່ວນໃຫຍ່ແມ່ນຍ້ອນການພົວພັນກັບປະເພດອື່ນໆຂອງຕົວຢ່າງທາງທະເລທີ່ໂດດດ່ຽວ (ຕົວຢ່າງເຊັ່ນຕະກອນ). .ຫຼື host-associate).ເພື່ອເຮັດໃຫ້ມັນສາມາດໃຊ້ໄດ້ຢ່າງກວ້າງຂວາງກັບຊຸມຊົນວິທະຍາສາດ, ຊັບພະຍາກອນ genome ທະເລນີ້, ເຊິ່ງຍັງປະກອບມີ fragments ທີ່ບໍ່ໄດ້ຈັດປະເພດ (ຕົວຢ່າງ, ຈາກ phages ຄາດຄະເນ, ເກາະ genomic, ແລະ fragments genome ທີ່ມີຂໍ້ມູນບໍ່ພຽງພໍສໍາລັບການຟື້ນຟູ MAG), ສາມາດປຽບທຽບກັບຂໍ້ມູນ taxonomic. .ເຂົ້າເຖິງຄຳອະທິບາຍປະກອບພ້ອມກັບການທຳງານຂອງພັນທຸກໍາ ແລະພາລາມິເຕີຂອງບໍລິບົດໃນຖານຂໍ້ມູນຈຸລະພາກມະຫາສະໝຸດ (OMD; https://microbiomics.io/ocean/).
ຫຼັງຈາກນັ້ນ, ພວກເຮົາກໍານົດອອກເພື່ອຄົ້ນຫາຄວາມອຸດົມສົມບູນແລະຄວາມແປກໃຫມ່ຂອງທ່າແຮງ biosynthetic ໃນ microbiomes ມະຫາສະຫມຸດເປີດ.ເພື່ອເຮັດສິ່ງນີ້, ພວກເຮົາທໍາອິດໃຊ້ antiSMASH ສໍາລັບ MAGs, SAGs, ແລະ REFs ທັງຫມົດທີ່ພົບເຫັນຢູ່ໃນ 1038 metagenomes ທະເລ (ວິທີການ) ເພື່ອຄາດຄະເນຈໍານວນທັງຫມົດ 39,055 BGCs.ຫຼັງຈາກນັ້ນ, ພວກເຮົາຈັດກຸ່ມເຫຼົ່ານີ້ເຂົ້າໄປໃນ 6907 GCFs ທີ່ບໍ່ຊ້ໍາກັນແລະ 151 gene cluster ປະຊາກອນ (GCCs; ຕາຕະລາງເສີມ 2 ແລະວິທີການ) ເພື່ອບັນຊີສໍາລັບການຊ້ໍາຊ້ອນປະກົດຂຶ້ນ (ເຊັ່ນ, BGC ດຽວກັນສາມາດຖືກເຂົ້າລະຫັດໃນຫຼາຍ genomes) ແລະຂໍ້ມູນ metagenomic Fragmentation ຂອງ BGCs ເຂັ້ມຂຸ້ນ .BGCs ທີ່ບໍ່ຄົບຖ້ວນບໍ່ໄດ້ເພີ່ມຂຶ້ນຢ່າງຫຼວງຫຼາຍ, ຖ້າມີ (ຂໍ້ມູນເສີມ), ຈໍານວນຂອງ GCFs ແລະ GCCs, ຕາມລໍາດັບ, ມີຢ່າງຫນ້ອຍຫນຶ່ງສະມາຊິກ BGC intact ໃນ 44% ແລະ 86% ຂອງກໍລະນີ.
ໃນລະດັບ GCC, ພວກເຮົາພົບເຫັນຄວາມຫລາກຫລາຍຂອງ RiPPs ທີ່ຄາດຄະເນແລະຜະລິດຕະພັນທໍາມະຊາດອື່ນໆ (ຮູບ 2a).ໃນບັນດາພວກມັນ, ສໍາລັບການຍົກຕົວຢ່າງ, arylpolyenes, carotenoids, ectoines, ແລະ siderophores ເປັນຂອງ GCCs ທີ່ມີການແຜ່ກະຈາຍ phylogenetic ກ້ວາງແລະຄວາມອຸດົມສົມບູນໃນມະຫາສະຫມຸດ metagenomes, ເຊິ່ງອາດຈະຊີ້ໃຫ້ເຫັນເຖິງການປັບຕົວຢ່າງກວ້າງຂວາງຂອງຈຸລິນຊີກັບສະພາບແວດລ້ອມນ້ໍາ, ລວມທັງຄວາມຕ້ານທານກັບຊະນິດອົກຊີເຈນທີ່ reactive,. oxidative ແລະຄວາມກົດດັນ osmotic..ຫຼືການດູດຊຶມທາດເຫຼັກ (ຂໍ້ມູນເພີ່ມເຕີມ).ຄວາມຫຼາກຫຼາຍທີ່ເປັນປະໂຫຍດນີ້ກົງກັນຂ້າມກັບການວິເຄາະທີ່ຜ່ານມາປະມານ 1.2 ລ້ານ BGCs ລະຫວ່າງປະມານ 190,000 genomes ທີ່ເກັບໄວ້ໃນຖານຂໍ້ມູນ NCBI RefSeq (BiG-FAM/RefSeq, ຕໍ່ໄປນີ້ເອີ້ນວ່າ RefSeq)29, ເຊິ່ງສະແດງໃຫ້ເຫັນວ່າ nonribosomal Synthetase peptides ແລະ polyketides (NRPS). (PKS) BGCs (ຂໍ້ມູນເສີມ).ພວກເຮົາຍັງພົບເຫັນ 44 (29%) GCCs ພຽງແຕ່ກ່ຽວຂ້ອງກັບ RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Fig. 2a ແລະວິທີການ) ແລະ 53 (35%) GCCs ພຽງແຕ່ຢູ່ໃນ MAG , ເນັ້ນໃສ່ທ່າແຮງ. ເພື່ອກວດຫາສານເຄມີທີ່ບໍ່ໄດ້ອະທິບາຍມາກ່ອນໃນ OMD.ເນື່ອງຈາກແຕ່ລະ GCCs ເຫຼົ່ານີ້ອາດຈະເປັນຕົວແທນຂອງຫນ້າທີ່ biosynthetic ທີ່ມີຄວາມຫຼາກຫຼາຍສູງ, ພວກເຮົາໄດ້ວິເຄາະຂໍ້ມູນຕື່ມອີກໃນລະດັບ GCF ໃນຄວາມພະຍາຍາມທີ່ຈະຈັດກຸ່ມ BGCs ທີ່ລະອຽດກວ່າທີ່ຄາດຄະເນໄວ້ໃນລະຫັດສໍາລັບຜະລິດຕະພັນທໍາມະຊາດທີ່ຄ້າຍຄືກັນ29.ຈໍານວນ 3861 (56%) ທີ່ລະບຸ GCFs ບໍ່ໄດ້ທັບຊ້ອນກັບ RefSeq, ແລະ > 97% ຂອງ GCFs ບໍ່ມີຢູ່ໃນ MIBiG, ຫນຶ່ງໃນຖານຂໍ້ມູນທີ່ໃຫຍ່ທີ່ສຸດຂອງ BGCs ທີ່ໄດ້ຮັບການທົດລອງ (ຮູບ 2b).ໃນຂະນະທີ່ມັນບໍ່ແປກໃຈທີ່ຈະຄົ້ນພົບເສັ້ນທາງນະວະນິຍາຍທີ່ມີທ່າແຮງຫຼາຍໃນການຕັ້ງຄ່າທີ່ບໍ່ສະແດງໄດ້ດີໂດຍ genome ອ້າງອິງ, ວິທີການຂອງພວກເຮົາສໍາລັບການ dereplicating BGCs ເຂົ້າໄປໃນ GCFs ກ່ອນທີ່ຈະ benchmarking ແຕກຕ່າງຈາກບົດລາຍງານທີ່ຜ່ານມາ 16 ແລະອະນຸຍາດໃຫ້ພວກເຮົາສະຫນອງການປະເມີນທີ່ບໍ່ເປັນກາງຂອງ novelty.ສ່ວນໃຫຍ່ຂອງຄວາມຫຼາກຫຼາຍໃຫມ່ (3012 GCF ຫຼື 78%) ສອດຄ່ອງກັບ terpenes ຄາດຄະເນ, RiPP ຫຼືຜະລິດຕະພັນທໍາມະຊາດອື່ນໆ, ແລະສ່ວນໃຫຍ່ (1815 GCF ຫຼື 47%) ຖືກເຂົ້າລະຫັດໃນປະເພດທີ່ບໍ່ຮູ້ຈັກເນື່ອງຈາກທ່າແຮງ biosynthetic ຂອງເຂົາເຈົ້າ.ບໍ່ເຫມືອນກັບກຸ່ມ PKS ແລະ NRPS, BGCs ທີ່ຫນາແຫນ້ນເຫຼົ່ານີ້ມີແນວໂນ້ມຫນ້ອຍທີ່ຈະໄດ້ຮັບການ fragmented ໃນລະຫວ່າງການປະກອບ metagenomic 31 ແລະອະນຸຍາດໃຫ້ໃຊ້ເວລາຫຼາຍ - ແລະຊັບພະຍາກອນທີ່ມີລັກສະນະທີ່ເປັນປະໂຫຍດຫຼາຍຂອງຜະລິດຕະພັນຂອງເຂົາເຈົ້າ.
ທັງໝົດ 39,055 BGCs ຖືກຈັດເປັນ 6,907 GCFs ແລະ 151 GCCs.a, ການເປັນຕົວແທນຂໍ້ມູນ (ພາຍໃນພາຍນອກ).ການຈັດກຸ່ມຕາມລຳດັບຂອງໄລຍະຫ່າງ BGC ໂດຍອີງໃສ່ GCC, 53 ທີ່ຖືກແກ້ໄຂໂດຍ MAG ເທົ່ານັ້ນ.GCC ປະກອບມີ BGCs ຈາກ taxa ທີ່ແຕກຕ່າງກັນ (ຄວາມຖີ່ຂອງປະຕູ ln-transformed) ແລະປະເພດ BGC ທີ່ແຕກຕ່າງກັນ (ຂະຫນາດວົງກົງກັບຄວາມຖີ່ຂອງມັນ).ສໍາລັບແຕ່ລະ GCC, ຊັ້ນນອກສະແດງເຖິງຈໍານວນ BGCs, ອັດຕາສ່ວນ (ສ່ວນຮ້ອຍຂອງຕົວຢ່າງ), ແລະໄລຍະຫ່າງ (ຂັ້ນຕ່ໍາ BGC cosine ໄລຍະ (ນາທີ(dMIBiG))) ຈາກ BiG-FAM ກັບ BGC.GCCs ກັບ BGCs ທີ່ກ່ຽວຂ້ອງຢ່າງໃກ້ຊິດກັບ BGCs ທີ່ຜ່ານການພິສູດແລ້ວ (MIBiG) ແມ່ນເນັ້ນໃສ່ດ້ວຍລູກສອນ.b ການປຽບທຽບ GCF ກັບການຄາດຄະເນ (BiG-FAM) ແລະການທົດສອບ (MIBiG) BGCs, 3861 ໃຫມ່ (d–>0.2) GCFs ໄດ້ຖືກພົບເຫັນ.ສ່ວນໃຫຍ່ (78%) ຂອງລະຫັດເຫຼົ່ານີ້ສໍາລັບ RiPP, terpenes, ແລະຜະລິດຕະພັນທໍາມະຊາດ putative ອື່ນໆ.c, genomes ທັງຫມົດໃນ OMD ທີ່ພົບເຫັນຢູ່ໃນ 1038 metagenomes ທະເລໄດ້ຖືກຈັດໃສ່ໃນຕົ້ນໄມ້ພື້ນຖານ GTDB ເພື່ອສະແດງໃຫ້ເຫັນການຄຸ້ມຄອງ phylogenetic ຂອງ OMD.Clades ທີ່ບໍ່ມີ genomes ໃນ OMD ແມ່ນສະແດງເປັນສີຂີ້ເຖົ່າ.ຈໍານວນຂອງ BGCs ກົງກັບຈໍານວນທີ່ໃຫຍ່ທີ່ສຸດຂອງ BGCs ທີ່ຄາດຄະເນຕໍ່ genome ໃນ clade ທີ່ກໍານົດໄວ້.ສໍາລັບຄວາມຊັດເຈນ, 15% ສຸດທ້າຍຂອງ nodes ແມ່ນຍຸບ.ລູກສອນຊີ້ບອກ clades ທີ່ອຸດົມສົມບູນໃນ BGC (> 15 BGC), ຍົກເວັ້ນ Mycobacterium, Gordonia (ທີສອງພຽງແຕ່ Rhodococcus), ແລະ Crocosphaera (ທີສອງພຽງແຕ່ Synechococcus).d, ບໍ່ຮູ້ c.Eremiobacterota ສະແດງໃຫ້ເຫັນຄວາມຫຼາກຫຼາຍທາງດ້ານຊີວະວິທະຍາທີ່ສູງທີ່ສຸດ (ດັດຊະນີ Shannon ອີງໃສ່ປະເພດຜະລິດຕະພັນທໍາມະຊາດ).ແຕ່ລະແຖບສະແດງເຖິງ genome ທີ່ມີ BGCs ຫຼາຍທີ່ສຸດໃນຊະນິດ.T1PKS, PKS type I, T2/3PKS, PKS type II ແລະ type III.
ນອກເຫນືອຈາກຄວາມອຸດົມສົມບູນແລະຄວາມແປກໃຫມ່, ພວກເຮົາຄົ້ນຫາໂຄງສ້າງທາງຊີວະພາບຂອງທ່າແຮງ biosynthetic ຂອງ microbiome ທະເລ.ການຈັດກຸ່ມຕົວຢ່າງໂດຍການແຈກຢາຍຕົວເລກສໍາເນົາ GCF ໂດຍສະເລ່ຍຂອງ metaagenomic (ວິທີການ) ໄດ້ສະແດງໃຫ້ເຫັນວ່າຊຸມຊົນທີ່ມີເສັ້ນດ່າງຕ່ໍາ, ພື້ນຜິວ, ອຸດົມສົມບູນ prokaryotic ແລະໄວຣັສ, ສ່ວນຫຼາຍແມ່ນມາຈາກຫນ້າດິນຫຼືນ້ໍາທີ່ມີແສງແດດເລິກກວ່າ, ແມ່ນອຸດົມສົມບູນໃນ RiPP ແລະ BGC terpenes.ໃນທາງກົງກັນຂ້າມ, ຊຸມຊົນຂົ້ວໂລກ, ທະເລເລິກ, ໄວຣັສແລະອະນຸພາກແມ່ນກ່ຽວຂ້ອງກັບຄວາມອຸດົມສົມບູນທີ່ສູງຂຶ້ນຂອງ NRPS ແລະ PKS BGC (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 4 ແລະຂໍ້ມູນເພີ່ມເຕີມ).ສຸດທ້າຍ, ພວກເຮົາພົບເຫັນວ່າຊຸມຊົນເຂດຮ້ອນ ແລະ pelagic ທີ່ໄດ້ຮັບການສຶກສາດີແມ່ນແຫຼ່ງທີ່ໂດດເດັ່ນທີ່ສຸດຂອງ terpenes ໃຫມ່ (ຕົວເລກທີ່ເພີ່ມຂຶ້ນ).ທ່າແຮງສູງສຸດສໍາລັບ PKS, RiPP ແລະຜະລິດຕະພັນທໍາມະຊາດອື່ນໆ (ຮູບ 5a ທີ່ມີຂໍ້ມູນຂະຫຍາຍ).
ເພື່ອເສີມສ້າງການສຶກສາຂອງພວກເຮົາກ່ຽວກັບທ່າແຮງ biosynthetic ຂອງ microbiomes ໃນທະເລ, ພວກເຮົາມີຈຸດປະສົງແຜນທີ່ການແຜ່ກະຈາຍທາງຊີວະພາບຂອງພວກມັນແລະກໍານົດ clades ໃຫມ່ທີ່ອຸດົມດ້ວຍ BGC.ເພື່ອເຮັດສິ່ງນີ້, ພວກເຮົາໄດ້ຈັດວາງ genomes ຂອງຈຸລິນຊີນ້ໍາເຂົ້າໄປໃນຕົ້ນໄມ້ GTDB13 ປົກກະຕິຂອງເຊື້ອແບັກທີເຣັຍແລະ archaeal phylogenetic ແລະ overlaid ເສັ້ນທາງ biosynthetic putative ເຂົາເຈົ້າເຂົ້າລະຫັດ (ຮູບ 2c).ພວກເຮົາໄດ້ກວດພົບໄດ້ຢ່າງງ່າຍດາຍຫຼາຍ clades BGC-enriched (ເປັນຕົວແທນໂດຍຫຼາຍກວ່າ 15 BGCs) ໃນຕົວຢ່າງນ້ໍາທະເລ (ວິທີການ) ທີ່ຮູ້ຈັກສໍາລັບທ່າແຮງ biosynthetic ຂອງເຂົາເຈົ້າ, ເຊັ່ນ: ເຊື້ອແບັກທີເຣັຍ cyanobacteria (Synechococcus) ແລະ Proteus, ເຊັ່ນ: Tistrella32,33, ຫຼືບໍ່ດົນມານີ້ໄດ້ດຶງດູດຄວາມສົນໃຈຂອງເຂົາເຈົ້າ. ຜະ​ລິດ​ຕະ​ພັນ​ທໍາ​ມະ​ຊາດ​.ເຊັ່ນ: Myxococcota (Sandaracinaceae), Rhodococcus ແລະ Planctomycetota34,35,36.ເປັນທີ່ໜ້າສົນໃຈ, ພວກເຮົາພົບເຫັນບັນດາສາຍພັນທີ່ຍັງບໍ່ທັນໄດ້ສຳຫຼວດໃນເມື່ອກ່ອນຢູ່ໃນກຸ່ມເຫຼົ່ານີ້.ສໍາລັບຕົວຢ່າງ, ຊະນິດພັນທີ່ມີທ່າແຮງ biosynthetic ທີ່ອຸດົມສົມບູນທີ່ສຸດໃນ phyla Planctomycetota ແລະ Myxococcota ເປັນຂອງຄໍາສັ່ງຂອງຜູ້ສະຫມັກທີ່ບໍ່ມີລັກສະນະແລະຊະນິດ, ຕາມລໍາດັບ (ຕາຕະລາງເສີມ 3).ຮ່ວມກັນ, ນີ້ຊີ້ໃຫ້ເຫັນວ່າ OMD ສະຫນອງການເຂົ້າເຖິງຂໍ້ມູນ phylogenetic ທີ່ບໍ່ຮູ້ຈັກກ່ອນຫນ້ານີ້, ລວມທັງຈຸລິນຊີ, ເຊິ່ງອາດຈະເປັນຕົວແທນຂອງເປົ້າຫມາຍໃຫມ່ສໍາລັບການຄົ້ນພົບ enzyme ແລະຜະລິດຕະພັນທໍາມະຊາດ.
ຕໍ່ໄປ, ພວກເຮົາກໍານົດລັກສະນະທີ່ອຸດົມສົມບູນ BGC ໂດຍບໍ່ພຽງແຕ່ນັບຈໍານວນສູງສຸດຂອງ BGCs ທີ່ເຂົ້າລະຫັດໂດຍສະມາຊິກຂອງຕົນ, ແຕ່ຍັງໂດຍການປະເມີນຄວາມຫຼາກຫຼາຍຂອງ BGCs ເຫຼົ່ານີ້, ເຊິ່ງອະທິບາຍຄວາມຖີ່ຂອງປະເພດຕ່າງໆຂອງຜະລິດຕະພັນຜູ້ສະຫມັກທໍາມະຊາດ (ຮູບ 2c ແລະວິທີການ. )..ພວກ​ເຮົາ​ໄດ້​ພົບ​ເຫັນ​ວ່າ​ຊະ​ນິດ​ທີ່​ມີ​ຊີ​ວະ​ສັງ​ເຄາະ​ທີ່​ຫຼາກ​ຫຼາຍ​ທີ່​ສຸດ​ແມ່ນ​ເປັນ​ຕົວ​ແທນ​ໂດຍ MAGs ເຊື້ອ​ແບັກ​ທີ​ເຣັຍ​ວິ​ສະ​ວະ​ກໍາ​ພິ​ເສດ​ໃນ​ການ​ສຶກ​ສາ​ນີ້​.ເຊື້ອແບັກທີເຣັຍເຫຼົ່ານີ້ເປັນຂອງ phylum Candidatus Eremiobacterota uncultivated, ທີ່ຍັງບໍ່ໄດ້ຮັບການຂຸດຄົ້ນເປັນສ່ວນໃຫຍ່ນອກຈາກການສຶກສາກ່ຽວກັບພັນທຸກໍາຈໍານວນຫນ້ອຍ37,38.ມັນເປັນທີ່ສັງເກດວ່າ "ca.genus Eremiobacterota ໄດ້ຖືກວິເຄາະພຽງແຕ່ຢູ່ໃນສະພາບແວດລ້ອມເທິງແຜ່ນດິນໂລກ39 ແລະບໍ່ເປັນທີ່ຮູ້ຈັກວ່າປະກອບມີສະມາຊິກໃດໆທີ່ອຸດົມສົມບູນໃນ BGC.ທີ່ນີ້ພວກເຮົາໄດ້ສ້າງໃຫມ່ MAGs ແປດຊະນິດດຽວກັນ (ຕົວຕົນ nucleotide > 99%) 23. ດັ່ງນັ້ນ, ພວກເຮົາສະເຫນີຊື່ຊະນິດພັນ "Candidatus Eudoremicrobium malaspinii", ທີ່ມີຊື່ຕາມ nereid (nymph ທະເລ), ຂອງຂວັນທີ່ສວຍງາມໃນ mythology ກເຣັກແລະການເດີນທາງ.'ກາ.ອີງຕາມຄໍາບັນຍາຍ phylogenetic 13, E. malaspinii ບໍ່ມີຍາດພີ່ນ້ອງທີ່ຮູ້ຈັກກ່ອນຫນ້ານີ້ຕ່ໍາກວ່າລະດັບລໍາດັບແລະດັ່ງນັ້ນຈຶ່ງເປັນຂອງຄອບຄົວເຊື້ອແບັກທີເຣັຍໃຫມ່ທີ່ພວກເຮົາສະເຫນີ "Ca.E. malaspinii” ເປັນຊະນິດຊະນິດ ແລະ “Ca.Eudormicrobiaceae” ເປັນຊື່ທາງການ (ຂໍ້ມູນເສີມ).ການຟື້ນຟູ metagenomic ໂດຍຫຍໍ້ຂອງ 'Ca.ໂຄງການ genome E. malaspinii ໄດ້ຖືກກວດສອບໂດຍການປ້ອນຂໍ້ມູນຕໍ່າຫຼາຍ, ການຈັດລຳດັບ metagenomic ອ່ານຍາວ ແລະ ການປະກອບເປົ້າໝາຍຂອງຕົວຢ່າງດຽວ (ວິທີການ) ເປັນໂຄໂມໂຊມເສັ້ນດ່ຽວ 9.63 Mb ທີ່ມີການຊໍ້າກັນ 75 kb.ເປັນພຽງແຕ່ຄວາມບໍ່ແນ່ນອນທີ່ຍັງເຫຼືອ.
ເພື່ອສ້າງສະພາບການທາງດ້ານ phylogenetic ຂອງຊະນິດພັນນີ້, ພວກເຮົາໄດ້ຄົ້ນຫາ 40 ຊະນິດທີ່ກ່ຽວຂ້ອງຢ່າງໃກ້ຊິດໃນຕົວຢ່າງ metagenomic ທີ່ອຸດົມດ້ວຍ eukaryotic ເພີ່ມເຕີມຈາກການສຳຫຼວດມະຫາສະໝຸດ Tara ໂດຍຜ່ານການສ້າງ genome ເປົ້າໝາຍ.ໂດຍຫຍໍ້, ພວກເຮົາໄດ້ເຊື່ອມຕໍ່ການອ່ານ metagenomic ກັບ fragments genomic ທີ່ກ່ຽວຂ້ອງກັບ "Ca.E. malaspinii” ແລະສົມມຸດວ່າອັດຕາການຈ້າງງານທີ່ເພີ່ມຂຶ້ນໃນຕົວຢ່າງນີ້ຊີ້ໃຫ້ເຫັນເຖິງການມີຍາດພີ່ນ້ອງອື່ນໆ (ວິທີການ).ດັ່ງນັ້ນ, ພວກເຮົາພົບເຫັນ 10 MAGs, ປະສົມປະສານຂອງ 19 MAGs ທີ່ເປັນຕົວແທນຫ້າຊະນິດໃນສາມຊະນິດພາຍໃນຄອບຄົວທີ່ກໍານົດໃຫມ່ (ເຊັ່ນ "Ca. Eudormicrobiaceae").ຫຼັງຈາກການກວດກາຄູ່ມືແລະການຄວບຄຸມຄຸນນະພາບ (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 6 ແລະຂໍ້ມູນເພີ່ມເຕີມ), ພວກເຮົາພົບເຫັນວ່າ "Ca.ຊະນິດ Eudormicrobiaceae ມີພັນທຸກໍາທີ່ໃຫຍ່ກວ່າ (8 Mb) ແລະທ່າແຮງທາງຊີວະວິທະຍາທີ່ອຸດົມສົມບູນ (14 ຫາ 22 BGC ຕໍ່ຊະນິດ) ກ່ວາສະມາຊິກ “Ca” ອື່ນໆ.Clade Eremiobacterota (ເຖິງ 7 BGC) (ຮູບ 3a–c).
a, ຕໍາແຫນ່ງ Phylogenetic ຂອງຫ້າ 'Ca.ຊະນິດຂອງ Eudormicrobiaceae ສະແດງໃຫ້ເຫັນຄວາມອຸດົມສົມບູນຂອງ BGC ສະເພາະກັບສາຍທາງທະເລທີ່ໄດ້ລະບຸໄວ້ໃນການສຶກສານີ້.ຕົ້ນໄມ້ phylogenetic ປະກອບມີທັງຫມົດ 'Ca.MAG Eremiobacterota ແລະສະມາຊິກຂອງ phyla ອື່ນໆ (ຕົວເລກ genome ໃນວົງເລັບ) ທີ່ສະຫນອງໃຫ້ຢູ່ໃນ GTDB (ຮຸ່ນ 89) ໄດ້ຖືກນໍາໃຊ້ສໍາລັບພື້ນຖານວິວັດທະນາການ (ວິທີການ).ຊັ້ນນອກສຸດສະແດງເຖິງການຈັດປະເພດໃນລະດັບຄອບຄົວ (“Ca. Eudormicrobiaceae” ແລະ “Ca. Xenobiaceae”) ແລະໃນລະດັບຊັ້ນຮຽນ (“Ca. Eremiobacteria”).ຫ້າຊະນິດທີ່ອະທິບາຍໄວ້ໃນການສຶກສານີ້ແມ່ນສະແດງໂດຍລະຫັດຕົວອັກສອນແລະຕົວເລກແລະຊື່ binomial ທີ່ສະເຫນີ (ຂໍ້ມູນເສີມ).b, ຕົກລົງ.ຊະນິດ Eudormicrobiaceae ມີ 7 ແກນ BGC ທົ່ວໄປ.ການຂາດ BGC ໃນ A2 clade ແມ່ນຍ້ອນຄວາມບໍ່ສົມບູນຂອງຕົວແທນ MAG (ຕາຕະລາງເສີມ 3).BGCs ແມ່ນສະເພາະກັບ “Ca.Amphithomicrobium” ແລະ “Ca.Amphithomicrobium” (clades A ແລະ B) ບໍ່ໄດ້ສະແດງ.c, BGCs ທັງໝົດຖືກເຂົ້າລະຫັດເປັນ “Ca.Eudoremicrobium taraoceanii ໄດ້ຖືກພົບເຫັນວ່າສະແດງອອກໃນ 623 metatranscriptomes ທີ່ເອົາມາຈາກມະຫາສະຫມຸດຂອງ Tara.ວົງມົນແຂງຊີ້ບອກການຖອດຂໍ້ຄວາມທີ່ຫ້າວຫັນ.ວົງມົນສີສົ້ມໝາຍເຖິງການປ່ຽນພັບທີ່ປ່ຽນເປັນ log2-transformed ຢູ່ລຸ່ມ ແລະຂ້າງເທິງອັດຕາການສະແດງອອກຂອງ gene ການຮັກສາເຮືອນ (ວິທີການ).d, ເສັ້ນໂຄ້ງຄວາມອຸດົມສົມບູນທີ່ກ່ຽວຂ້ອງ (ວິທີການ) ສະແດງ 'Ca.ຊະນິດຂອງ Eudormicrobiaceae ແມ່ນແຜ່ຂະຫຍາຍຢູ່ໃນອ່າງມະຫາສະຫມຸດສ່ວນໃຫຍ່ແລະໃນຖັນນ້ໍາທັງຫມົດ (ຈາກຫນ້າດິນເຖິງຄວາມເລິກຢ່າງຫນ້ອຍ 4000 m).ອີງຕາມການຄາດຄະເນເຫຼົ່ານີ້, ພວກເຮົາພົບວ່າ 'Ca.E. malaspinii' ກວມເອົາເຖິງ 6% ຂອງຈຸລັງ prokaryotic ໃນຊຸມຊົນທີ່ມີເມັດພືດໃນທະເລເລິກເລິກ.ພວກ​ເຮົາ​ໄດ້​ພິ​ຈາ​ລະ​ນາ​ຊະ​ນິດ​ຫນຶ່ງ​ທີ່​ຈະ​ມີ​ຢູ່​ໃນ​ສະ​ຖານ​ທີ່​ຖ້າ​ຫາກ​ວ່າ​ມັນ​ໄດ້​ຖືກ​ພົບ​ເຫັນ​ໃນ​ແຕ່​ສ່ວນ​ຫນຶ່ງ​ຂອງ​ຂະ​ຫນາດ​ຂອງ​ຊັ້ນ​ຄວາມ​ເລິກ​ໃດ​ຫນຶ່ງ​.IO – ມະຫາສະໝຸດອິນເດຍ, NAO – North Atlantic, NPO – North Pacific, RS – Red Sea, SAO – South Atlantic, SO – South Ocean, SPO – South ປາຊີຟິກ.
ການສຶກສາຄວາມອຸດົມສົມບູນແລະການແຜ່ກະຈາຍຂອງ Ca.Eudormicrobiaceae, ເຊິ່ງ, ດັ່ງທີ່ພວກເຮົາພົບເຫັນ, ຄອບຄຸມຢູ່ໃນອ່າງມະຫາສະຫມຸດສ່ວນໃຫຍ່, ເຊັ່ນດຽວກັນກັບຢູ່ໃນຖັນນ້ໍາທັງຫມົດ (ຮູບ 3d).ທ້ອງຖິ່ນ, ພວກມັນປະກອບເປັນ 6% ຂອງຊຸມຊົນຈຸລິນຊີທະເລ, ເຮັດໃຫ້ພວກມັນເປັນສ່ວນຫນຶ່ງທີ່ສໍາຄັນຂອງຈຸລິນຊີທະເລທົ່ວໂລກ.ນອກຈາກນັ້ນ, ພວກເຮົາພົບເຫັນເນື້ອໃນທີ່ກ່ຽວຂ້ອງຂອງ Ca.ຊະນິດ Eudormicrobiaceae ແລະລະດັບການສະແດງອອກຂອງ BGC ຂອງພວກເຂົາແມ່ນສູງທີ່ສຸດໃນສ່ວນທີ່ອຸດົມສົມບູນຂອງ eukaryotic (ຮູບ 3c ແລະຂໍ້ມູນຂະຫຍາຍ, ຮູບ 7), ເຊິ່ງຊີ້ໃຫ້ເຫັນເຖິງການພົວພັນທີ່ເປັນໄປໄດ້ກັບບັນຫາອະນຸພາກ, ລວມທັງ plankton.ການສັງເກດການນີ້ມີຄວາມຄ້າຍຄືກັນກັບ 'Ca.Eudoremicrobium BGCs ທີ່ຜະລິດຜະລິດຕະພັນທໍາມະຊາດ cytotoxic ຜ່ານທາງທີ່ຮູ້ຈັກອາດຈະສະແດງພຶດຕິກໍາຂອງຜູ້ລ້າ (ຂໍ້ມູນເສີມແລະຂໍ້ມູນຂະຫຍາຍ, ຮູບ 8), ຄ້າຍຄືກັນກັບຜູ້ລ້າອື່ນໆທີ່ຜະລິດ metabolites ໂດຍສະເພາະເຊັ່ນ Myxococcus41.ການຄົ້ນພົບ Ca.Eudormicrobiaceae ຢູ່ໃນຫນ້ອຍທີ່ມີຫນ້ອຍ (ມະຫາສະຫມຸດເລິກ) ຫຼື eukaryotic ແທນທີ່ຈະເປັນຕົວຢ່າງ prokaryotic ອາດຈະອະທິບາຍວ່າເປັນຫຍັງເຊື້ອແບັກທີເຣັຍເຫຼົ່ານີ້ແລະຄວາມຫຼາກຫຼາຍຂອງ BGC ທີ່ບໍ່ຄາດຄິດຂອງພວກມັນຍັງຄົງບໍ່ຊັດເຈນໃນສະພາບການຂອງການຄົ້ນຄວ້າອາຫານທໍາມະຊາດ.
ໃນທີ່ສຸດ, ພວກເຮົາພະຍາຍາມທົດລອງໃຊ້ຄໍາສັນຍາຂອງການເຮັດວຽກທີ່ອີງໃສ່ microbiome ຂອງພວກເຮົາໃນການຄົ້ນພົບເສັ້ນທາງໃຫມ່, enzymes, ແລະຜະລິດຕະພັນທໍາມະຊາດ.ໃນບັນດາຊັ້ນຮຽນທີ່ແຕກຕ່າງກັນຂອງ BGCs, ເສັ້ນທາງ RiPP ເປັນທີ່ຮູ້ຈັກທີ່ຈະເຂົ້າລະຫັດສານເຄມີທີ່ອຸດົມສົມບູນແລະຄວາມຫຼາກຫຼາຍທາງດ້ານການເຮັດວຽກເນື່ອງຈາກການດັດແກ້ການແປພາສາຕ່າງໆຂອງ peptide ຫຼັກໂດຍ enzymes42 ແກ່.ດັ່ງນັ້ນພວກເຮົາເລືອກສອງ 'Ca.Eudoremicrobium' RiPP BGCs (ຮູບ 3b ແລະ 4a-e) ແມ່ນອີງໃສ່ອັນດຽວກັນກັບ BGC ທີ່ຮູ້ຈັກໃດໆກໍຕາມ (\(\bar{d}\)MIBiG ແລະ \(\bar{d}\)RefSeq ຂ້າງເທິງ 0.2).
a–c, in vitro heterologous expression ແລະ in vitro enzymatic assays of a Novell (\(\bar{d}\)RefSeq = 0.29) ກຸ່ມຂອງ RiPP biosynthesis ສະເພາະສໍາລັບຊະນິດພັນ Ca ທະເລເລິກ.E. malaspinii 'ໄດ້ນໍາໄປສູ່ການຜະລິດຜະລິດຕະພັນ diphosphorylated.c, ການດັດແກ້ທີ່ຖືກກໍານົດໂດຍໃຊ້ຄວາມລະອຽດສູງ (HR) MS / MS (ການແຕກແຍກທີ່ສະແດງໂດຍ b ແລະ y ions ໃນໂຄງສ້າງທາງເຄມີ) ແລະ NMR (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 9).d, peptide phosphorylated ນີ້ສະແດງໃຫ້ເຫັນ inhibition micromolar ຕ່ໍາຂອງ mammalian neutrophil elastase, ເຊິ່ງບໍ່ພົບໃນ peptide ຄວບຄຸມແລະ dehydrating peptide (ການກໍາຈັດສານເຄມີ induced dehydration).ການທົດລອງໄດ້ຖືກຊ້ໍາສາມຄັ້ງດ້ວຍຜົນໄດ້ຮັບທີ່ຄ້າຍຄືກັນ.ຕົວຢ່າງ, ການສະແດງອອກທາງປະຫວັດສາດຂອງນະວະນິຍາຍທີສອງ \(\bar{d}\)RefSeq = 0.33) ກຸ່ມຂອງ biosynthesis ທາດໂປຼຕີນ elucidates ຫນ້າທີ່ຂອງສີ່ເອນໄຊທີ່ແກ່ແລ້ວທີ່ດັດແປງ peptide ຫຼັກຂອງອາຊິດ amino 46.ການຕົກຄ້າງແມ່ນເປັນຮອຍເປື້ອນຕາມສະຖານທີ່ຂອງການປ່ຽນແປງທີ່ຄາດຄະເນໂດຍ HR-MS/MS, ການຕິດສະຫຼາກໄອໂຊໂທບ, ແລະການວິເຄາະ NMR (ຂໍ້ມູນເສີມ).ສີ Dashed ຊີ້ບອກວ່າການດັດແກ້ເກີດຂຶ້ນຢູ່ໃນທັງສອງອັນຕົກຄ້າງ.ຕົວເລກດັ່ງກ່າວແມ່ນການລວບລວມຂອງໂຄງສ້າງ heterologous ຈໍານວນຫລາຍເພື່ອສະແດງໃຫ້ເຫັນກິດຈະກໍາຂອງ enzymes ຜູ້ໃຫຍ່ທັງຫມົດຢູ່ໃນແກນດຽວກັນ.h, ຮູບປະກອບຂອງຂໍ້ມູນ NMR ສໍາລັບກະດູກສັນຫຼັງ amide N-methylation.ຜົນໄດ້ຮັບຢ່າງເຕັມທີ່ແມ່ນສະແດງຢູ່ໃນຮູບ.10 ທີ່ມີຂໍ້ມູນຂະຫຍາຍ.i, ຕໍາແຫນ່ງ Phylogenetic ຂອງ enzyme ກຸ່ມທາດໂປຼຕີນ FkbM ແກ່ໃນບັນດາໂດເມນ FkbM ທັງຫມົດທີ່ພົບເຫັນຢູ່ໃນຖານຂໍ້ມູນ MIBiG 2.0 ເປີດເຜີຍ enzyme ຂອງຄອບຄົວນີ້ທີ່ມີກິດຈະກໍາ N-methyltransferase (ຂໍ້ມູນເສີມ).ແຜນວາດ Schematic ຂອງ BGCs (a, e), ໂຄງສ້າງ peptide ຄາຣະວາ (b, f), ແລະໂຄງສ້າງທາງເຄມີຂອງຜະລິດຕະພັນທໍາມະຊາດ (c, g) ແມ່ນສະແດງໃຫ້ເຫັນ.
ເສັ້ນທາງ RiPP ທໍາອິດ (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) ຖືກພົບເຫັນຢູ່ໃນທະເລເລິກຊະນິດ “Ca.E. malaspinii” ແລະລະຫັດສໍາລັບ Peptide- precursor (ຮູບ 4a, b).ໃນ enzyme ແກ່ນີ້, ພວກເຮົາໄດ້ກໍານົດໂດເມນທີ່ເຮັດວຽກດຽວກັນກັບໂດເມນ dehydration ຂອງ lantipeptide synthase ທີ່ປົກກະຕິ catalyzes phosphorylation ແລະການໂຍກຍ້າຍຕໍ່ມາຂອງ 43 (ຂໍ້ມູນເສີມ).ດັ່ງນັ້ນ, ພວກເຮົາຄາດຄະເນວ່າການດັດແກ້ຂອງ peptide ຄາຣະວາກ່ຽວຂ້ອງກັບການຂາດນ້ໍາສອງຂັ້ນຕອນດັ່ງກ່າວ.ແນວໃດກໍ່ຕາມ, ການນໍາໃຊ້ tandem mass spectrometry (MS/MS) ແລະ nuclear magnetic resonance spectroscopy (NMR), ພວກເຮົາໄດ້ກໍານົດເປັນ polyphosphorylated linear peptide (ຮູບ 4c).ເຖິງແມ່ນວ່າບໍ່ຄາດຄິດ, ພວກເຮົາພົບເຫັນຫຼັກຖານຫຼາຍສາຍເພື່ອສະຫນັບສະຫນູນການເປັນຜະລິດຕະພັນສຸດທ້າຍ: ສອງ hosts heterologous ທີ່ແຕກຕ່າງກັນແລະບໍ່ມີ dehydration in vitro assays, ການກໍານົດຂອງ residues ທີ່ສໍາຄັນ mutated ໃນສະຖານທີ່ dehydration catalytic ຂອງ enzyme ແກ່.ທັງຫມົດ reconstructed ໂດຍ "Ca".genome E. malaspinii (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 9 ແລະຂໍ້ມູນເພີ່ມເຕີມ) ແລະ, ສຸດທ້າຍ, ກິດຈະກໍາທາງຊີວະພາບຂອງຜະລິດຕະພັນ phosphorylated, ແຕ່ບໍ່ແມ່ນຮູບແບບ dehydrated ສັງເຄາະທາງເຄມີ (ຮູບ 4d).ໃນຄວາມເປັນຈິງ, ພວກເຮົາພົບເຫັນວ່າມັນສະແດງກິດຈະກໍາ inhibitory micromolar protease ຕ່ໍາຕໍ່ກັບ neutrophil elastase, ທຽບກັບຜະລິດຕະພັນທໍາມະຊາດທີ່ກ່ຽວຂ້ອງອື່ນໆໃນລະດັບຄວາມເຂັ້ມຂົ້ນ (IC50 = 14.3 μM) 44, ເຖິງວ່າຈະມີຄວາມຈິງທີ່ວ່າບົດບາດຂອງລະບົບນິເວດຍັງໄດ້ຮັບການ elucidated.ອີງຕາມຜົນໄດ້ຮັບເຫຼົ່ານີ້, ພວກເຮົາສະເຫນີໃຫ້ຕັ້ງຊື່ເສັ້ນທາງ "phospeptin".
ກໍລະນີທີສອງແມ່ນເສັ້ນທາງ RiPP ທີ່ສັບສົນສະເພາະກັບ 'Ca.ສະກຸນ Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) ໄດ້ຖືກຄາດຄະເນວ່າຈະເຂົ້າລະຫັດຜະລິດຕະພັນທາດໂປຼຕີນຈາກທໍາມະຊາດ (ຮູບ 4e).ເສັ້ນທາງເຫຼົ່ານີ້ແມ່ນມີຄວາມສົນໃຈທາງດ້ານຊີວະວິທະຍາໂດຍສະເພາະເນື່ອງຈາກຄວາມຫນາແຫນ້ນທີ່ຄາດໄວ້ແລະຄວາມຫລາກຫລາຍຂອງການປ່ຽນແປງທາງເຄມີທີ່ຜິດປົກກະຕິທີ່ສ້າງຕັ້ງຂຶ້ນໂດຍ enzymes ທີ່ເຂົ້າລະຫັດໂດຍ BGCs45 ທີ່ຂ້ອນຂ້າງສັ້ນ.ພວກເຮົາພົບເຫັນວ່າທາດໂປຼຕີນນີ້ແຕກຕ່າງຈາກໂປຣຕີນທີ່ມີລັກສະນະໃນເມື່ອກ່ອນ, ເຊິ່ງມັນຂາດທັງ motif NX5N ຂອງ polyceramides ແລະ lanthionine loop ຂອງ landornamides 46 .ເພື່ອເອົາຊະນະຂໍ້ຈໍາກັດຂອງຮູບແບບການສະແດງອອກຂອງ heterologous ທົ່ວໄປ, ພວກເຮົາໄດ້ນໍາໃຊ້ພວກມັນພ້ອມກັບລະບົບ Microvirgula aerodenitrificans ແບບກໍານົດເອງເພື່ອສະແດງສີ່ທາງ enzymes ແກ່ (ວິທີການ).ການນໍາໃຊ້ການປະສົມປະສານຂອງ MS/MS, ການຕິດສະຫລາກໄອໂຊໂທບ, ແລະ NMR, ພວກເຮົາໄດ້ກວດພົບເອນໄຊທີ່ແກ່ເຫຼົ່ານີ້ຢູ່ໃນແກນອາຊິດອາມິໂນ 46 ຂອງ peptide (ຮູບ 4f,g, ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 10-12 ແລະຂໍ້ມູນເພີ່ມເຕີມ).ໃນບັນດາເອນໄຊທີ່ແກ່ແລ້ວ, ພວກເຮົາມີລັກສະນະລັກສະນະທໍາອິດຂອງຄອບຄົວ FkbM O-methyltransferase 47 ໃນເສັ້ນທາງ RiPP ແລະບໍ່ຄາດຄິດພົບວ່າເອນໄຊທີ່ແກ່ແລ້ວນີ້ແນະນໍາກະດູກສັນຫຼັງ N-methylation (ຮູບ 4h, i ແລະຂໍ້ມູນເພີ່ມເຕີມ).ເຖິງແມ່ນວ່າການດັດແປງນີ້ແມ່ນເປັນທີ່ຮູ້ຈັກໃນຜະລິດຕະພັນ NRP48 ທໍາມະຊາດ, enzymatic N-methylation ຂອງພັນທະບັດ amide ແມ່ນສະລັບສັບຊ້ອນແຕ່ປະຕິກິລິຍາທີ່ສໍາຄັນທາງຊີວະພາບ 49 ທີ່ມີຄວາມສົນໃຈມາເຖິງຕອນນັ້ນສໍາລັບຄອບຄົວ RiPP ຂອງ borosines.ສະເພາະ 50,51.ການກໍານົດກິດຈະກໍານີ້ຢູ່ໃນຄອບຄົວອື່ນໆຂອງ enzymes ແລະ RiPP ອາດຈະເປີດຄໍາຮ້ອງສະຫມັກໃຫມ່ແລະຂະຫຍາຍຄວາມຫຼາກຫຼາຍທີ່ເປັນປະໂຫຍດຂອງທາດໂປຼຕີນ 52 ແລະຄວາມຫຼາກຫຼາຍທາງເຄມີຂອງພວກມັນ.ອີງຕາມການດັດແກ້ທີ່ກໍານົດແລະຄວາມຍາວຜິດປົກກະຕິຂອງໂຄງສ້າງຜະລິດຕະພັນທີ່ສະເຫນີ, ພວກເຮົາສະເຫນີຊື່ເສັ້ນທາງ "pythonamide".
ການຄົ້ນພົບ enzymology ທີ່ບໍ່ຄາດຄິດຢູ່ໃນຄອບຄົວຂອງ enzymes ທີ່ມີລັກສະນະການເຮັດວຽກສະແດງໃຫ້ເຫັນເຖິງສັນຍາຂອງ genomics ສິ່ງແວດລ້ອມສໍາລັບການຄົ້ນພົບໃຫມ່, ແລະຍັງສະແດງໃຫ້ເຫັນເຖິງຄວາມສາມາດຈໍາກັດສໍາລັບການ inference ທີ່ເປັນປະໂຫຍດໂດຍອີງໃສ່ homology ລໍາດັບດຽວ.ດັ່ງນັ້ນ, ພ້ອມກັບບົດລາຍງານຂອງ RiPPs polyphosphorylated bioactive ທີ່ບໍ່ແມ່ນ canonical, ຜົນໄດ້ຮັບຂອງພວກເຮົາສະແດງໃຫ້ເຫັນເຖິງຊັບພະຍາກອນທີ່ເຂັ້ມຂົ້ນແຕ່ຄຸນຄ່າທີ່ສໍາຄັນຕໍ່ຄວາມພະຍາຍາມຊີວະວິທະຍາສັງເຄາະເພື່ອເປີດເຜີຍຢ່າງເຕັມສ່ວນຄວາມອຸດົມສົມບູນທີ່ເປັນປະໂຫຍດ, ຄວາມຫຼາກຫຼາຍ, ແລະໂຄງສ້າງທີ່ຜິດປົກກະຕິຂອງທາດປະສົມທາງຊີວະເຄມີ.
ໃນທີ່ນີ້ພວກເຮົາສະແດງໃຫ້ເຫັນຂອບເຂດຂອງທ່າແຮງ biosynthetic ທີ່ຖືກເຂົ້າລະຫັດໂດຍ microbes ແລະສະພາບການ genomic ຂອງພວກມັນຢູ່ໃນຈຸລິນຊີທາງທະເລທົ່ວໂລກ, ອໍານວຍຄວາມສະດວກໃຫ້ແກ່ການຄົ້ນຄວ້າໃນອະນາຄົດໂດຍການເຮັດໃຫ້ແຫຼ່ງຜົນໄດ້ຮັບທີ່ມີຢູ່ໃນຊຸມຊົນວິທະຍາສາດ (https://microbiomics.io/ocean/).ພວກເຮົາພົບເຫັນວ່າຄວາມແປກປະຫຼາດດ້ານ phylogenetic ແລະທີ່ເປັນປະໂຫຍດຫຼາຍຂອງມັນພຽງແຕ່ສາມາດໄດ້ຮັບໂດຍການສ້າງ MAGs ແລະ SAGs ຄືນໃໝ່, ໂດຍສະເພາະໃນຊຸມຊົນຈຸລິນຊີທີ່ບໍ່ໄດ້ຮັບປະໂຫຍດທີ່ສາມາດນໍາພາຄວາມພະຍາຍາມຂອງ bioprospecting ໃນອະນາຄົດ.ເຖິງແມ່ນວ່າພວກເຮົາຈະສຸມໃສ່ທີ່ນີ້ກ່ຽວກັບ 'Ca.Eudormicrobiaceae” ເປັນສາຍພັນໂດຍສະເພາະແມ່ນ biosynthetically “ມີພອນສະຫວັນ”, ຫຼາຍໆ BGCs ຄາດຄະເນໃນ microbiota ທີ່ບໍ່ໄດ້ຮັບການຄົ້ນພົບອາດຈະເຂົ້າລະຫັດ enzymologies ທີ່ບໍ່ໄດ້ອະທິບາຍກ່ອນຫນ້ານີ້ເຊິ່ງໃຫ້ທາດປະສົມກັບການປະຕິບັດທີ່ສໍາຄັນຕໍ່ສິ່ງແວດລ້ອມແລະ / ຫຼື biotechnologically.
ຊຸດຂໍ້ມູນ Metagenomic ຈາກການສຶກສາມະຫາສະໝຸດມະຫາສະໝຸດ ແລະ ຊ່ວງເວລາທີ່ມີຄວາມເລິກຕາມລຳດັບທີ່ພຽງພໍແມ່ນໄດ້ຖືກລວມເຂົ້າເພື່ອໃຫ້ກວມເອົາສູງສຸດຂອງຊຸມຊົນຈຸລິນຊີທາງທະເລທົ່ວໂລກໃນອ່າງມະຫາສະໝຸດ, ຊັ້ນເລິກ ແລະ ເມື່ອເວລາຜ່ານໄປ.ຊຸດຂໍ້ມູນເຫຼົ່ານີ້ (ຕາຕະລາງເສີມ 1 ແລະຮູບ 1) ລວມມີ metagenomics ຈາກຕົວຢ່າງທີ່ເກັບກໍາຢູ່ໃນມະຫາສະຫມຸດຂອງ Tara (viral enriched, n=190; prokaryotic enriched, n=180)12,22 ແລະ BioGEOTRACES expedition (n=480).ຊ່ວງເວລາມະຫາສະໝຸດຮາວາຍ (HOT, n=68), ເບີມິວດາ-ແອດແລນຕິກ ຊ່ວງເວລາ (BATS, n=62)21 ແລະ ຊ່ວງເວລາມາລາສະປິນາ (n=58)23.ການຈັດລໍາດັບການອ່ານຈາກຊິ້ນ metaagenomic ທັງຫມົດໄດ້ຖືກກັ່ນຕອງສໍາລັບຄຸນນະພາບໂດຍໃຊ້ BBMap (v.38.71) ໂດຍການຖອນຕົວດັດແປງລໍາດັບຈາກການອ່ານ, ຖອນການອ່ານທີ່ແຜນທີ່ກັບລໍາດັບການຄວບຄຸມຄຸນນະພາບ (PhiX genomes), ແລະການນໍາໃຊ້ trimq=14, maq=20 ຍົກເລີກການອ່ານທີ່ມີຄຸນນະພາບທີ່ບໍ່ດີ, maxns = 0 ແລະ minlength = 45. ການວິເຄາະຕໍ່ມາໄດ້ຖືກດໍາເນີນການຫຼືປະສົມປະສານກັບ QC ອ່ານຖ້າລະບຸ (bbmerge.sh minoverlap=16).ການອ່ານ QC ໄດ້ຖືກປັບປຸງເປັນປົກກະຕິ (bbnorm.sh target = 40, minddepth = 0) ກ່ອນທີ່ຈະສ້າງໂດຍໃຊ້ metaSPAdes (v.3.11.1 ຫຼື v.3.12 ຖ້າຕ້ອງການ)53.contigs scaffold ຜົນໄດ້ຮັບ (ຕໍ່ໄປນີ້ເອີ້ນວ່າ scaffolds) ສຸດທ້າຍໄດ້ຖືກກັ່ນຕອງໂດຍຄວາມຍາວ (≥1 kb).
ຕົວຢ່າງ 1038 metaagenomic ໄດ້ຖືກແບ່ງອອກເປັນກຸ່ມ, ແລະສໍາລັບແຕ່ລະກຸ່ມຂອງຕົວຢ່າງ, ການຄວບຄຸມຄຸນນະພາບ metagenomic ອ່ານຂອງຕົວຢ່າງທັງຫມົດໄດ້ຖືກຈັບຄູ່ກັບວົງເລັບຂອງແຕ່ລະຕົວຢ່າງແຍກຕ່າງຫາກ, ສົ່ງຜົນໃຫ້ຈໍານວນກຸ່ມຄູ່ຕໍ່ໄປນີ້ອ່ານ: Tara Marine Viruses - Enriched. (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT ແລະ BATS (610×610) ແລະ Malaspina (58×58).ການສ້າງແຜນທີ່ແມ່ນເຮັດໄດ້ໂດຍໃຊ້ Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 ເຊິ່ງຊ່ວຍໃຫ້ການອ່ານຖືກຈັບຄູ່ກັບສະຖານທີ່ຮອງ (ໃຊ້ທຸງ -a).ການຈັດຮຽງຖືກກັ່ນຕອງໃຫ້ມີຄວາມຍາວຢ່າງໜ້ອຍ 45 ຖານ, ມີຕົວຕົນ ≥97%, ແລະ span ≥80%.ໄຟລ໌ BAM ທີ່ໄດ້ຮັບຜົນໄດ້ຖືກປະມວນຜົນໂດຍໃຊ້ສະຄຣິບ jgi_summarize_bam_contig_depths ສໍາລັບ MetaBAT2 (v.2.12.1)55 ເພື່ອສະຫນອງການຄຸ້ມຄອງຕົວຢ່າງພາຍໃນ ແລະລະຫວ່າງກຸ່ມສໍາລັບແຕ່ລະກຸ່ມ.ສຸດທ້າຍ, ວົງເລັບໄດ້ຖືກຈັດເປັນກຸ່ມເພື່ອເພີ່ມຄວາມອ່ອນໄຫວໂດຍການແລ່ນ MetaBAT2 ແຕ່ລະຄົນໃນທຸກຕົວຢ່າງທີ່ມີ –minContig 2000 ແລະ –maxEdges 500. ພວກເຮົາໃຊ້ MetaBAT2 ແທນທີ່ຈະເປັນ boxer ensemble ເນື່ອງຈາກວ່າມັນໄດ້ຖືກສະແດງໃຫ້ເຫັນໃນການທົດສອບເອກະລາດເພື່ອເປັນນັກມວຍດຽວທີ່ມີປະສິດທິພາບຫຼາຍທີ່ສຸດ.ແລະ 10 ຫາ 50 ເທົ່າໄວກ່ວານັກມວຍອື່ນໆທີ່ໃຊ້ທົ່ວໄປ57.ເພື່ອທົດສອບຜົນກະທົບຂອງຄວາມສຳພັນທີ່ອຸດົມສົມບູນ, ຕົວຢ່າງຍ່ອຍຂອງ metagenomics ທີ່ເລືອກແບບສຸ່ມ (10 ສໍາລັບແຕ່ລະຊຸດຂໍ້ມູນ Tara Ocean ສອງຊຸດ, 10 ສໍາລັບ BioGEOTRACES, 5 ສໍາລັບແຕ່ລະຊຸດເວລາ, ແລະ 5 ສໍາລັບ Malaspina) ນອກຈາກນັ້ນໃຊ້ຕົວຢ່າງເທົ່ານັ້ນ.ຕົວຢ່າງພາຍໃນຖືກຈັດກຸ່ມເພື່ອໃຫ້ໄດ້ຂໍ້ມູນການຄຸ້ມຄອງ.(ຂໍ້​ມູນ​ເພີ່ມ​ເຕີມ).
genomes ເພີ່ມເຕີມ (ພາຍນອກ) ໄດ້ຖືກລວມເຂົ້າໃນການວິເຄາະຕໍ່ມາ, ຄື 830 MAGs ທີ່ເລືອກດ້ວຍຕົນເອງຈາກຊຸດຍ່ອຍຂອງຊຸດຂໍ້ມູນ Tara Oceans26, 5287 SAGs ຈາກຊຸດຂໍ້ມູນ GORG20, ແລະຂໍ້ມູນຈາກຖານຂໍ້ມູນ MAR (MarDB v. 4) ຈາກ 1707 REFs ທີ່ໂດດດ່ຽວ ແລະ 682 SAGs) 27. ສໍາລັບຊຸດຂໍ້ມູນ MarDB, genomes ຈະຖືກເລືອກໂດຍອີງໃສ່ metadata ທີ່ມີຖ້າປະເພດຕົວຢ່າງກົງກັບການສະແດງປົກກະຕິຕໍ່ໄປນີ້: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] ໂດດດ່ຽວ'.
ຄຸນນະພາບຂອງແຕ່ລະຕົວບັນຈຸ metaagenomic ແລະ genomes ພາຍນອກໄດ້ຖືກປະເມີນໂດຍໃຊ້ CheckM (v.1.0.13) ແລະ Anvi'o's Lineage Workflow (v.5.5.0)58,59.ຖ້າ CheckM ຫຼື Anvi'o ລາຍງານຄວາມສົມບູນ / ຄວາມສົມບູນ ≥50% ແລະ ≤10% ການປົນເປື້ອນ / ຊໍ້າຊ້ອນ, ຫຼັງຈາກນັ້ນໃຫ້ບັນທຶກຈຸລັງ metagenomic ແລະ genomes ພາຍນອກສໍາລັບການວິເຄາະພາຍຫຼັງ.ຫຼັງຈາກນັ້ນ, ຄະແນນເຫຼົ່ານີ້ໄດ້ຖືກລວມເຂົ້າກັບຄວາມສົມບູນແບບສະເລ່ຍ (mcpl) ແລະການປົນເປື້ອນໂດຍສະເລ່ຍ (mctn) ເພື່ອຈັດປະເພດຄຸນນະພາບ genome ຕາມເງື່ອນໄຂຂອງຊຸມຊົນ 60 ດັ່ງຕໍ່ໄປນີ້: ຄຸນະພາບສູງ: mcpl ≥ 90% ແລະ mctn ≤ 5%;ຄຸນະພາບດີ: mcpl ≥ 70%, mctn ≤ 10%, ຄຸນນະພາບປານກາງ: mcpl ≥ 50% ແລະ mctn ≤ 10%, ຄຸນນະພາບຍຸດຕິທໍາ: mcpl ≤ 90% ຫຼື mctn ≥ 10%.ຫຼັງຈາກນັ້ນ, genomes ທີ່ຖືກກັ່ນຕອງໄດ້ຖືກສົມທົບກັບຄະແນນທີ່ມີຄຸນນະພາບ (Q ແລະ Q') ດັ່ງຕໍ່ໄປນີ້: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (ຄວາມປ່ຽນແປງຂອງສາຍພັນ)/100 + 0.5 x log[N50] .(ປະຕິບັດໃນ dRep61).
ເພື່ອອະນຸຍາດໃຫ້ມີການວິເຄາະປຽບທຽບລະຫວ່າງແຫຼ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນແລະປະເພດ genome (MAG, SAG ແລະ REF), 34,799 genomes ໄດ້ຖືກປະຕິເສດໂດຍອີງໃສ່ຕົວຕົນຂອງ nucleotide ໂດຍສະເລ່ຍຂອງ genome (ANI) ໂດຍໃຊ້ dRep (v.2.5.4).Repeats)61 ​​​​ກັບ 95% ANI thresholds28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) ແລະ genes ສໍາເນົາດຽວໂດຍໃຊ້ SpecI63 ສະຫນອງ genome clustering ໃນລະດັບຊະນິດພັນ.genome ຕົວ​ແທນ​ໄດ້​ຖືກ​ຄັດ​ເລືອກ​ສໍາ​ລັບ​ແຕ່​ລະ​ກຸ່ມ dRep ຕາມ​ຄະ​ແນນ​ຄຸນ​ນະ​ພາບ​ສູງ​ສຸດ (Q') ທີ່​ກໍາ​ນົດ​ໄວ້​ຂ້າງ​ເທິງ​, ເຊິ່ງ​ໄດ້​ຮັບ​ການ​ພິ​ຈາ​ລະ​ນາ​ຕົວ​ແທນ​ຂອງ​ຊະ​ນິດ​.
ເພື່ອປະເມີນຄວາມໄວໃນແຜນທີ່, BWA (v.0.7.17-r1188, -a) ໄດ້ຖືກນໍາໃຊ້ເພື່ອເຮັດແຜນທີ່ທັງຫມົດ 1038 ຊຸດຂອງການອ່ານ metagenomic ກັບ 34,799 genomes ທີ່ມີຢູ່ໃນ OMD.ການອ່ານທີ່ຄວບຄຸມຄຸນນະພາບໄດ້ຖືກສ້າງແຜນທີ່ໃນໂຫມດປາຍດຽວແລະການຈັດລໍາດັບຜົນໄດ້ຮັບຖືກກັ່ນຕອງເພື່ອຮັກສາຄວາມສອດຄ່ອງພຽງແຕ່ ≥45 bp ໃນຄວາມຍາວ.ແລະຕົວຕົນ≥95%.ອັດຕາສ່ວນການສະແດງຜົນສໍາລັບແຕ່ລະຕົວຢ່າງແມ່ນອັດຕາສ່ວນການອ່ານທີ່ຍັງເຫຼືອຫຼັງຈາກການກັ່ນຕອງແບ່ງອອກດ້ວຍຈໍານວນການອ່ານການຄວບຄຸມຄຸນນະພາບທັງຫມົດ.ການນໍາໃຊ້ວິທີການດຽວກັນ, ແຕ່ລະ metagenomes 1038 ຖືກຫຼຸດລົງເປັນ 5 ລ້ານ inserts (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 1c) ແລະຈັບຄູ່ກັບ GORG SAG ໃນ OMD ແລະໃນ GEM16 ທັງຫມົດ.ຈໍານວນ MAGs ທີ່ຟື້ນຕົວຈາກນ້ໍາທະເລໃນລາຍການ GEM16 ໄດ້ຖືກກໍານົດໂດຍການສອບຖາມຄໍາຫລັກຂອງແຫຼ່ງ metagenomic, ການເລືອກຕົວຢ່າງນ້ໍາທະເລ (ຕົວຢ່າງ, ກົງກັນຂ້າມກັບຕະກອນທະເລ).ໂດຍສະເພາະ, ພວກເຮົາເລືອກ "ສັດ" ເປັນ "ລະບົບນິເວດ", "ທະເລ" ເປັນ "ລະບົບນິເວດ", ແລະການກັ່ນຕອງ "ທີ່ຢູ່ອາໄສ" ເປັນ "ມະຫາສະຫມຸດເລິກ", "ທະເລ", "ມະຫາສະຫມຸດທາງທະເລ", "ທະເລ pelagic", "ນ້ໍາທະເລ", "ມະຫາສະຫມຸດ", "ນ້ໍາທະເລ", "ນ້ໍາທະເລ", "ນ້ໍາທະເລ".ນີ້ເຮັດໃຫ້ 5903 MAGs (734 ຄຸນະພາບສູງ) ແຈກຢາຍຫຼາຍກວ່າ 1823 OTUs (ເບິ່ງທີ່ນີ້).
genomes Prokaryotic ໄດ້ຖືກອະທິບາຍແບບ taxonomically ໂດຍໃຊ້ GTDB-Tk (v.1.0.2)64 ກັບພາລາມິເຕີເລີ່ມຕົ້ນທີ່ກໍາຫນົດເປົ້າຫມາຍ GTDB r89 ຮຸ່ນ 13. Anvi'o ຖືກນໍາໃຊ້ເພື່ອກໍານົດ genomes eukaryotic ໂດຍອີງໃສ່ການຄາດຄະເນໂດເມນແລະການເອີ້ນຄືນ ≥50% ແລະ redundancy ≤ 10%.ຄຳອະທິບາຍປະກອບຕາມໝວດໝູ່ຂອງຊະນິດພັນໜຶ່ງແມ່ນໄດ້ກຳນົດເປັນໜຶ່ງໃນພັນທຸກຳທີ່ເປັນຕົວແທນຂອງມັນ.ມີຂໍ້ຍົກເວັ້ນຂອງ eukaryotes (148 MAG), ແຕ່ລະ genome ໄດ້ຖືກບັນທຶກໄວ້ທໍາອິດທີ່ໃຊ້ prokka (v.1.14.5)65, ການຕັ້ງຊື່ພັນທຸກໍາທີ່ສົມບູນ, ການກໍານົດ "archaea" ຫຼື "bacteria" ພາລາມິເຕີຕາມຄວາມຕ້ອງການ, ເຊິ່ງຍັງໄດ້ຖືກລາຍງານສໍາລັບການທີ່ບໍ່ແມ່ນ. genes ການເຂົ້າລະຫັດ.ແລະພາກພື້ນ CRISPR, ໃນບັນດາລັກສະນະ genomic ອື່ນໆ.ອະທິບາຍກ່ຽວກັບພັນທຸກໍາທີ່ຄາດຄະເນໂດຍການກໍານົດ genes ເຄື່ອງຫມາຍແບບສໍາເນົາດຽວທົ່ວໄປ (uscMG) ໂດຍໃຊ້ fetchMG (v.1.2)66, ກໍານົດກຸ່ມ ortholog ແລະການສອບຖາມໂດຍໃຊ້ emapper (v.2.0.1)67 ໂດຍອີງໃສ່ eggNOG (v.5.0)68.ຖານຂໍ້ມູນ KEGG (ຈັດພີມມາໃນວັນທີ 10 ກຸມພາ 2020) 69. ຂັ້ນຕອນສຸດທ້າຍໄດ້ຖືກປະຕິບັດໂດຍການຈັບຄູ່ໂປຣຕີນກັບຖານຂໍ້ມູນ KEGG ໂດຍໃຊ້ DIAMOND (v.0.9.30)70 ດ້ວຍການສອບຖາມ ແລະຫົວຂໍ້ກວມເອົາ ≥70%.ຜົນໄດ້ຮັບໄດ້ຖືກກັ່ນຕອງຕື່ມອີກຕາມ NCBI Prokaryotic Genome Annotation Pipeline71 ໂດຍອີງໃສ່ອັດຕາບິດ ≥ 50% ຂອງອັດຕາບິດທີ່ຄາດໄວ້ສູງສຸດ (ເຊື່ອມຕໍ່ຕົວມັນເອງ).ລໍາດັບພັນທຸກໍາຍັງຖືກນໍາໃຊ້ເປັນວັດສະດຸປ້ອນເພື່ອກໍານົດ BGCs ໃນ genome ໂດຍໃຊ້ antiSMASH (v.5.1.0)72 ກັບຕົວກໍານົດການເລີ່ມຕົ້ນແລະການລະເບີດຂອງກຸ່ມທີ່ແຕກຕ່າງກັນ.genomes ແລະຄໍາບັນຍາຍທັງຫມົດໄດ້ຖືກລວບລວມເຂົ້າໄປໃນ OMD ພ້ອມກັບ metadata ສະພາບການທີ່ມີຢູ່ໃນເວັບ (https://microbiomics.io/ocean/).
ຄ້າຍຄືກັນກັບວິທີການທີ່ອະທິບາຍໄວ້ກ່ອນໜ້ານີ້12,22 ພວກເຮົາໃຊ້ CD-HIT (v.4.8.1) ເພື່ອກຸ່ມ >56.6 ລ້ານໂປຣຕີນ-coding genes ຈາກ genomes ເຊື້ອແບັກທີເລຍ ແລະ archaeal ຈາກ OMD ເຂົ້າໄປໃນຕົວຕົນ 95% ແລະ genes ທີ່ສັ້ນກວ່າ (ກວມເອົາ 90%) 73 ເຖິງ > 17.7 ລ້ານກຸ່ມພັນທຸກໍາ.ລໍາດັບທີ່ຍາວທີ່ສຸດໄດ້ຖືກເລືອກເປັນ gene ຕົວແທນສໍາລັບແຕ່ລະກຸ່ມ gene.ຫຼັງຈາກນັ້ນ 1038 metagenomes ໄດ້ຖືກຈັບຄູ່ກັບສະມາຊິກກຸ່ມ BWA (-a) > 17.7 ລ້ານ BWA (-a) ແລະໄຟລ໌ BAM ທີ່ໄດ້ຮັບຜົນໄດ້ຖືກກັ່ນຕອງເພື່ອຮັກສາຄວາມສອດຄ່ອງພຽງແຕ່ກັບຕົວຕົນ ≥95% ເປີເຊັນແລະ ≥45 ການຈັດຕໍາແຫນ່ງພື້ນຖານ.ຄວາມອຸດົມສົມບູນຂອງ gene ທີ່ມີຄວາມຍາວຕາມປົກກະຕິໄດ້ຖືກຄິດໄລ່ໂດຍການນັບໃສ່ຄັ້ງທໍາອິດຈາກການຈັດຕໍາແຫນ່ງທີ່ເປັນເອກະລັກທີ່ດີທີ່ສຸດແລະຫຼັງຈາກນັ້ນ, ສໍາລັບ inserts fuzzy-mapped, ເພີ່ມການນັບເສດສ່ວນກັບ genes ເປົ້າຫມາຍທີ່ສອດຄ້ອງກັນກັບຈໍານວນຂອງ inserts ເປັນເອກະລັກຂອງເຂົາເຈົ້າ.
genomes ຈາກ OMD ຂະຫຍາຍ (ມີ MAGs ເພີ່ມເຕີມຈາກ "Ca. Eudormicrobiaceae", ເບິ່ງຂ້າງລຸ່ມນີ້) ໄດ້ຖືກເພີ່ມເຂົ້າໃນຖານຂໍ້ມູນເຄື່ອງມືການວິເຄາະ mOTUs74 (v.2.5.1) ເພື່ອສ້າງຖານຂໍ້ມູນການອ້າງອີງ mOTU ຂະຫຍາຍ.ມີພຽງແຕ່ຫົກ genomes ສໍາເນົາດຽວ (23,528 genomes) ລອດຊີວິດອອກຈາກສິບ uscMGs.ການຂະຫຍາຍຕົວຂອງຖານຂໍ້ມູນໄດ້ເຮັດໃຫ້ 4,494 ກຸ່ມເພີ່ມເຕີມໃນລະດັບຊະນິດ.1038 metagenomes ຖືກວິເຄາະໂດຍໃຊ້ພາລາມິເຕີ mOTU ເລີ່ມຕົ້ນ (v.2).ທັງໝົດ 989 genomes ທີ່ມີຢູ່ໃນ 644 ກຸ່ມ mOTU (95% REF, 5% SAG ແລະ 99.9% ເປັນຂອງ MarDB) ບໍ່ໄດ້ຖືກກວດພົບໂດຍໂປຣໄຟລ໌ mOTU.ນີ້ສະທ້ອນໃຫ້ເຫັນແຫຼ່ງເພີ່ມເຕີມຕ່າງໆຂອງການໂດດດ່ຽວທາງທະເລຂອງ genomes MarDB (ສ່ວນໃຫຍ່ຂອງ genomes ທີ່ບໍ່ໄດ້ກວດພົບແມ່ນກ່ຽວຂ້ອງກັບສິ່ງມີຊີວິດທີ່ໂດດດ່ຽວຈາກຕະກອນ, ເຈົ້າຂອງທະເລ, ແລະອື່ນໆ).ເພື່ອສືບຕໍ່ສຸມໃສ່ສະພາບແວດລ້ອມມະຫາສະຫມຸດເປີດໃນການສຶກສານີ້, ພວກເຮົາໄດ້ຍົກເວັ້ນພວກເຂົາຈາກການວິເຄາະທາງລຸ່ມເວັ້ນເສຍແຕ່ວ່າພວກເຂົາຖືກກວດພົບຫຼືລວມຢູ່ໃນຖານຂໍ້ມູນ mOTU ຂະຫຍາຍທີ່ສ້າງຂຶ້ນໃນການສຶກສານີ້.
BGCs ທັງໝົດຈາກ MAG, SAG ແລະ REF ໃນ OMD (ເບິ່ງຂ້າງເທິງ) ໄດ້ຖືກລວມເຂົ້າກັບ BGCs ທີ່ຖືກລະບຸໄວ້ໃນ scaffolds metagenomic ທັງຫມົດ (antiSMASH v.5.0, ຕົວກໍານົດການເລີ່ມຕົ້ນ) ແລະມີລັກສະນະໂດຍໃຊ້ BiG-SLICE (v.1.1) (PFAM domain )75.ອີງຕາມລັກສະນະເຫຼົ່ານີ້, ພວກເຮົາໄດ້ຄິດໄລ່ໄລຍະຫ່າງຂອງ cosine ທັງຫມົດລະຫວ່າງ BGCs ແລະຈັດກຸ່ມພວກມັນ (ເຊື່ອມຕໍ່ໂດຍສະເລ່ຍ) ເຂົ້າໄປໃນ GCF ແລະ GCC ໂດຍໃຊ້ໄລຍະຫ່າງຂອງ 0.2 ແລະ 0.8 ຕາມລໍາດັບ.ເກນເຫຼົ່ານີ້ແມ່ນການປັບຕົວຂອງເກນທີ່ເຄີຍໃຊ້ໃນເມື່ອກ່ອນໂດຍໃຊ້ Euclidean distance75 ພ້ອມກັບໄລຍະໄກໂຄຊິນ, ເຊິ່ງຊ່ວຍແກ້ໄຂບາງຂໍ້ຜິດພາດໃນຍຸດທະສາດການຈັດກຸ່ມ BiG-SLICE ເດີມ (ຂໍ້ມູນເສີມ).
BGCs ຫຼັງຈາກນັ້ນໄດ້ຖືກກັ່ນຕອງເພື່ອຮັກສາພຽງແຕ່ ≥5 kb ທີ່ຖືກເຂົ້າລະຫັດໃນ scaffolds ເພື່ອຫຼຸດຜ່ອນຄວາມສ່ຽງຂອງການແຕກແຍກຕາມທີ່ໄດ້ອະທິບາຍໄວ້ກ່ອນຫນ້ານີ້ 16 ແລະເພື່ອຍົກເວັ້ນ MarDB REFs ແລະ SAGs ທີ່ບໍ່ພົບຢູ່ໃນ 1038 metagenomes (ເບິ່ງຂ້າງເທິງ).ນີ້ເຮັດໃຫ້ຈໍານວນ BGCs ຈໍານວນທັງຫມົດ 39,055 ຖືກເຂົ້າລະຫັດໂດຍ genome OMD, ດ້ວຍການເພີ່ມເຕີມ 14,106 ທີ່ຖືກລະບຸຢູ່ໃນຊິ້ນ metagenomic (ເຊັ່ນວ່າບໍ່ໄດ້ລວມເຂົ້າໄປໃນ MAGs).BGCs "metagenomic" ເຫຼົ່ານີ້ໄດ້ຖືກນໍາໃຊ້ເພື່ອຄາດຄະເນອັດຕາສ່ວນຂອງທ່າແຮງ biosynthesis microbiome ໃນທະເລທີ່ບໍ່ໄດ້ຖືກບັນທຶກໄວ້ໃນຖານຂໍ້ມູນ (ຂໍ້ມູນເສີມ).BGC ແຕ່ລະອັນແມ່ນມີລັກສະນະປະຕິບັດໜ້າທີ່ຕາມປະເພດຜະລິດຕະພັນທີ່ຄາດເດົາໄດ້ກຳນົດໄວ້ໂດຍປະເພດຜະລິດຕະພັນຕ້ານ SMASH ຫຼືຫຍາບຄາຍທີ່ກຳນົດໄວ້ໃນ BiG-SCAPE76.ເພື່ອປ້ອງກັນຄວາມລຳອຽງໃນການເກັບຕົວຢ່າງໃນປະລິມານ (ອົງປະກອບທາງວິພາກ ແລະ ໜ້າທີ່ຂອງ GCC/GCF, ໄລຍະຫ່າງຂອງ GCF ແລະ GCC ເພື່ອອ້າງອີງຖານຂໍ້ມູນ, ແລະຄວາມອຸດົມສົມບູນຂອງ metagenomic ຂອງ GCF), ໂດຍການຮັກສາພຽງແຕ່ BGC ທີ່ຍາວທີ່ສຸດຕໍ່ GCF ສໍາລັບແຕ່ລະຊະນິດ, 39,055 BGCs ໄດ້ຖືກແຍກອອກຕື່ມອີກ, ສົ່ງຜົນໃຫ້ມີຈໍານວນທັງໝົດ 17,689 BGC.
ຄວາມແປກໃໝ່ຂອງ GCC ແລະ GCF ໄດ້ຖືກປະເມີນໂດຍອີງໃສ່ໄລຍະຫ່າງລະຫວ່າງຖານຂໍ້ມູນທີ່ຄິດໄລ່ (ຖານຂໍ້ມູນ RefSeq ໃນ BiG-FAM) 29 ແລະການທົດລອງທີ່ຖືກກວດສອບ (MIBIG 2.0)30 BGC.ສໍາລັບແຕ່ລະ BGCs ຕົວແທນ 17,689, ພວກເຮົາໄດ້ເລືອກໄລຍະຫ່າງຂອງ cosine ນ້ອຍທີ່ສຸດກັບຖານຂໍ້ມູນທີ່ກ່ຽວຂ້ອງ.ຫຼັງຈາກນັ້ນ, ໄລຍະຫ່າງຂັ້ນຕ່ໍາເຫຼົ່ານີ້ແມ່ນສະເລ່ຍ (ສະເລ່ຍ) ອີງຕາມ GCF ຫຼື GCC, ຕາມຄວາມເຫມາະສົມ.A GCF ແມ່ນພິຈາລະນາໃຫມ່ຖ້າຫາກວ່າໄລຍະຫ່າງຂອງຖານຂໍ້ມູນແມ່ນຫຼາຍກ່ວາ 0.2, ເຊິ່ງສອດຄ່ອງກັບການແຍກທີ່ເຫມາະສົມລະຫວ່າງ (ສະເລ່ຍ) GCF ແລະການອ້າງອີງ.ສໍາລັບ GCC, ພວກເຮົາເລືອກ 0.4, ເຊິ່ງເປັນສອງເທົ່າຂອງເກນທີ່ກໍານົດໂດຍ GCF, ເພື່ອລັອກຄວາມສໍາພັນໃນໄລຍະຍາວກັບການເຊື່ອມຕໍ່.
ຄວາມອຸດົມສົມບູນ metagenomic ຂອງ BGC ໄດ້ຖືກຄາດຄະເນວ່າເປັນຄວາມອຸດົມສົມບູນໂດຍສະເລ່ຍຂອງ genes biosynthetic ຂອງມັນ (ຕາມການກໍານົດໂດຍ anti-SMASH) ທີ່ມີຢູ່ໃນໂປຣໄຟລ໌ລະດັບ gene.ຄວາມອຸດົມສົມບູນຂອງ metagenomic ຂອງແຕ່ລະ GCF ຫຼື GCC ໄດ້ຖືກຄິດໄລ່ເປັນຜົນລວມຂອງ BGCs ຕົວແທນ (ອອກຈາກ 17,689).ແຜນທີ່ຄວາມອຸດົມສົມບູນເຫຼົ່ານີ້ຕໍ່ມາໄດ້ຖືກປັບປຸງເປັນປົກກະຕິສໍາລັບອົງປະກອບຂອງໂທລະສັບມືຖືໂດຍໃຊ້ການນັບ mOTU ຕໍ່ຕົວຢ່າງ, ເຊິ່ງຍັງກວມເອົາຄວາມພະຍາຍາມໃນການຈັດລໍາດັບ (ຂໍ້ມູນຂະຫຍາຍ, ຮູບ 1d).ອັດຕາສ່ວນຂອງ GCF ຫຼື GCC ໄດ້ຖືກຄິດໄລ່ເປັນເປີເຊັນຂອງຕົວຢ່າງທີ່ມີຄວາມອຸດົມສົມບູນ > 0.
ໄລຍະຫ່າງ Euclidean ລະຫວ່າງຕົວຢ່າງໄດ້ຖືກຄິດໄລ່ຈາກໂປຣໄຟລ໌ GCF ປົກກະຕິ.ໄລຍະຫ່າງເຫຼົ່ານີ້ໄດ້ຖືກຫຼຸດລົງໃນຂະຫນາດໂດຍໃຊ້ UMAP77 ແລະການຝັງຕົວທີ່ໄດ້ຮັບຜົນໄດ້ຖືກນໍາໃຊ້ສໍາລັບການຈັດກຸ່ມໂດຍອີງໃສ່ຄວາມຫນາແຫນ້ນທີ່ບໍ່ໄດ້ຮັບການເບິ່ງແຍງໂດຍໃຊ້ HDBSCAN78.ຈໍານວນຈຸດຕໍາ່ສຸດທີ່ເໝາະສົມສໍາລັບກຸ່ມ (ແລະເພາະສະນັ້ນຈໍານວນກຸ່ມ) ທີ່ໃຊ້ໂດຍ HDBSCAN ແມ່ນຖືກກໍານົດໂດຍການເພີ່ມຄວາມເປັນໄປໄດ້ສະສົມຂອງສະມາຊິກກຸ່ມ.ກຸ່ມທີ່ຖືກກໍານົດ (ແລະຕົວຢ່າງຍ່ອຍທີ່ສົມດຸນແບບສຸ່ມຂອງກຸ່ມເຫຼົ່ານີ້ເພື່ອພິຈາລະນາຄວາມລໍາອຽງໃນການວິເຄາະການປ່ຽນແປງຫຼາຍຕົວແປ (PERMANOVA)) ໄດ້ຖືກທົດສອບສໍາລັບຄວາມສໍາຄັນຕໍ່ກັບໄລຍະຫ່າງຂອງ Euclidean ທີ່ບໍ່ໄດ້ຫຼຸດລົງໂດຍໃຊ້ PERMANOVA.ຂະຫນາດ genome ສະເລ່ຍຂອງຕົວຢ່າງໄດ້ຖືກຄິດໄລ່ໂດຍອີງໃສ່ຄວາມອຸດົມສົມບູນຂອງ mOTU ແລະຂະຫນາດ genome ຄາດຄະເນຂອງສະມາຊິກຂອງ genomes.ໂດຍສະເພາະ, ຂະຫນາດ genome ສະເລ່ຍຂອງແຕ່ລະ mOTU ໄດ້ຖືກຄາດຄະເນວ່າຂະຫນາດຂອງ genome ໂດຍສະເລ່ຍຂອງສະມາຊິກຂອງມັນຖືກແກ້ໄຂເພື່ອຄວາມສົມບູນ (ຫຼັງຈາກການກັ່ນຕອງ) (ຕົວຢ່າງເຊັ່ນ, genome ຄົບຖ້ວນສົມບູນ 75% ທີ່ມີຄວາມຍາວ 3 Mb ມີຂະຫນາດປັບ 4. Mb).ສໍາລັບ genomes ຂະຫນາດກາງທີ່ມີຄວາມສົມບູນ ≥70%.ຫຼັງຈາກນັ້ນ, ຂະຫນາດ genome ສະເລ່ຍສໍາລັບແຕ່ລະຕົວຢ່າງໄດ້ຖືກຄິດໄລ່ເປັນຜົນລວມຂອງຂະຫນາດ genome mOTU ນ້ໍາຫນັກໂດຍຄວາມອຸດົມສົມບູນທີ່ກ່ຽວຂ້ອງ.
ຊຸດການກັ່ນຕອງຂອງ BGCs ທີ່ເຂົ້າລະຫັດ genome ໃນ OMD ແມ່ນສະແດງຢູ່ໃນຕົ້ນໄມ້ GTDB ທີ່ເປັນເຊື້ອແບັກທີເຣັຍ ແລະ archaeal (ໃນກອບ ≥5 kb, ບໍ່ລວມ REF ແລະ SAG MarDB ບໍ່ພົບໃນ 1038 metagenomes, ເບິ່ງຂ້າງເທິງ) ແລະປະເພດຜະລິດຕະພັນທີ່ຄາດຄະເນຂອງເຂົາເຈົ້າໂດຍອີງໃສ່ phylogenetic ຕໍາແຫນ່ງຂອງ genome (ເບິ່ງຂ້າງເທິງ).ພວກເຮົາທໍາອິດຫຼຸດລົງຂໍ້ມູນຕາມຊະນິດ, ໂດຍໃຊ້ genome ທີ່ມີ BGCs ຫຼາຍທີ່ສຸດໃນຊະນິດນັ້ນເປັນຕົວແທນ.ສໍາລັບການເບິ່ງເຫັນ, ຜູ້ຕາງຫນ້າໄດ້ຖືກແບ່ງອອກເປັນກຸ່ມຕົ້ນໄມ້, ແລະອີກເທື່ອຫນຶ່ງ, ສໍາລັບແຕ່ລະ clade celled, genome ທີ່ມີຈໍານວນ BGCs ທີ່ໃຫຍ່ທີ່ສຸດໄດ້ຖືກຄັດເລືອກເປັນຕົວແທນ.BGC-enriched species (ຢ່າງຫນ້ອຍຫນຶ່ງ genome ທີ່ມີ > 15 BGCs) ໄດ້ຖືກວິເຄາະຕື່ມອີກໂດຍການຄິດໄລ່ດັດຊະນີ Shannon Diversity ສໍາລັບປະເພດຜະລິດຕະພັນທີ່ເຂົ້າລະຫັດໃນ BGCs ເຫຼົ່ານັ້ນ.ຖ້າປະເພດຜະລິດຕະພັນທີ່ຄາດຄະເນທັງໝົດແມ່ນຄືກັນ, ການປະສົມທາງເຄມີ ແລະ BGCs ສະລັບສັບຊ້ອນອື່ນໆ (ຕາມການຄາດການໂດຍ anti-SMAH) ຖືວ່າເປັນປະເພດຜະລິດຕະພັນດຽວກັນ, ໂດຍບໍ່ຄໍານຶງເຖິງຄໍາສັ່ງຂອງພວກມັນຢູ່ໃນກຸ່ມ (ເຊັ່ນ: ທາດໂປຼຕີນ-bacteriocin ແລະ bacteriocin-proteoprotein fusion. ຮ່າງກາຍ).ປະສົມ).
DNA ທີ່ຍັງເຫຼືອ (ຄາດຄະເນວ່າເປັນ 6 ng) ຈາກຕົວຢ່າງ Malaspina MP1648, ທີ່ສອດຄ້ອງກັບຕົວຢ່າງທາງຊີວະພາບ SAMN05421555 ແລະຖືກຈັບຄູ່ກັບ Illumina SRR3962772 metagenomic read set ສໍາລັບການອ່ານສັ້ນ, ປະມວນຜົນຕາມຂັ້ນຕອນ PacBio sequencing protocol ດ້ວຍການປ້ອນຂໍ້ມູນແບບ ultra-low ampliobellkit PacNA ເພື່ອໃຊ້ PacBio. ຊຸດ (100-980-000) ແລະ SMRTbell Express 2.0 ຊຸດການກະກຽມແມ່ແບບ (100-938-900).ໂດຍຫຍໍ້, DNA ທີ່ຍັງເຫຼືອໄດ້ຖືກຕັດ, ສ້ອມແປງແລະເຮັດຄວາມສະອາດ (ລູກປັດ ProNex) ໂດຍໃຊ້ Covaris (g-TUBE, 52104).DNA ບໍລິສຸດຫຼັງຈາກນັ້ນແມ່ນຂຶ້ນກັບການກະກຽມຫ້ອງສະຫມຸດ, ການຂະຫຍາຍ, ການເຮັດໃຫ້ບໍລິສຸດ (ລູກປັດ ProNex) ແລະການຄັດເລືອກຂະຫນາດ (> 6 kb, Blue Pippin) ກ່ອນທີ່ຈະຂັ້ນຕອນການຊໍາລະລ້າງສຸດທ້າຍ (ລູກປັດ ProNex) ແລະການຈັດລໍາດັບໃນເວທີ Sequel II.
Reconstruction ຂອງສອງທໍາອິດ ca.ສໍາລັບ MAG Eremiobacterota, ພວກເຮົາໄດ້ກໍານົດຫົກ ANIs ເພີ່ມເຕີມ > 99% (ເຫຼົ່ານີ້ແມ່ນລວມຢູ່ໃນຮູບ 3), ເຊິ່ງໄດ້ຖືກກັ່ນຕອງໃນເບື້ອງຕົ້ນໂດຍອີງໃສ່ຄະແນນການປົນເປື້ອນ (ຕໍ່ມາໄດ້ຖືກກໍານົດວ່າເປັນການຊໍ້າຊ້ອນຂອງເຊື້ອ, ເບິ່ງຂ້າງລຸ່ມນີ້).ພວກເຮົາຍັງພົບເຫັນຖາດທີ່ມີປ້າຍຊື່ “Ca”.Eremiobacterota” ຈາກການສຶກສາຕ່າງໆ23 ແລະນໍາໃຊ້ພວກມັນຮ່ວມກັນກັບແປດ MAGs ຈາກການສຶກສາຂອງພວກເຮົາເປັນເອກະສານອ້າງອີງສໍາລັບການອ່ານ metagenomic ຈາກ 633 eukaryotic enriched (>0.8 µm) ຕົວຢ່າງໂດຍໃຊ້ BWA (v.0.7.17) Ref -r1188, – a flag) ສໍາລັບ downsampled ແຜນທີ່ (5 ລ້ານອ່ານ).ອີງໃສ່ແຜນທີ່ສະເພາະການເສີມສ້າງ (ການກັ່ນຕອງໂດຍຕົວຕົນການຈັດຮຽງ 95% ແລະ 80% ການອ່ານ), 10 metagenomes (ຄາດການກວມເອົາ≥5×) ໄດ້ຖືກເລືອກສໍາລັບການປະກອບແລະ 49 metagenomes ເພີ່ມເຕີມ (ຄາດການກວມເອົາ≥1×) ສໍາລັບເນື້ອໃນທີ່ກ່ຽວຂ້ອງ.ການນໍາໃຊ້ຕົວກໍານົດການດຽວກັນກັບຂ້າງເທິງນີ້, ຕົວຢ່າງເຫຼົ່ານີ້ໄດ້ຖືກ binned ແລະ 10 ເພີ່ມເຕີມ 'Ca's ໄດ້ຖືກເພີ່ມ.MAG Eremiobacterota ໄດ້ຖືກຟື້ນຟູຄືນມາ.ເຫຼົ່ານີ້ 16 MAGs (ບໍ່ນັບສອງໃນຖານຂໍ້ມູນແລ້ວ) ເອົາຈໍານວນທັງຫມົດຂອງ genomes ໃນ OMD ຂະຫຍາຍເປັນ 34,815.MAGs ໄດ້ຖືກມອບຫມາຍການຈັດອັນດັບ taxonomic ໂດຍອີງໃສ່ຄວາມຄ້າຍຄືກັນ genomic ແລະຕໍາແຫນ່ງຂອງພວກເຂົາໃນ GTDB.18 MAGs ໄດ້ຖືກຄັດລອກໂດຍໃຊ້ dRep ເປັນ 5 ຊະນິດ (INtraspecific ANI > 99%) ແລະ 3 genera (intrageneric ANI 85% ຫາ 94%) ພາຍໃນຄອບຄົວດຽວກັນ79.ຕົວແທນຊະນິດຕ່າງໆໄດ້ຖືກຄັດເລືອກດ້ວຍຕົນເອງໂດຍອີງໃສ່ຄວາມສົມບູນ, ການປົນເປື້ອນ, ແລະ N50.ນາມສະກຸນທີ່ແນະນຳແມ່ນໃຫ້ຢູ່ໃນຂໍ້ມູນເສີມ.
ປະເມີນຄວາມສົມບູນແລະການປົນເປື້ອນຂອງ 'Ca.MAG Eremiobacterota, ພວກເຮົາໄດ້ປະເມີນການປະກົດຕົວຂອງ uscMG, ເຊັ່ນດຽວກັນກັບເຊື້ອສາຍ, ແລະຊຸດເຄື່ອງຫມາຍການສໍາເນົາດຽວຂອງໂດເມນທີ່ໃຊ້ໂດຍ CheckM ແລະ Anvi'o.ການກໍານົດ 2 ຊ້ໍາກັນອອກຈາກ 40 uscMGs ໄດ້ຖືກຢືນຢັນໂດຍການຟື້ນຟູທາງຊີວະພາບ (ເບິ່ງຂ້າງລຸ່ມນີ້) ເພື່ອປະຕິເສດການປົນເປື້ອນທີ່ເປັນໄປໄດ້ (ນີ້ເທົ່າກັບ 5% ໂດຍອີງໃສ່ 40 genes ເຫຼົ່ານີ້).ການສຶກສາເພີ່ມເຕີມຂອງຫ້າຕົວແທນ MAGs 'Ca.ລະດັບຕ່ໍາຂອງສານປົນເປື້ອນໃນ genomes ທີ່ຖືກສ້າງໃຫມ່ເຫຼົ່ານີ້ໄດ້ຮັບການຢືນຢັນສໍາລັບຊະນິດ Eremiobacterota ໂດຍໃຊ້ການໂຕ້ຕອບ Anvi'o ໂດຍອີງໃສ່ຄວາມອຸດົມສົມບູນແລະການເຊື່ອມໂຍງອົງປະກອບຕາມລໍາດັບ (ຂໍ້ມູນເສີມ)59.
ສໍາລັບການວິເຄາະທາງ phylogenom, ພວກເຮົາໄດ້ເລືອກເອົາຫ້າຕົວແທນ MAGs "Ca".Eudormicrobiaceae”, ທຸກຊະນິດ “Ca.genome ຂອງ Eremiobacterota ແລະສະມາຊິກຂອງ phyla ອື່ນໆ (ລວມທັງ UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria ແລະ Planctomycetota) ມີຢູ່ໃນ GTDB (r89)13.genomes ທັງໝົດເຫຼົ່ານີ້ໄດ້ຖືກອະທິບາຍໄວ້ຕາມທີ່ອະທິບາຍໄວ້ກ່ອນໜ້ານີ້ສຳລັບການສະກັດເອົາ gene marker ສະບັບດຽວ ແລະ BGC annotation.genomes GTDB ໄດ້ຖືກອະນຸລັກຕາມຄວາມສົມບູນແລະເງື່ອນໄຂການປົນເປື້ອນຂ້າງເທິງ.ການວິເຄາະຟີໂລເຈນໄດ້ຖືກປະຕິບັດໂດຍໃຊ້ຂັ້ນຕອນການເຮັດວຽກ Anvi'o Phylogenetics59.ຕົ້ນໄມ້ໄດ້ຖືກສ້າງຂຶ້ນໂດຍໃຊ້ IQTREE (v.2.0.3) (ຕົວເລືອກເລີ່ມຕົ້ນແລະ -bb 1000)80 ໃນການຈັດລຽງຂອງ 39 tandem ribosomal proteins ກໍານົດໂດຍ Anvi'o (MUSCLE, v.3.8.1551)81.ຕໍາແໜ່ງຂອງລາວຖືກຫຼຸດລົງ.ເພື່ອໃຫ້ກວມເອົາຢ່າງຫນ້ອຍ 50% ຂອງ genome82 ແລະ Planctomycecota ໄດ້ຖືກນໍາໃຊ້ເປັນກຸ່ມນອກໂດຍອີງໃສ່ GTDB tree topology.ຫນຶ່ງຕົ້ນໄມ້ຂອງ 40 uscMGs ຖືກສ້າງຂຶ້ນໂດຍໃຊ້ເຄື່ອງມືແລະຕົວກໍານົດການດຽວກັນ.
ພວກເຮົາໄດ້ໃຊ້ Traitar (v.1.1.2) ທີ່ມີຄ່າເລີ່ມຕົ້ນ (phenotype, ຈາກ nucleotides)83 ເພື່ອຄາດຄະເນລັກສະນະ microbial ທົ່ວໄປ.ພວກເຮົາໄດ້ຄົ້ນຫາວິຖີຊີວິດທີ່ເປັນນັກລ້າທີ່ມີທ່າແຮງໂດຍອີງໃສ່ດັດຊະນີ 84 ຂອງຜູ້ລ້າທີ່ພັດທະນາໃນເມື່ອກ່ອນເຊິ່ງຂຶ້ນກັບເນື້ອໃນຂອງທາດໂປຼຕີນ - ລະຫັດພັນທຸກໍາໃນ genome.ໂດຍສະເພາະ, ພວກເຮົາໃຊ້ DIAMOND ເພື່ອປຽບທຽບໂປຣຕີນໃນ genome ຕໍ່ກັບຖານຂໍ້ມູນ OrthoMCL (v.4)85 ໂດຍໃຊ້ຕົວເລືອກ –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 ແລະນັບພັນທຸກໍາທີ່ສອດຄ້ອງກັບ. ພັນທຸ ກຳ ເຄື່ອງ ໝາຍ ສຳ ລັບຜູ້ລ້າແລະຜູ້ທີ່ບໍ່ແມ່ນຜູ້ລ້າ.ດັດຊະນີແມ່ນຄວາມແຕກຕ່າງລະຫວ່າງຈໍານວນຂອງເຄື່ອງຫມາຍ predatory ແລະບໍ່ predatory.ໃນຖານະເປັນການຄວບຄຸມເພີ່ມເຕີມ, ພວກເຮົາຍັງໄດ້ວິເຄາະ "Ca" genome.ປັດໄຈ Entotheonella TSY118 ແມ່ນອີງໃສ່ສະມາຄົມຂອງມັນກັບ Ca.Eudoremicrobium (ຂະຫນາດ genome ຂະຫນາດໃຫຍ່ແລະທ່າແຮງ biosynthetic).ຕໍ່ໄປ, ພວກເຮົາໄດ້ທົດສອບການເຊື່ອມຕໍ່ທີ່ມີທ່າແຮງລະຫວ່າງພັນທຸກໍາຜູ້ລ້າ ແລະບໍ່ແມ່ນຜູ້ລ້າ ແລະທ່າແຮງທາງຊີວະວິທະຍາຂອງ Ca.Eudormicrobiaceae” ແລະພົບວ່າບໍ່ມີຫຼາຍກ່ວາຫນຶ່ງ gene (ຈາກປະເພດຂອງເຄື່ອງຫມາຍເຄື່ອງຫມາຍໃດໆ, ເຊັ່ນ: ເຊື້ອລ່າ / ທີ່ບໍ່ແມ່ນຜູ້ລ້າ) ທັບຊ້ອນກັບ BGC, ແນະນໍາວ່າ BGC ບໍ່ສັບສົນສັນຍານ predation.ຄໍາອະທິບາຍກ່ຽວກັບ genomic ເພີ່ມເຕີມຂອງ relicons scrambled ໄດ້ດໍາເນີນການໂດຍໃຊ້ TXSSCAN (v.1.0.2) ເພື່ອກວດກາໂດຍສະເພາະລະບົບຄວາມລັບ, pili, ແລະ flagella86.
ຫ້າຕົວແທນ 'Ca's ໄດ້ຖືກສ້າງແຜນທີ່ໂດຍການສ້າງແຜນທີ່ 623 metatranscriptomes ຈາກສ່ວນຫນຶ່ງຂອງການເສີມສ້າງ prokaryotic ແລະ eukaryotic ຂອງມະຫາສະຫມຸດ Tara22,40,87 (ໂດຍໃຊ້ BWA, v.0.7.17-r1188, -a flag).genome Eudormicrobiaceae.ໄຟລ໌ BAM ໄດ້ຖືກປະມວນຜົນດ້ວຍ FeatureCounts (v.2.0.1)88 ຫຼັງຈາກ 80% ອ່ານການຄຸ້ມຄອງ ແລະການກັ່ນຕອງຕົວຕົນ 95% (ມີຕົວເລືອກຄຸນສົມບັດCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) ນັບໄດ້. ຈໍາ​ນວນ​ຂອງ inserts ຕໍ່ gene​.ແຜນທີ່ທີ່ສ້າງຂຶ້ນໄດ້ຖືກປັບປຸງເປັນປົກກະຕິສໍາລັບຄວາມຍາວຂອງ gene ແລະຄວາມອຸດົມສົມບູນຂອງ gene marker mOTU (ການນັບການແຊກຊຶມສະເລ່ຍຂອງຄວາມຍາວປົກກະຕິສໍາລັບ genes ທີ່ມີຈໍານວນ insertion>0) ແລະ log-transformed ເປັນ 22.74 ເພື່ອໃຫ້ໄດ້ຮັບການສະແດງອອກຂອງພີ່ນ້ອງຂອງແຕ່ລະລະດັບ gene, ເຊິ່ງຍັງອະທິບາຍເຖິງ. ການປ່ຽນແປງຈາກຕົວຢ່າງໄປຫາຕົວຢ່າງໃນລະຫວ່າງການຈັດລໍາດັບ.ອັດຕາສ່ວນດັ່ງກ່າວອະນຸຍາດໃຫ້ສໍາລັບການວິເຄາະປຽບທຽບ, ຫຼຸດຜ່ອນບັນຫາອົງປະກອບໃນເວລາທີ່ການນໍາໃຊ້ຂໍ້ມູນອຸດົມສົມບູນພີ່ນ້ອງ.ພຽງແຕ່ຕົວຢ່າງທີ່ມີຫຼາຍກວ່າ 5 ຂອງ 10 mOTU genes ໄດ້ຖືກພິຈາລະນາສໍາລັບການວິເຄາະຕື່ມອີກເພື່ອໃຫ້ມີສ່ວນໃຫຍ່ພຽງພໍຂອງ genome ທີ່ຈະກວດພົບ.
ໂປຣໄຟລ໌ການຖອດຂໍ້ຄວາມປົກກະຕິຂອງ 'Ca.E. taraoceanii ແມ່ນຂຶ້ນກັບການຫຼຸດຜ່ອນມິຕິພາບໂດຍໃຊ້ UMAP ແລະການເປັນຕົວແທນຜົນໄດ້ຮັບຖືກນໍາໃຊ້ສໍາລັບການກຸ່ມທີ່ບໍ່ມີການເບິ່ງແຍງໂດຍໃຊ້ HDBSCAN (ເບິ່ງຂ້າງເທິງ) ເພື່ອກໍານົດສະຖານະການສະແດງອອກ.PERMANOVA ທົດສອບຄວາມສໍາຄັນຂອງຄວາມແຕກຕ່າງລະຫວ່າງກຸ່ມທີ່ລະບຸໄວ້ໃນພື້ນທີ່ໄລຍະຫ່າງຂອງຕົ້ນສະບັບ (ບໍ່ໄດ້ຫຼຸດລົງ).ການສະແດງອອກທີ່ແຕກຕ່າງກັນລະຫວ່າງເງື່ອນໄຂເຫຼົ່ານີ້ໄດ້ຖືກທົດສອບໃນທົ່ວ genome (ເບິ່ງຂ້າງເທິງ) ແລະ 201 ເສັ້ນທາງ KEGG ໄດ້ຖືກລະບຸໄວ້ໃນ 6 ກຸ່ມທີ່ເປັນປະໂຫຍດ, ຄື: BGC, ລະບົບ secretion ແລະ flagellar genes ຈາກ TXSSCAN, enzymes degradation (protease ແລະ peptidases), ແລະ predatory ແລະບໍ່. ພັນທຸ ກຳ ຜູ້ລ້າ.ຕົວຊີ້ວັດດັດຊະນີ predatory.ສໍາລັບແຕ່ລະຕົວຢ່າງ, ພວກເຮົາໄດ້ຄິດໄລ່ການສະແດງອອກປົກກະຕິປານກາງສໍາລັບແຕ່ລະຊັ້ນຮຽນ (ສັງເກດວ່າການສະແດງອອກ BGC ຕົວຂອງມັນເອງຖືກຄິດໄລ່ເປັນການສະແດງອອກສະເລ່ຍຂອງ genes biosynthetic ສໍາລັບ BGC ນັ້ນ) ແລະທົດສອບຄວາມສໍາຄັນໃນທົ່ວລັດ (ການທົດສອບ Kruskal-Wallis ປັບສໍາລັບ FDR).
genes ສັງເຄາະໄດ້ຖືກຊື້ຈາກ GenScript ແລະ primers PCR ແມ່ນຊື້ຈາກ Microsynth.Phusion polymerase ຈາກ Thermo Fisher Scientific ໄດ້ຖືກນໍາໃຊ້ສໍາລັບການຂະຫຍາຍ DNA.NucleoSpin plasmids, NucleoSpin gel ແລະຊຸດທໍາຄວາມສະອາດ PCR ຈາກ Macherey-Nagel ໄດ້ຖືກນໍາໃຊ້ສໍາລັບການຊໍາລະລ້າງ DNA.enzymes ຈໍາກັດແລະ T4 DNA ligase ໄດ້ຊື້ຈາກ New England Biolabs.ສານເຄມີນອກເຫນືອຈາກ isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) ແລະ 1,4-dithiothreitol (DTT, AppliChem) ໄດ້ຊື້ຈາກ Sigma-Aldrich ແລະນໍາໃຊ້ໂດຍບໍ່ມີການຊໍາລະລ້າງຕື່ມອີກ.ຢາຕ້ານເຊື້ອ chloramphenicol (Cm), spectinomycin dihydrochloride (Sm), ampicillin (Amp), gentamicin (Gt), ແລະ carbenicillin (Cbn) ໄດ້ຊື້ຈາກ AppliChem.ສ່ວນປະກອບສື່ Bacto Tryptone ແລະ Bacto Yeast Extract ໄດ້ຖືກຊື້ຈາກ BD Biosciences.Trypsin ສໍາລັບລໍາດັບແມ່ນຊື້ຈາກ Promega.
ລໍາດັບພັນທຸກໍາໄດ້ຖືກສະກັດມາຈາກການຕ້ານ SMASH ທີ່ຄາດຄະເນ BGC 75.1.E. malaspinii (ຂໍ້ມູນເສີມ).
genes embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), ແລະ embAM (ລວມເຖິງພາກພື້ນທີ່ເກີດຈາກສານທີ່ເກີດຈາກກັນລະຫວ່າງກັນກັບ UCR7) ແລະ embAM. codons ທີ່ດີທີ່ສຸດສໍາລັບການສະແດງອອກໃນ E ເມື່ອ​ໃດ​.gene embA ໄດ້ຖືກຍ່ອຍເຂົ້າໄປໃນບ່ອນໂຄນນິນຫຼາຍອັນທຳອິດ (MCS1) ຂອງ pACYCDuet-1(CmR) ແລະ pCDFDuet-1(SmR) ກັບ BamHI ແລະ HindIII cleavage sites.genes embM ແລະ embMopt (codon-optimized) ໄດ້ຖືກຍ່ອຍເຂົ້າໄປໃນ MCS1 pCDFDuet-1(SmR) ກັບ BamHI ແລະ HindIII ແລະຖືກຈັດໃສ່ໃນບ່ອນ cloning ຫຼາຍອັນທີສອງຂອງ pCDFDuet-1(SmR) ແລະ pRSFDuet-1(KanR) (MCS2) ກັບ NdeI/ChoI.ແຜ່ນສຽງຂອງ embAM ໄດ້ຖືກຍ່ອຍເຂົ້າໄປໃນ pCDFDuet1(SmR) ກັບ BamHI ແລະ HindIII cleavage sites.gene orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) ຖືກສ້າງຂື້ນໂດຍ PCR ສ່ວນຂະຫຍາຍທັບຊ້ອນກັນໂດຍໃຊ້ primers EmbI_OE_F_NdeI ແລະ EmbI_OE_R_XhoI, ຍ່ອຍດ້ວຍ NdeI/Xoembet pMC-1 (liget-1) ດຽວກັນ, ຍ່ອຍສະຫຼາຍດ້ວຍ NdeI/Xoembet-MCD, enzymes ເຂັ້ມງວດ (ເສີມ ຕາຕະລາງ).6).ການຈໍາກັດການຍ່ອຍອາຫານແລະການຜູກມັດຂອງເອນໄຊໄດ້ຖືກປະຕິບັດໂດຍອີງຕາມໂປໂຕຄອນຂອງຜູ້ຜະລິດ (New England Biolabs).

 


ເວລາປະກາດ: 14-03-2023