Gene GM21_2835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2835
Symbol
ID	8138178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3299663
End bp	3302056
Gene Length	2394 bp
Protein Length	797 aa
Translation table	11
GC content	66%
IMG OID	644870437
Product	4-hydroxybenzoyl-CoA reductase, alpha subunit
Protein accession	YP_003022626
Protein GI	253701437
COG category	[C] Energy production and conversion
COG ID	[COG1529] Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs
TIGRFAM ID	[TIGR03194] 4-hydroxybenzoyl-CoA reductase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	93
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA ACCACAGCGT AATAGGCCGC AGCGTCCCCC GCATCGACGG GCCGGAGAAG 
GTCACCGGGG CGGCCAAGTA CACCGGGGAC CTGAAGTTCC CCAACATGCT TTACGGCAAG 
ATCCTGACGA GCCCCCACGC CCATGCCCGG ATCCTCTCCA TCGACACCTC CGAGGCGGAG 
CGTCTTCCCG GGGTGAAGGC GGTGATCACC CACAAGGACG TGCCGACCTT GAAGTACGGC 
CTGAGCCCGG CCCGCTGGGA CGAGAGCATC TTCTGCAGCG ACAAGGTCCG TTTCGTGGGG 
GACAAGGTGG CGGCCGTGGC CTGCCTGGAC GAGGACACCT GCTACAAGGC GCTGAAGCTG 
ATCAAGGTGG AGTACGAGGT GCTCCCCGCC GCTCTCGACT TCCTGCATGC CATGGACGAG 
GGGCAGCCGC AGGTGCACGA AGAGTACGCG AGAAACATCA ACACCGAGAT CCACCAGGAG 
TTCGGGGACG TGGAGAAGGC GCTCGCCGAG GCGCACCACG TGCGCACCGA CACCTTCGTG 
GGGCAGAGGA CCTACCAGTC ACCCATCGAG CCGCACTCCG CCATCTCCAT GTGGGACGGG 
GAGAAGCTCA CCATCTACTC CAGCACCCAG TCGCCGCACT ACTTCCAGCA CTACATCGCC 
CGCGAGTTCG ACATGCCCAT GGGTGACGTG CGCATCATCA AGCCCTACCT CGGGGGCGGT 
TTCGGCGGCA AGCTGGAGCC GACGGGGCTC GAGTTCGCAG GCGCCGTGCT GGCGAAGCTG 
ACCGGCCGGC CGGTTAGGAC CTTTTACGAC CGCGCCGAGA TGTTCGCCCA CAACCGCGGG 
CGGCACGCCC AGTACATGGA GATCACCACC GGCGTGGACA AAAACGGCAA GATCCTCGCC 
GCCAAGGCCA ACTTCCTCAT GGACGGCGGC GCCTACACGA GCCTCGGCAT CGCGAGCGCC 
TACTACGCCG GCGCTCTGCT CCCGCTCACC TACGAGTTCG ACAACTACCA GTTCGACATG 
TTCCGGGTCT ACACCAACCT CCCCGCCTGC GGCGCCCAGC GCGGCCACGG CGCCCCCCAG 
CCCAAGTACG CCTTCGAGAG CCACCTGGAC AACGTGGCGG CGGACCTGGG AATCGACCCG 
ATGGACATCA GGATCATCAA CGCCCGGCGC CCGAACACGG TCACCCCCAA CGACTTCCGG 
GTCAACTCCT GCAAGATCAA GGAGTGCCTG GAGCGGGTGC GGGTGATGTC GGACTGGGAC 
GAGAAGAAGA AAAACCTCCC CCTGGGGAGG GGGATAGGGG TCGCCACCGG GAGCTTCGTC 
ACCGGCGCGG GGTATCCCAT CTACCGCACC GACCTGCCGC ACGCCGCCGC CTTCATCAAG 
GTCTGCGAGG ACGGCACCGC CGCCACCCTC TACACCGGAT CGGTGGACAT AGGGCAGGGG 
TCGGACACCG TGCTCTGCCA GATGGCGGCC GAGGCGATGG GGTACCGCTA CGAGCAGATG 
AAGATCGTCG CCGCCGACAC CGAGATCACC CCGCTCGACT TCGGCGCCTA CGCGAGCCGC 
CAGACCTACA TGTCCGGCGC CGCCGTGAAG CAGGCCGGCG AAGAGGTGAA GCGGCAGATC 
CTGGAGATGG CCTCCAGCAT GCTGGGGCTT CCGGCGGACG ATCTGGAGTG CGACGACGGC 
AAGGTCTTCT CCAAGTCACG TTCCGGGAAG AGCCTCAGCT TCGAGGAGGT GGCCAGGAAG 
CACTTCGTGC TCCGTGGACC GCTTCTCGGG CGCGGCTCCT ACACCCCGCC CAAACTCGGC 
GGGAGCTTCA AGGGCGCTGC CGTCGGCACT TCCCCCGCAT ACAGCTTCGG GGCCCAGGTG 
GGAGAGGTGG CCATCGACGA GGAGACCGGC GAGATCACCG TGGTCGGTAT CTGGGACGTG 
CACGACTGCG GCAAGGTGAT CAACCCGCGC CTTCTGCACG GCCAGGTGCA CGGCGCCCTC 
TACATGGGTA TGGGGGAGGC GGTCTGGGAG GAGGTCCTCT TCGACGACAA GGGGCGCATC 
AAGAACGCGG AGCTCGCGAA CTACCGCCTC CTGACCGCCG TGGACATGCC CCCCATCACC 
TCAGAGGTGG TGGACAGCTA CGAGCCGAGC GGCCCCTGGG GGGTGAAGGA GGTGGGCGAA 
GGGGCGACCA ACCCGACCTT GGGTATGTTC TCCAACGCCA TCTTCGACGC CATGGGGGTG 
CGGGTCAATT CGCTGCCGCT TAGCTACGAG AAGGTGTGGC GCGCCCTGAA GGAAAAGCGC 
GAGCGGGAGG AGATTGCCAA GCGGGAAGAC GCCCAAAGGG GACTGGCTCC GCAGGTGCCT 
GTCCCCCTTG AGAGTGAGTC CGCATCGGAG CCCATTCACG CGAACCCGAG CTGA

Protein sequence

MSDNHSVIGR SVPRIDGPEK VTGAAKYTGD LKFPNMLYGK ILTSPHAHAR ILSIDTSEAE 
RLPGVKAVIT HKDVPTLKYG LSPARWDESI FCSDKVRFVG DKVAAVACLD EDTCYKALKL 
IKVEYEVLPA ALDFLHAMDE GQPQVHEEYA RNINTEIHQE FGDVEKALAE AHHVRTDTFV 
GQRTYQSPIE PHSAISMWDG EKLTIYSSTQ SPHYFQHYIA REFDMPMGDV RIIKPYLGGG 
FGGKLEPTGL EFAGAVLAKL TGRPVRTFYD RAEMFAHNRG RHAQYMEITT GVDKNGKILA 
AKANFLMDGG AYTSLGIASA YYAGALLPLT YEFDNYQFDM FRVYTNLPAC GAQRGHGAPQ 
PKYAFESHLD NVAADLGIDP MDIRIINARR PNTVTPNDFR VNSCKIKECL ERVRVMSDWD 
EKKKNLPLGR GIGVATGSFV TGAGYPIYRT DLPHAAAFIK VCEDGTAATL YTGSVDIGQG 
SDTVLCQMAA EAMGYRYEQM KIVAADTEIT PLDFGAYASR QTYMSGAAVK QAGEEVKRQI 
LEMASSMLGL PADDLECDDG KVFSKSRSGK SLSFEEVARK HFVLRGPLLG RGSYTPPKLG 
GSFKGAAVGT SPAYSFGAQV GEVAIDEETG EITVVGIWDV HDCGKVINPR LLHGQVHGAL 
YMGMGEAVWE EVLFDDKGRI KNAELANYRL LTAVDMPPIT SEVVDSYEPS GPWGVKEVGE 
GATNPTLGMF SNAIFDAMGV RVNSLPLSYE KVWRALKEKR EREEIAKRED AQRGLAPQVP 
VPLESESASE PIHANPS