Gene MCA0204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0204
Symbol
ID	3103905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	209618
End bp	211186
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	62%
IMG OID	637169427
Product	nitrogenase cofactor biosynthesis protein NifB
Protein accession	YP_112740
Protein GI	53802628
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR01290] nitrogenase cofactor biosynthesis protein NifB

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.037885
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAACAG TGCAGAACCA TACGGGGGCG GAGTCCGCTG GCCTAAACGC CGCGGTGAAT 
GTCGACGAGA TCATGCAGAA GGTGGCCGAG CACAAAGGCT GCGGCACTTC CGGCGGTTCC 
GGAAAAGCCA GCTGCGGTTC CGGCGCGGGC GCAAACGACC TGCCGCCGGA GATTTGGGAG 
AAGGTGAAGA ACCACCCCTG CTACAGCGAG GAAGCCCATC ACCACTACGC TCGCATGCAC 
GTGGCGGTGG CACCGGCCTG CAACATCCAG TGCAACTACT GTAACCGCAA GTACGACTGC 
GCCAACGAAA GCCGGCCGGG GGTGGTGAGC GAGAAGCTCA CTCCGGAACA GGCGGCGAAG 
AAGGTACTGG CGGTGGCCTC CACCATTCCG CAGATGACGG TGCTCGGTAT CGCCGGTCCC 
GGCGATCCGC TGGCCAACCC GGAAAAGACC TTCAAGACCT TCGAACTGGT CGCCAAGCAT 
GCGCCCGACA TCAAGCTCTG CGTCTCCACC AACGGTCTGG CGCTGCCCGA TCACGTGGAG 
CGGCTGTCCC AGTACAACAT CGATCACGTG ACCATCACCA TCAACATGAT CGATCCGGAG 
GTGGGCGCCA AGATCTATCC GTGGATCTAC TACAAGAAAA AACGCTACAC CGGCGTCGAG 
GCCGCCAAGA TCCTCAGCGA TCGCCAGTTG CAGGGCCTGG AGATGCTGAC CGAGCGCGGC 
ATCCTGTCGA AGATCAACTC GGTGATGATC CCCGGCATCA ATGACGAGCA TCTGGTCGAG 
GTCAACAAGG CGGTGAAGTC GCGGGGGGCG TTTCTGCACA ACATCATGCC GCTGATCTCG 
GCGCCGGAGC ACGGCACTGT ATTCGGTCTG ACCGGTCAGC GCGGCCCGAC GGCGCAGGAG 
CTCAAGGCCT TGCAGGATAA GTGCGAAGGC GAAATGAACA TGATGCGCCA TTGCCGTCAG 
TGCCGCGCCG ATGCGGTGGG CCTGTTGGGC GAGGACCGTA GCGCGGAGTT CACCACCGAC 
AAGATCATGG CGATGGAGGT CAATTACGAT CTCGACGCCC GCAAGGCCTA TCAGGAAGCC 
GTGGAAAAGG AACGCCAAGC GGTGGTGGCA GCCAAGCAGG AAGAACTGCA AACCCTGGCC 
GGTGCGCATT CCGACATCAA GATGCTGATC GCCGTGGCGA CCAAGGGCGG CGGCAAGGTC 
AACGAACACT TCGGCCATGC CAGCGAATTC CAGATCTATG AGCTGTCCAC TGCGGGCGCC 
AAGTTCGTCG GACATCGTCG TGTGGATCTG TACTGCCAGG GCGGTTACGG CGAGGAAGAT 
GCACTGGGCA CGGTGATCCG GGCCATCAAC GACTGCCACG CAGTGTTCGT GGCCAAGATC 
GGCGGCTGTC CGAAGAGCGA CCTCAAGGCG GCGGGTATCG ATCCCGTGGA CCAGTATGCC 
GGTCAGTTCA TCGAACAGTC GGCGATCGCC TACTTCAAGG AGTATCTCGA CAAGGTCGCG 
TCCGGCGAAA TCGAGCACGT GGCCAAGGGT GATGCGGTGA TCCGCCAGGG CGCTTTGATC 
GCGGCTTGA

Protein sequence

MQTVQNHTGA ESAGLNAAVN VDEIMQKVAE HKGCGTSGGS GKASCGSGAG ANDLPPEIWE 
KVKNHPCYSE EAHHHYARMH VAVAPACNIQ CNYCNRKYDC ANESRPGVVS EKLTPEQAAK 
KVLAVASTIP QMTVLGIAGP GDPLANPEKT FKTFELVAKH APDIKLCVST NGLALPDHVE 
RLSQYNIDHV TITINMIDPE VGAKIYPWIY YKKKRYTGVE AAKILSDRQL QGLEMLTERG 
ILSKINSVMI PGINDEHLVE VNKAVKSRGA FLHNIMPLIS APEHGTVFGL TGQRGPTAQE 
LKALQDKCEG EMNMMRHCRQ CRADAVGLLG EDRSAEFTTD KIMAMEVNYD LDARKAYQEA 
VEKERQAVVA AKQEELQTLA GAHSDIKMLI AVATKGGGKV NEHFGHASEF QIYELSTAGA 
KFVGHRRVDL YCQGGYGEED ALGTVIRAIN DCHAVFVAKI GGCPKSDLKA AGIDPVDQYA 
GQFIEQSAIA YFKEYLDKVA SGEIEHVAKG DAVIRQGALI AA