Gene MmarC5_0661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MmarC5_0661
Symbol
ID	4928301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcus maripaludis C5
Kingdom	Archaea
Replicon accession	NC_009135
Strand	+
Start bp	634526
End bp	635956
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	39%
IMG OID	640166163
Product	nitrogenase alpha chain
Protein accession	YP_001097187
Protein GI	134045701
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01284] nitrogenase alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.949804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATTCT GTTTATTGGA TGTAGATAAA GATATCCCTG AAAGAGAACA ACACGTTTAC 
ATCAAAGATT CAAAAGATAC AAACGGACAT TGCCAAAAAT GTAATACCAC CACGATCCCT 
GGAAGTATGA CCGAAAGAGG CTGTGCTTTT GCAGGAGTTA AAGGTGTGAT TACTGGTGCA 
ATAAAAGACG TACTACAAAT AGTACACTCG CCTGTTGGAT GTTCCGCATA CGGAAACGGT 
ACAACAAAAA GATACCCAAC AAACTCAACA ATGCCTGATG GAAGTACATT CCCAGTTGAA 
AACTTCAACC TCAAACACAT TGTCGGAACA GACTTAACTG AATCCGATGT TGTATTTGGT 
GGAATGAACA AACTCAAAAA AGTAATTCGA GAAGGCGCAA AAGAGTACCC TTTCGTAAAT 
GCAATCTACG TTTACGCAAC ATGTACAACG GGTCTTATCG GAGACGACTT AGATGCAGTA 
TGTAAAGAAA TGCAAGCAGA ACTTGGAAAA GATGTTGTAG CATTCAATGC TCCAGGATTT 
GCAGGACCAA CACAATCAAA AGGACACCAC GTAGGAAACT ACACGATATT TTCAAAATTG 
GTTGGAACAA AAGAACCTCT AGAAACAACC GATTACGACA TCAACCTTAT TGGAGAATAT 
AACATCGATG GTGACTACTG GGTCCTTGAA AAATACTTCG ATGCTATGGG CATCAGAGTT 
CTCAGTAAAT TTACTGGAGA TGCATGCCAC GATGAGCTCT GCTGGATGCA CAAAGCAAAA 
TTAAGCCTTG TAAGATGCCA AAGATCTGCA ACATACGTAG CAAAATTAAT TGAAGAAAAA 
TACGGTGTAC CATACATTAA AGTAGATTTC TTCGGTCCAG AATACTGTGC TGAAAACTTA 
AGAACAGTAG GTAAATTCTT CGGAAAAGAA ATTGAAGCTG AAGCTGTTAT TAAAAAAGAA 
ATGGAAAAAA TCCAGCCTGA ACTTGATTTC TACAAATCAA AATTACAGGG TAAAAAAGTT 
TGGATTTCAG CAGGAGGTCC AAAAAGCTGG CACTTATCCA AACCACTCGA AGAATACTTA 
GGAATGGACG TGGTAGCACT TTCCGGTCTT TTCGAACACG AAGATGGATA CGAAAAAATG 
CAGGAAAGGG CAAAAGATGG TACAATTATC ATTGACGACC TGAACACACT TGAAATGGAA 
GAAGTTGTTG AAAAATACCA CCCCGAAATC GTTCTTGGAG GTATCAAAGA GAAATATTTC 
TTCCACAAAT TGGGAGTATC TTCAGTAATG ATACACTCTT ACGAAAACGG CCCATACATC 
GGATTCGAAG GATTCGTAAA CTTAGCAAAA GACATTTACA CAGCAATATA CAACCCAGCT 
TGGAGTTTAA TGGAATTTGA AGACGAAGAG CCAGGTGATA CAAATGAGTG A

Protein sequence

MPFCLLDVDK DIPEREQHVY IKDSKDTNGH CQKCNTTTIP GSMTERGCAF AGVKGVITGA 
IKDVLQIVHS PVGCSAYGNG TTKRYPTNST MPDGSTFPVE NFNLKHIVGT DLTESDVVFG 
GMNKLKKVIR EGAKEYPFVN AIYVYATCTT GLIGDDLDAV CKEMQAELGK DVVAFNAPGF 
AGPTQSKGHH VGNYTIFSKL VGTKEPLETT DYDINLIGEY NIDGDYWVLE KYFDAMGIRV 
LSKFTGDACH DELCWMHKAK LSLVRCQRSA TYVAKLIEEK YGVPYIKVDF FGPEYCAENL 
RTVGKFFGKE IEAEAVIKKE MEKIQPELDF YKSKLQGKKV WISAGGPKSW HLSKPLEEYL 
GMDVVALSGL FEHEDGYEKM QERAKDGTII IDDLNTLEME EVVEKYHPEI VLGGIKEKYF 
FHKLGVSSVM IHSYENGPYI GFEGFVNLAK DIYTAIYNPA WSLMEFEDEE PGDTNE