Gene MmarC7_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MmarC7_0101
Symbol
ID	5328192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcus maripaludis C7
Kingdom	Archaea
Replicon accession	NC_009637
Strand	+
Start bp	116546
End bp	117976
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	38%
IMG OID	640792622
Product	nitrogenase alpha chain
Protein accession	YP_001329322
Protein GI	150402028
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01284] nitrogenase alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.299285
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0821221
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTCT GTTTATTGGA TGTAGATAAA GATATTCCTG AAAGAGAACA ACACGTTTAC 
ATCAAAGATT CAAAAGATAC AAACGGACAT TGCCAAAAAT GTAATACCAC CACAATCCCA 
GGAAGTATGA CCGAAAGAGG CTGTGCTTTT GCAGGGGTAA AAGGTGTGAT TACTGGTGCA 
ATAAAAGACG TACTACAAGT AGTACACTCG CCTGTTGGAT GTTCCGCATA CGGAAACGGT 
ACAACAAAAA GATACCCAAC AAACTCAACA ATGCCTGATG GAAGCACATT CCCAGTTGAA 
AATTTCAACC TCAAACACAT TGTCGGAACA GACTTAAGTG AATCCGATGT TGTATTTGGT 
GGAATGAAAA AACTTAAAGC AACAATTAGA GAAGGTGCAA AAGAGTACCC ATTCGTAAAT 
GCAATCTATG TTTACGCAAC ATGTACAACA GGTCTTATCG GAGACGACTT AGATGCAGTA 
TGTAAAGAAA TGCAAGCAGA ACTTGGAAAA GATGTTGTAG CGTTCAACGC TCCAGGATTT 
GCAGGACCAA CACAATCAAA AGGACACCAC GTAGGAAACT TCACGATATT CGAAAAATTA 
GTTGGAACAA AAGAACCTCT TGAAACAACT GATTACGACA TCAACCTCAT TGGAGAATAT 
AACATCGATG GTGACTACTG GGTTCTTGAA AAATACTTCG ATGCTATGGG CATTAGGGTT 
CTCAGTAAAT TCACAGGAGA TGCATGCCAC GATGAGCTCT GCTGGATGCA CAAAGCAAAA 
CTAAGCCTTG TAAGATGCCA AAGATCTGCA ACATACGTAG CAAAATTAAT TGAAGAAAAA 
TACGGTGTTC CATATATTAA AGTAGATTTC TTCGGACCAG AATACTGTGC TGAAAACTTA 
AGAACAGTAG GTAAATTCTT TGGAAAAGAA ATTGAAGCTG AAGCTGTTAT TAAAAAAGAA 
ATGGAAAAAA TCCAGCCTGA AATTGATTTC TACAAATCAA AATTACAGGG TAAAAAAGTT 
TGGATTTCAG CAGGAGGGCC AAAAAGCTGG CACTTAGCTA AACCACTTGA AGAATACTTA 
GGAATGGACG TGGTAGCACT TTCAGGTCTT TTCGAACACG AAGATGGATA CGAAAAAATG 
CAAGAAAGGG CAAAAGATGG TACAATTATC ATTGATGACC CGAACACCCT TGAAATGGAA 
GAAGTAGTTG AAAAATACCA CCCAGATATA GTTCTTGGAG GTATCAAAGA GAAATATTTC 
TTCCACAAAT TAGGAGTATC TTCAGTAATG ATACACTCTT ACGAAAACGG TCCATACATT 
GGATTTGAAG GATTCGTAAA CCTTGCAAAA GATATTTACA CAGCAATCTA CAACCCAGCT 
TGGAGTTTAA TGGAATTTGA AGACGAAGAG CCAGGTGATA CAAATGAGTG A

Protein sequence

MPFCLLDVDK DIPEREQHVY IKDSKDTNGH CQKCNTTTIP GSMTERGCAF AGVKGVITGA 
IKDVLQVVHS PVGCSAYGNG TTKRYPTNST MPDGSTFPVE NFNLKHIVGT DLSESDVVFG 
GMKKLKATIR EGAKEYPFVN AIYVYATCTT GLIGDDLDAV CKEMQAELGK DVVAFNAPGF 
AGPTQSKGHH VGNFTIFEKL VGTKEPLETT DYDINLIGEY NIDGDYWVLE KYFDAMGIRV 
LSKFTGDACH DELCWMHKAK LSLVRCQRSA TYVAKLIEEK YGVPYIKVDF FGPEYCAENL 
RTVGKFFGKE IEAEAVIKKE MEKIQPEIDF YKSKLQGKKV WISAGGPKSW HLAKPLEEYL 
GMDVVALSGL FEHEDGYEKM QERAKDGTII IDDPNTLEME EVVEKYHPDI VLGGIKEKYF 
FHKLGVSSVM IHSYENGPYI GFEGFVNLAK DIYTAIYNPA WSLMEFEDEE PGDTNE