Gene Mmc1_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmc1_1201
Symbol
ID	4481194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Magnetococcus sp. MC-1
Kingdom	Bacteria
Replicon accession	NC_008576
Strand	-
Start bp	1496361
End bp	1497800
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	53%
IMG OID	639721944
Product	nitrogenase molybdenum-iron protein alpha chain
Protein accession	YP_865118
Protein GI	117924501
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.75707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00777378
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGTAC TGACTCGCGA AGAGGCACAA AGCCTCATCG AAGAGGTGCT GGAAGTCTAC 
CCTGAGGAGT CTAAAAAAGA TCGCCTCAAG CACCTGACAG TAAATGATCC CAGCATCACC 
CAGTCTAAAA AGTGCATCAC CTCCAACCGT AAATCCTTGC CTGGTGTCAT GACCATCCGT 
GGTTGCGCCT ATGCGGGTTC CAAGGGTGTG GTATGGGGTC CCATCAAAGA TATGATCCAC 
ATCTCCCACG GTCCTGTGGG TTGTGGTCAA TACTCCCGCG CGGGTCGTCG TAACTACTAT 
GTGGGTTACA CCGGCGTCAA TGCCTTCGGC ACCATGAACT TCACCTCGGA CTTCCAAGAG 
CGTGACGTCG TGTTCGGTGG CGACAAAAAG CTGGAGAAGA TCGTTCACGA GTGCGAAGCG 
CTGTTCCCCC TGATGAAGGG TATGTCCGTC CAGTCCGAGT GCCCCATTGG TCTGATCGGT 
GACGACATTG AAGCGGTGGC CCGCAAGACC TCGGCGGCCA TCAACAAGCC TGTTATCCCT 
GTACGTTGCG AAGGTTTCCG TGGGGTTTCT CAGTCCTTGG GTCACCACAT TGCCAACGAC 
GCAATCCGTG ACTGGGTGCT GGAGAACCGT AAAGACAAAA TGCGTGAAAC CGGGCCTTAC 
GATGTGGCCG TCATCGGCGA CTATAACATC GGTGGTGACG CTTGGGCCTC GCGTATTTTG 
TTGGAAGAGA TGGGTCTGAA CGTGGTTGCT CAGTGGTCTG GCGACGGCAC CCTGGCGGAG 
ATGGAGAACA CCCCTGCCGT TAAGCTGAAC CTGATCCACT GCTACCGTTC CATGAACTAC 
ATCTCCCGTC ACATGGAAGC CAAGTATGGT ATTCCCTGGA TGGAGTATAA TTTCTTTGGT 
CCCACCAAGA TTGCTGAGTC CCTACGCAAG ATTGCTGAGC AGTTCGACGA CAAGATCAAA 
GAGGGCGCTG AGAAGGTTAT TGCCAAATAT ACCCCCATCA TGGAGGGCAT CATTGGTAAG 
TACCGTCCCC GTCTGGAAGG CAAAAAAGTG ATGTTGTATG TGGGCGGTCT GCGTCCCCGT 
CACGTGATCG GTGCTTACGA AGATCTGGGC ATGGAAGTGG TTGGTACCGG CTACGAATTT 
GGCCACAACG ACGACTATGA CCGCACCATC AAAGAGATGG GTGACTCCAC CCTGATCTAT 
GATGACGTCA CCGGTTACGA GTTTGAAAAG TTTGTGGAGA AGGTACAGCC CGATCTGGTT 
GGTTCTGGCA TCAAAGAAAA ATACATCTTC CAGAAGATGG GTATTCCCTT CCGTCAGATG 
CACTCCTGGG ACTACTCAGG CCCCTACCAT GGGTATGACG GTTTTGCCAT TTTCGCCCGC 
GATATGGACA TGACCATCAA CAACCCTTGC TGGGACTCCT TTAAGGCGCC CTGGAAGTAA

Protein sequence

MSVLTREEAQ SLIEEVLEVY PEESKKDRLK HLTVNDPSIT QSKKCITSNR KSLPGVMTIR 
GCAYAGSKGV VWGPIKDMIH ISHGPVGCGQ YSRAGRRNYY VGYTGVNAFG TMNFTSDFQE 
RDVVFGGDKK LEKIVHECEA LFPLMKGMSV QSECPIGLIG DDIEAVARKT SAAINKPVIP 
VRCEGFRGVS QSLGHHIAND AIRDWVLENR KDKMRETGPY DVAVIGDYNI GGDAWASRIL 
LEEMGLNVVA QWSGDGTLAE MENTPAVKLN LIHCYRSMNY ISRHMEAKYG IPWMEYNFFG 
PTKIAESLRK IAEQFDDKIK EGAEKVIAKY TPIMEGIIGK YRPRLEGKKV MLYVGGLRPR 
HVIGAYEDLG MEVVGTGYEF GHNDDYDRTI KEMGDSTLIY DDVTGYEFEK FVEKVQPDLV 
GSGIKEKYIF QKMGIPFRQM HSWDYSGPYH GYDGFAIFAR DMDMTINNPC WDSFKAPWK