Gene EcolC_1278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1278
Symbol
ID	6065937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1398379
End bp	1399617
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	53%
IMG OID	641600699
Product	manganese transport protein MntH
Protein accession	YP_001724271
Protein GI	170019317
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1914] Mn2+ and Fe2+ transporters of the NRAMP family
TIGRFAM ID	[TIGR01197] NRAMP (natural resistance-associated macrophage protein) metal ion transporters

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.913398
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0884608
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACT ATCGCGTTGA GAGTAGCAGC GGACGGGCGG CGCGCAAGAT GAGGCTCGCA 
TTAATGGGAC CTGCGTTCAT TGCGGCGATT GGTTATATCG ATCCCGGTAA CTTTGCGACC 
AATATTCAGG CGGGTGCTAG CTTCGGCTAT CAGCTACTGT GGGTTGTCGT TTGGGCCAAC 
CTGATGGCGA TGCTGATTCA GATCCTCTCT GCCAAACTAG GGATTGCCAC CGGTAAAAAT 
CTGGCGGAGC AGATTCGCGA TCACTATCCG CGTCCCGTAG TGTGGTTCTA TTGGGTTCAG 
GCAGAAATTA TTGCGATGGC AACCGACCTG GCGGAATTTA TTGGTGCGGC GATCGGTTTT 
AAACTCATTC TTGGTGTTTC GTTGTTGCAG GGCGCGGTGC TGACGGGGAT CGCGACTTTC 
CTGATTTTAA TGCTGCAACG TCGCGGGCAA AAACCGCTGG AGAAAGTGAT TGGCGGGTTA 
CTGTTGTTTG TTGCCGCGGC TTACATTGTC GAGTTGATTT TCTCCCAGCC TAACCTGGCG 
CAGCTGGGTA AAGGAATGGT GATCCCGAGT TTACCTACTT CGGAAGCGGT CTTCCTGGCA 
GCAGGCGTGT TAGGGGCGAC GATTATGCCG CATGTGATTT ATTTGCACTC CTCGCTCACT 
CAGCATTTAC ATGGCGGTTC GCGTCAACAA CGTTATTCCG CCACCAAATG GGATGTGGCT 
ATCGCCATGA CTATTGCCGG TTTTGTCAAT CTGGCGATGA TGGCTACAGC TGCGGCGGCG 
TTCCACTTTT CCGGTCATAC TGGTGTTGCC GATCTTGATG AGGCTTATCT GACGCTGCAA 
CCGCTGTTAA GCCACGCTGC GGCAACGGTC TTTGGATTAA GCCTGGTTGC TGCGGGGCTG 
TCTTCAACGG TGGTGGGGAC ACTGGCGGGG CAGGTGGTGA TGCAGGGCTT CATTCGCTTT 
CATATCCCGC TGTGGGTGCG TCGTACAGTC ACCATGTTGC CGTCATTTAT TGTCATTCTG 
ATGGGATTAG ATCCGACACG GATTCTGGTT ATGAGTCAGG TACTGTTAAG TTTTGGTATC 
GCTCTGGCGC TGGTTCCACT GCTGATTTTC ACCAGTGACA GCAAGTTGAT GGGCGATCTG 
GTGAACAGCA AACGCGTAAA ACAGACAGGC TGGGTGATTG TGGTGCTGGT CGTGGCGCTG 
AATATCTGGT TGTTGGTGGG GACGGCGCTG GGATTGTAG

Protein sequence

MTNYRVESSS GRAARKMRLA LMGPAFIAAI GYIDPGNFAT NIQAGASFGY QLLWVVVWAN 
LMAMLIQILS AKLGIATGKN LAEQIRDHYP RPVVWFYWVQ AEIIAMATDL AEFIGAAIGF 
KLILGVSLLQ GAVLTGIATF LILMLQRRGQ KPLEKVIGGL LLFVAAAYIV ELIFSQPNLA 
QLGKGMVIPS LPTSEAVFLA AGVLGATIMP HVIYLHSSLT QHLHGGSRQQ RYSATKWDVA 
IAMTIAGFVN LAMMATAAAA FHFSGHTGVA DLDEAYLTLQ PLLSHAAATV FGLSLVAAGL 
SSTVVGTLAG QVVMQGFIRF HIPLWVRRTV TMLPSFIVIL MGLDPTRILV MSQVLLSFGI 
ALALVPLLIF TSDSKLMGDL VNSKRVKQTG WVIVVLVVAL NIWLLVGTAL GL