Gene ECD_02301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02301
Symbol	mntH
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	2389354
End bp	2390592
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	53%
IMG OID
Product	manganese transport protein MntH
Protein accession	ACT44122
Protein GI	253978452
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAACT ATCGCGTTGA GAGTAGCAGC GGACGGGCGG CGCGCAAGAC GAGGCTCGCA 
TTAATGGGAC CTGCGTTCAT TGCGGCGATT GGTTATATCG ATCCCGGTAA CTTTGCGACC 
AATATTCAGG CGGGTGCCAG CTTCGGCTAT CAGCTCCTGT GGGTTGTCGT TTGGGCCAAC 
CTGATGGCGA TGCTGATTCA GATCCTCTCT GCCAAACTAG GGATTGCCAC CGGTAAAAAT 
CTGGCGGAGC AAATTCGCGA TCACTATCCG CGTCCCGTAG TGTGGTTCTA TTGGGTTCAG 
GCAGAAATTA TTGCGATGGC AACCGACCTG GCGGAATTTA TTGGTGCGGC GATCGGTTTT 
AAACTCATTC TTGGTGTTTC GTTGTTGCAA GGTGCGGTGC TGACGGGGAT CGCGACTTTC 
CTGATTTTAA TGCTGCAACG TCGCGGGCAA AAACCGCTGG AGAAAGTGAT TGGCGGGTTA 
CTGTTGTTTG TTGCCGCGGC TTACATTGTC GAGTTGATTT TCTCCCAGCC TAACCTGGCG 
CAGCTGGGTA AAGGAATGGT GATCCCGAGT TTACCTACTT CGGAAGCGGT CTTCCTAGCA 
GCAGGCGTGT TAGGGGCGAC GATTATGCCG CATGTGATTT ATTTGCACTC TTCGCTCACT 
CAGCATTTAC ATGGCGGTTC GCGTCAACAA CGTTATTCCG CCACCAAATG GGATGTGGCT 
ATCGCCATGA CTATTGCCGG TTTTGTCAAT CTGGCGATGA TGGCTACAGC TGCGGCGGCG 
TTCCACTTTT CTGGTCATAC TGGTGTTGCC GATCTTGATG AGGCATATCT GACGCTGCAA 
CCGTTGTTAA GCCATGCTGC GGCAACGGTC TTTGGATTAA GCCTGGTTGC TGCCGGACTG 
TCCTCAACGG TGGTGGGGAC ACTGGCGGGG CAGGTGGTGA TGCAGGGGTT CATTCGCTTC 
CATATCCCGC TGTGGGTGCG TCGTACAGTC ACCATGTTGC CGTCATTTAT TGTCATTCTG 
ATGGGATTAG ATCCGACACG GATTCTGGTT ATGAGTCAGG TGCTGTTAAG TTTTGGTATC 
GCCCTGGCGC TGGTTCCACT GCTGATTTTC ACCAGTGACA GCAAGTTGAT GGGCGATCTG 
GTGAACAGCA AACGCGTAAA ACAGACAGGC TGGGTGATTG TGGTGCTGGT AGTGGCGCTG 
AATATCTGGT TGTTGGTGGG TACGGCACTG GGATTGTAG

Protein sequence

MTNYRVESSS GRAARKTRLA LMGPAFIAAI GYIDPGNFAT NIQAGASFGY QLLWVVVWAN 
LMAMLIQILS AKLGIATGKN LAEQIRDHYP RPVVWFYWVQ AEIIAMATDL AEFIGAAIGF 
KLILGVSLLQ GAVLTGIATF LILMLQRRGQ KPLEKVIGGL LLFVAAAYIV ELIFSQPNLA 
QLGKGMVIPS LPTSEAVFLA AGVLGATIMP HVIYLHSSLT QHLHGGSRQQ RYSATKWDVA 
IAMTIAGFVN LAMMATAAAA FHFSGHTGVA DLDEAYLTLQ PLLSHAAATV FGLSLVAAGL 
SSTVVGTLAG QVVMQGFIRF HIPLWVRRTV TMLPSFIVIL MGLDPTRILV MSQVLLSFGI 
ALALVPLLIF TSDSKLMGDL VNSKRVKQTG WVIVVLVVAL NIWLLVGTAL GL