Gene EcHS_A3353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3353
Symbol	mtr
ID	5592807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3355499
End bp	3356743
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	53%
IMG OID	640922471
Product	tryptophan permease
Protein accession	YP_001459964
Protein GI	157162646
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0814] Amino acid permeases
TIGRFAM ID	[TIGR00837] aromatic amino acid transport protein

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAC TAACCACCAC CCAAACGTCA CCGTCGCTGC TTGGCGGCGT GGTGATTATC 
GGCGGCACCA TTATTGGCGC AGGGATGTTT TCTCTGCCAG TGGTCATGTC CGGGGCGTGG 
TTTTTCTGGT CAATGGCGGC GCTGATCTTT ACCTGGTTCT GTATGCTGCA TTCCGGCTTG 
ATGATTCTGG AAGCTAACCT GAATTACCGA ATCGGTTCGA GTTTTGACAC CATCACCAAA 
GATTTGCTGG GCAAAGGCTG GAATGTGGTC AACGGTATTT CCATTGCCTT TGTGCTCTAT 
ATCCTGACCT ATGCCTATAT TTCTGCCAGT GGTTCAATTC TGCATCACAC CTTCGCAGAG 
ATGTCGCTAA ACGTCCCGGC ACGGGCGGCG GGTTTTGGTT TTGCACTGCT GGTAGCGTTT 
GTGGTGTGGT TGAGTACTAA GGCCGTCAGC CGCATGACGG CGATTGTGCT GGGGGCGAAA 
GTCATTACCT TCTTCCTCAC CTTTGGCAGC CTGTTGGGGC ATGTGCAGCC TGCGACATTG 
TTCAACGTTG CAGAAAGCAA TGCATCTTAT GCGCCGTATC TGCTGATGAC ATTGCCGTTC 
TGCCTGGCGT CGTTTGGTTA TCACGGTAAC GTGCCAAGCC TGATGAAGTA TTACGGCAAA 
GATCCGAAAA CCATCGTGAA ATGCCTGGTG TACGGTACGC TGATGGCACT GGCGCTGTAT 
ACCATCTGGT TGCTGGCGAC GATGGGCAAC ATTCCTCGTC CGGAGTTTAT TGGCATCGCC 
GAGAAGGGCG GTAACATTGA TGTGCTGGTA CAGGCATTAA GTGGCGTGCT GAACAGCCGT 
AGCCTGGACC TTCTGCTGGT CGTGTTCTCA AACTTTGCGG TAGCGAGTTC GTTCCTTGGC 
GTAACGCTGG GTTTGTTTGA CTATCTGGCA GATCTGTTTG GTTTCGATGA CTCAGCTGTG 
GGCCGCTTGA AAACGGCATT GCTGACCTTT GCCCCGCCAG TTGTGGGGGG GCTGCTGTTC 
CCGAACGGAT TCCTGTACGC CATTGGTTAT GCTGGTTTAG CGGCTACCAT CTGGGCGGCA 
ATTGTTCCGG CGCTGTTAGC CCGTGCATCG CGTAAACGCT TTGGCAGCCC GAAATTCCGT 
GTCTGGGGCG GCAAGCCGAT GATTACGCTG ATTCTGGTGT TTGGCGTTGG CAACGCACTG 
GTCCATATCT TATCGAGCTT TAATTTGCTG CCGGTGTATC AGTAA

Protein sequence

MATLTTTQTS PSLLGGVVII GGTIIGAGMF SLPVVMSGAW FFWSMAALIF TWFCMLHSGL 
MILEANLNYR IGSSFDTITK DLLGKGWNVV NGISIAFVLY ILTYAYISAS GSILHHTFAE 
MSLNVPARAA GFGFALLVAF VVWLSTKAVS RMTAIVLGAK VITFFLTFGS LLGHVQPATL 
FNVAESNASY APYLLMTLPF CLASFGYHGN VPSLMKYYGK DPKTIVKCLV YGTLMALALY 
TIWLLATMGN IPRPEFIGIA EKGGNIDVLV QALSGVLNSR SLDLLLVVFS NFAVASSFLG 
VTLGLFDYLA DLFGFDDSAV GRLKTALLTF APPVVGGLLF PNGFLYAIGY AGLAATIWAA 
IVPALLARAS RKRFGSPKFR VWGGKPMITL ILVFGVGNAL VHILSSFNLL PVYQ