Gene EcHS_A3864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3864
Symbol	gltS
ID	5593010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3857043
End bp	3858248
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	54%
IMG OID	640922974
Product	sodium/glutamate symporter
Protein accession	YP_001460452
Protein GI	157163134
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0786] Na+/glutamate symporter
TIGRFAM ID	[TIGR00210] sodium--glutamate symport carrier (gltS)

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCATC TCGATACTTT AGCAACGCTT GTTGCCGCAA CGCTGACGTT GCTGCTCGGG 
CGTAAGTTGG TCCATTCCGT CTCCTTTTTG AAGAAATACA CCATACCGGA ACCTGTTGCG 
GGTGGTTTGT TGGTGGCGCT AGCGCTACTG GTACTGAAAA AAAGCATGGG CTGGGAAGTC 
AACTTTGATA TGTCCCTGCG CGATCCGTTA ATGCTGGCTT TCTTCGCCAC CATTGGCCTG 
AACGCCAACA TTGCCAGTTT GCGTGCCGGT GGGCGTGTGG TTGGCATCTT CTTGATTGTG 
GTTGTTGGTC TGTTGGTGAT GCAAAATGCC ATTGGCATTG GTATGGCTAG CCTGTTAGGG 
CTTGATCCGC TGATGGGGCT GTTGGCCGGT TCTATTACGC TTTCCGGCGG TCACGGTACG 
GGCGCTGCGT GGAGTAAATT GTTCATTGAA CGTTATGGCT TCACCAATGC GACAGAAGTG 
GCGATGGCCT GTGCAACGTT CGGTTTGGTG CTGGGCGGCT TGATTGGCGG TCCGGTAGCG 
CGCTATCTGG TGAAACACTC CACCACGCCG AACGGTATTC CGGATGACCA GGAAGTCCCG 
ACGGCGTTTG AAAAGCCGGA TGTGGGCCGC ATGATCACCT CGTTGGTGCT GATTGAAACT 
ATCGCGCTGA TTGCTATCTG CCTGACGGTG GGGAAAATTG TTGCGCAACT TTTGGCTGGC 
ACTGCTTTTG AACTGCCGAC CTTCGTCTGT GTACTGTTTG TTGGCGTGAT TCTGAGCAAC 
GGTCTGTCAA TGATGGGCTT TTACCGCGTC TTTGAGCGTG CGGTATCCGT GCTGGGTAAC 
GTAAGCTTGT CGTTGTTCCT GGCGATGGCG TTGATGGGGC TGAAACTGTG GGAGCTGGCT 
TCGCTGGCGC TGCCGATGCT GGCGATTCTG GTGGTACAGA CCATCTTCAT GGCGTTGTAT 
GCCATCTTCG TTACCTGGCG CATGATGGGC AAAAACTACG ATGCGGCAGT GCTGGCTGCG 
GGTCACTGTG GTTTTGGCCT CGGTGCAACG CCAACGGCAA TCGCCAACAT GCAGGCGATC 
ACTGAACGTT TTGGCCCGTC GCACATGGCG TTTTTGGTGG TGCCGATGGT CGGTGCGTTC 
TTTATCGATA TCGTCAATGC GCTGGTAATT AAGTTGTATT TGATGTTGCC GATTTTTGCC 
GGTTAA

Protein sequence

MFHLDTLATL VAATLTLLLG RKLVHSVSFL KKYTIPEPVA GGLLVALALL VLKKSMGWEV 
NFDMSLRDPL MLAFFATIGL NANIASLRAG GRVVGIFLIV VVGLLVMQNA IGIGMASLLG 
LDPLMGLLAG SITLSGGHGT GAAWSKLFIE RYGFTNATEV AMACATFGLV LGGLIGGPVA 
RYLVKHSTTP NGIPDDQEVP TAFEKPDVGR MITSLVLIET IALIAICLTV GKIVAQLLAG 
TAFELPTFVC VLFVGVILSN GLSMMGFYRV FERAVSVLGN VSLSLFLAMA LMGLKLWELA 
SLALPMLAIL VVQTIFMALY AIFVTWRMMG KNYDAAVLAA GHCGFGLGAT PTAIANMQAI 
TERFGPSHMA FLVVPMVGAF FIDIVNALVI KLYLMLPIFA G