Gene EcSMS35_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3988
Symbol	gltS
ID	6145498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4065349
End bp	4066554
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	54%
IMG OID	641618814
Product	sodium/glutamate symporter
Protein accession	YP_001745953
Protein GI	170682521
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0786] Na+/glutamate symporter
TIGRFAM ID	[TIGR00210] sodium--glutamate symport carrier (gltS)

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCATC TCGATACTTT AGCAACGCTT GTTGCCGCAA CGCTGACGTT GCTGCTCGGG 
CGCAAGTTGG TCCATTCCGT CTCCTTTTTG AAGAAATACA CCATACCGGA ACCTGTTGCG 
GGTGGTTTAT TAGTGGCGCT GGCGCTGCTG ATACTGAAAA AAAGCATGGG CTGGGAAGTC 
AACTTTGATA TGTCCCTGCG CGATCCGTTG ATGCTGGCTT TCTTCGCCAC CATTGGCCTG 
AACGCCAACA TTGCCAGTTT GCGTGCCGGT GGGCGTGTGG TTGGCATCTT CTTGATTGTG 
GTTGTTGGCC TGTTGGTGAT GCAAAATGCC ATTGGCATTG GTATGGCTAG CCTGTTAGGG 
CTTGATCCGC TGATGGGGCT GTTGGCCGGT TCTATTACGC TTTCCGGCGG TCACGGTACG 
GGAGCTGCAT GGAGTAAATT GTTCATTGAA CGTTATGGCT TCACCAATGC GACAGAAGTG 
GCGATGGCCT GTGCAACGTT CGGTTTGGTG CTGGGCGGCT TGATTGGCGG TCCGGTGGCA 
CGCTATCTGG TGAAACACTC CACCACACCG AACGGTATTC CGGATGACCA GGAAGTTCCG 
ACCGCGTTCG AAAAGCCGGA TGTGGGCCGC ATGATCACCT CGCTGGTGTT GATTGAAACT 
ATCGCGCTGA TTGCTATCTG CCTGACGGTG GGGAAAATTG TTGCGCAACT TTTGGCTGGT 
ACTGCTTTTG AACTACCGAC CTTCGTCTGT GTACTATTTG TTGGCGTGAT TCTGAGCAAC 
GGTCTGTCAA TGATGGGCTT TTACCGCGTC TTTGAGCGAG CGGTATCCGT GCTGGGTAAC 
GTAAGCCTGT CGTTGTTCCT GGCGATGGCG TTGATGGGGC TGAAACTGTG GGAGCTGGCT 
TCGCTGGCGC TGCCGATGCT GGCGATTCTG GTGGTACAGA CCATCTTCAT GGCGTTGTAT 
GCCATCTTCG TTACCTGGCG CATGATGGGC AAAAACTACG ATGCGGCAGT GCTGGCTGCG 
GGTCACTGTG GCTTTGGCCT TGGCGCAACG CCAACAGCAA TCGCCAACAT GCAGGCGATC 
ACTGAACGCT TTGGCCCGTC GCACATGGCG TTCCTGGTAG TGCCGATGGT CGGTGCGTTC 
TTTATCGATA TCGTCAATGC GCTGGTGATT AAGCTGTATT TGATGTTGCC GATTTTTGCC 
GGTTAA

Protein sequence

MFHLDTLATL VAATLTLLLG RKLVHSVSFL KKYTIPEPVA GGLLVALALL ILKKSMGWEV 
NFDMSLRDPL MLAFFATIGL NANIASLRAG GRVVGIFLIV VVGLLVMQNA IGIGMASLLG 
LDPLMGLLAG SITLSGGHGT GAAWSKLFIE RYGFTNATEV AMACATFGLV LGGLIGGPVA 
RYLVKHSTTP NGIPDDQEVP TAFEKPDVGR MITSLVLIET IALIAICLTV GKIVAQLLAG 
TAFELPTFVC VLFVGVILSN GLSMMGFYRV FERAVSVLGN VSLSLFLAMA LMGLKLWELA 
SLALPMLAIL VVQTIFMALY AIFVTWRMMG KNYDAAVLAA GHCGFGLGAT PTAIANMQAI 
TERFGPSHMA FLVVPMVGAF FIDIVNALVI KLYLMLPIFA G