Gene EcSMS35_4540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4540
Symbol	gltP
ID	6147026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4640539
End bp	4641852
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	53%
IMG OID	641619356
Product	glutamate/aspartate:proton symporter
Protein accession	YP_001746468
Protein GI	170684035
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA TAAAATTCAG CCTGGCCTGG CAGATTCTGT TTGCTATGGT GCTGGGCATT 
CTCCTGGGAA GCTACCTGCA CTACCATAGC GACAGTCGCG ACTGGCTGGT CGTCAATTTG 
CTCTCTCCGG CGGGTGATAT CTTCATCCAT CTGATCAAAA TGATTGTTGT GCCGATTGTG 
ATCTCCACGC TGGTGGTGGG TATCGCGGGT GTTGGTGATG CCAAACAGCT CGGGCGTATT 
GGCGCGAAAA CCATTATTTA CTTCGAGGTG ATCACCACCG TCGCCATCAT TTTGGGGATT 
ACTCTGGCGA ACGTCTTCCA GCCCGGTGCC GGGGTGGATA TGTCGCAGCT GGCGACCGTC 
GATATCTCGA AATATCAGAG CACTACGGAA GCGGTACAAA GCAGTTCCCA CGGCATTATG 
GGCACGATTT TGTCGCTGGT GCCGACGAAC ATTGTGGCGT CGATGGCGAA AGGCGAAATG 
CTGCCGATCA TCTTCTTCTC GGTGCTGTTT GGTCTGGGGC TTTCATCCCT GCCCGCGACG 
CATCGTGAAC CGCTGGTGAC CGTGTTCCGC TCCATCTCTG AAACCATGTT TAAAGTGACT 
CACATGGTGA TGCGTTATGC ACCGGTGGGT GTGTTTGCGC TGATTGCGGT GACGGTGGCT 
AACTTTGGTT TCTCTTCTCT GTGGCCACTG GCGAAACTGG TGCTGCTGGT GCATTTCGCC 
ATTCTGTTCT TCGCGCTGGT AGTGCTGGGA ATTGTGGCGC GCCTGTGCGG GTTAAGCGTC 
TGGATCCTGA TTCGTATTCT GAAAGATGAG CTGATTCTGG CGTACTCCAC TGCCAGTTCT 
GAAAGCGTGC TGCCGCGAAT TATTGAGAAG ATGGAAGCCT ACGGTGCACC GGCGTCGATC 
ACCAGTTTCG TGGTGCCGAC CGGTTACTCT TTTAACCTTG ATGGTTCGAC GCTGTATCAA 
AGTATTGCCG CTATTTTCAT CGCGCAGTTG TATGGCATTG ACCTGTCCAT CTGGCAGGAA 
ATCATTCTGG TGCTGACGCT GATGGTGACC TCGAAAGGGA TTGCTGGCGT GCCGGGCGTG 
TCGTTTGTGG TGCTGCTGGC AACGCTGGGT AGCGTAGGTA TTCCGCTGGA AGGTCTGGCA 
TTTATTGCCG GTGTTGACCG TATCCTCGAT ATGGCGCGTA CTGCGCTGAA CGTGGTGGGT 
AATGCGCTGG CGGTGCTGGT GATTGCCAAG TGGGAACACA AATTTGACCG TAAGAAAGCG 
CTGGCTTATG AGCGCGAAGT GCTGGGCAAA TTTGATAAAA CTGCGGATCA ATAA

Protein sequence

MKNIKFSLAW QILFAMVLGI LLGSYLHYHS DSRDWLVVNL LSPAGDIFIH LIKMIVVPIV 
ISTLVVGIAG VGDAKQLGRI GAKTIIYFEV ITTVAIILGI TLANVFQPGA GVDMSQLATV 
DISKYQSTTE AVQSSSHGIM GTILSLVPTN IVASMAKGEM LPIIFFSVLF GLGLSSLPAT 
HREPLVTVFR SISETMFKVT HMVMRYAPVG VFALIAVTVA NFGFSSLWPL AKLVLLVHFA 
ILFFALVVLG IVARLCGLSV WILIRILKDE LILAYSTASS ESVLPRIIEK MEAYGAPASI 
TSFVVPTGYS FNLDGSTLYQ SIAAIFIAQL YGIDLSIWQE IILVLTLMVT SKGIAGVPGV 
SFVVLLATLG SVGIPLEGLA FIAGVDRILD MARTALNVVG NALAVLVIAK WEHKFDRKKA 
LAYEREVLGK FDKTADQ