Gene EcolC_3950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3950
Symbol	gltP
ID	6064465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4338055
End bp	4339368
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	53%
IMG OID	641603363
Product	glutamate/aspartate:proton symporter
Protein accession	YP_001726878
Protein GI	170021924
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA TAAAATTCAG CCTGGCCTGG CAGATTCTGT TTGCTATGGT GCTGGGCATT 
CTCCTGGGAA GCTACCTGCA CTACCATAGC GACAGCCGCG ACTGGCTGGT CGTCAATTTG 
CTCTCTCCGG CGGGTGATAT CTTCATCCAT CTGATCAAAA TGATTGTTGT GCCGATTGTG 
ATCTCCACGC TGGTGGTGGG TATCGCGGGT GTTGGTGATG CCAAACAGCT CGGGCGTATT 
GGCGCGAAAA CCATTATTTA CTTCGAGGTG ATAACCACCG TCGCCATCAT TTTGGGGATC 
ACTCTGGCGA ACGTCTTCCA GCCCGGTGCC GGGGTGGATA TGTCGCAGCT GGCGACCGTC 
GATATCTCGA AATATCAGAG CACTACGGAA GCGGTACAAA GCAGTTCCCA CGGCATTATG 
GGCACGATTT TGTCGCTGGT GCCGACGAAC ATTGTGGCGT CGATGGCGAA AGGCGAAATG 
CTGCCGATCA TCTTCTTCTC GGTGCTGTTT GGTCTGGGGC TTTCCTCCCT GCCCGCGACG 
CATCGTGAAC CGCTGGTGAC CGTGTTCCGC TCCATCTCTG AAACCATGTT TAAAGTGACT 
CACATGGTGA TGCGTTATGC ACCGGTGGGT GTGTTTGCGC TGATTGCGGT GACGGTGGCT 
AACTTTGGTT TCTCTTCTCT GTGGCCACTG GCGAAACTGG TGTTGCTGGT GCATTTCGCC 
ATTCTGTTCT TCGCGCTGGT AGTGCTGGGA ATTGTGGCGC GCCTGTGCGG GTTAAGCGTC 
TGGATCCTGA TTCGTATTCT GAAAGATGAG CTGATTCTGG CGTACTCCAC TGCCAGCTCT 
GAAAGCGTAC TGCCGCGAAT TATTGAGAAG ATGGAAGCCT ACGGAGCACC GGCGTCGATC 
ACCAGCTTTG TGGTGCCGAC CGGTTACTCT TTTAACCTTG ATGGTTCGAC GCTGTATCAA 
AGTATTGCCG CTATTTTCAT CGCTCAGCTG TATGGCATTG ACCTGTCCAT CTGGCAGGAA 
ATCATTCTGG TGCTGACGCT GATGGTGACC TCGAAAGGGA TTGCTGGCGT GCCGGGCGTG 
TCGTTTGTGG TGTTGCTGGC AACGCTGGGT AGCGTAGGTA TTCCGCTAGA AGGTCTGGCG 
TTTATTGCCG GTGTTGACCG TATCCTCGAC ATGGCGCGTA CTGCGCTGAA CGTTGTGGGT 
AATGCGCTGG CGGTGCTGGT GATTGCCAAG TGGGAACACA AATTTGACCG CAAAAAGGCG 
CTGGCTTATG AGCGTGAAGT GCTGGGTAAA TTTGATAAAA CTGCGGATCA ATAA

Protein sequence

MKNIKFSLAW QILFAMVLGI LLGSYLHYHS DSRDWLVVNL LSPAGDIFIH LIKMIVVPIV 
ISTLVVGIAG VGDAKQLGRI GAKTIIYFEV ITTVAIILGI TLANVFQPGA GVDMSQLATV 
DISKYQSTTE AVQSSSHGIM GTILSLVPTN IVASMAKGEM LPIIFFSVLF GLGLSSLPAT 
HREPLVTVFR SISETMFKVT HMVMRYAPVG VFALIAVTVA NFGFSSLWPL AKLVLLVHFA 
ILFFALVVLG IVARLCGLSV WILIRILKDE LILAYSTASS ESVLPRIIEK MEAYGAPASI 
TSFVVPTGYS FNLDGSTLYQ SIAAIFIAQL YGIDLSIWQE IILVLTLMVT SKGIAGVPGV 
SFVVLLATLG SVGIPLEGLA FIAGVDRILD MARTALNVVG NALAVLVIAK WEHKFDRKKA 
LAYEREVLGK FDKTADQ