Gene EcSMS35_4860 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4860
Symbol	cglT
ID	6147094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4967724
End bp	4968992
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	47%
IMG OID	641619664
Product	major facilitator family protein CglT
Protein accession	YP_001746771
Protein GI	170682292
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.997387
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGTA ACTGGAAACG TTGGATCACG CTGGCGTTAT GTGGTATTGC CGGAAGTGCA 
ATATATAAAT TGCCTTATTT ACGGGAAACC TATTACGACG CGATGCAGCA GGCTACAGGA 
GCGACTAATG CTGAACTTGG TTTTCTAATG ACAGCCTATG GTCTGGTGAA CTTTTTATTA 
TATCTACCTG GCGGTTGGGC TGCCGATAGA TTTTCTGCAC GTAAATTAAT GACCTTTTCA 
TTAATTTCCA CCGGGATAAG TGGTTTTTAT TATGCGACCT TCCCCTCGTA TACTATGATC 
TGTTTGTTAC ATGCACTTTG GGCTGTTACA ACCGTATTTA CGTTTTGGGC CGTGTGTGTG 
CGAATTATTC GTACCCTGGG AACCAGCGAA GAACAAGGTC GCTTATACGG TTACTGGTTT 
CTGGGTAAGG GATTAACCTC CATTGTACTG GGATTTCTTT CCGTGCCGGT ATTTGCCAAA 
TTTGGCGAAG GTGTTGATGG TTTACGGGCG ACAATTATTT TTTATTCCGT AGTGACTATT 
CTGGCCGGTG TTTTAGCCTG GTTTGTTTGT CAGGATGAAA CGCACAGCGA AGATAAAGCG 
AATTTCCGTC TGGCAGATAT GGCATTCGTG CTGAAAATGC CGACGGTTTG GCTGGCAGGT 
GTTGTGACCT TTTGTATGTG GTCAATTTAT ATCGGCTTTG GCATGGTCAC GCCGTATCTC 
ACGCAGATCC TGCATATGGG CGAATCGGAA GTGGCAGTTG CCAGTATTCT TCGCGCCTAT 
GTGTTATTTG CGATGGGGGG ATTAATTGGC GGACAACTGG CCGACCGCTG TGCGTCACGC 
ACGCGTTTTA TGATTTACGC CTTTATCGGC ATGATTGTCT TTACTACCGT TTATTTCTTC 
CTGCCCGGTG AGTCGCGCTA CGTCACTATT GCGCTGGCGA ATATGGTTGC GTTGGGCGTG 
TTTATTTACT CTGCGAATGC CGTGTTCTTC TCAATTATTG ATGAGATTCG GATCCCGGCA 
AAAGTCACAG GGACTGCTGC GGGTCTGATC TCTTTACTGA CCTATTTCCC GGAAATCTAC 
TGCTACACGA TGGTGGGCAA TATGGTCGAC CGCAAACCGG GTATTGCCGG TTATCAGGAT 
GTTTTCCTGT TCATGTTGGT TTGCGCATTC ATCGGCCTTA TCGCCGCACT GGTCCTCCAG 
CGTGTGAATC GTAAAAGTAA AAATCAAGTC AATGAAATCA CTGAAAACAA TGCGGATTGC 
GCATCCTGA

Protein sequence

MTSNWKRWIT LALCGIAGSA IYKLPYLRET YYDAMQQATG ATNAELGFLM TAYGLVNFLL 
YLPGGWAADR FSARKLMTFS LISTGISGFY YATFPSYTMI CLLHALWAVT TVFTFWAVCV 
RIIRTLGTSE EQGRLYGYWF LGKGLTSIVL GFLSVPVFAK FGEGVDGLRA TIIFYSVVTI 
LAGVLAWFVC QDETHSEDKA NFRLADMAFV LKMPTVWLAG VVTFCMWSIY IGFGMVTPYL 
TQILHMGESE VAVASILRAY VLFAMGGLIG GQLADRCASR TRFMIYAFIG MIVFTTVYFF 
LPGESRYVTI ALANMVALGV FIYSANAVFF SIIDEIRIPA KVTGTAAGLI SLLTYFPEIY 
CYTMVGNMVD RKPGIAGYQD VFLFMLVCAF IGLIAALVLQ RVNRKSKNQV NEITENNADC 
AS