Gene EcolC_4135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4135
Symbol
ID	6066227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4560764
End bp	4562113
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	46%
IMG OID	641603556
Product	general substrate transporter
Protein accession	YP_001727059
Protein GI	170022105
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA AGTTACCCGC ACCGCGTGAA GGGCTTTCCG GTAAAGCCAT GAGACGTGTC 
GTTATGGGCA GTTTCGCAGG CGCGTTAATG GAATGGTATG ACTTCTTTAT TTTTGGCACG 
GCAGCAGGAC TGGTATTTGC ACCGCTGTTT TATCCAGACA GCGATCCTTT TATAGGTCTT 
ATAGCCGCCT TTGCTACCTT TGGCGTTGGT TTTTTGACCC GTCCTTTAGG TGGTATCGTC 
TTTGGCCATT TTGGCGATAA AATTGGGCGA AAAATAACAC TTATCTGGAC ACTGGCTATT 
GTCGGTTGCT CCACATTTTT GATTGGTTTT ATTCCGACGT ATCAGGAAAT TGGGATCTGG 
GCACCGCTCA TATTAATGGC GCTGCGTTTA ATTCAGGGCT TTGGTCTTGG TGGCGAGTAT 
GGCGGAGCGG CATTGATGAC CATAGAATCA GCGCCCGAAT CCCGACGCGG ATTTTTAGGT 
TCACTCCCGC AAACGGCTGC GTCTGTGGGT ATTATGCTGG CAACCGGTAT TTTTGCTCTC 
TGTAACCATT TTCTTACTTC GGAGCAGTTT CTCTCCTGGG GATGGCGCAT TCCGTTTTGG 
CTTTCTGCGG TGATGTTGAT CGTTGGGCTG TTTATCCGCC TGCATACCGA AGAAACGCTG 
GATTTTCAAA AGCAAAAAAC GACGAATAAT AAAGAAAAGT CCGTTCCTCC GTTGATTGAA 
TTATTCAAAA AACATCCACG AAATATTTTA TTGGCACTGG GTGCGAGGCT GGCGGAAAGT 
GTCTCCTCTA ATATTATTAA CGCCTTTGGT ATTGTCTATA TTTCCAGCCA ATTAGCATTG 
TCGCGAGATA TTCCCCTGAC GGGTATGTTG ATTGCCTCGG CGATCGGTAT TTTCAGTTGT 
CCATTGGTTG GATGGTTATC AGATCGTATA GGTCAAAAAA GTCTGTATTT GTCGGGAGCA 
GGATTTTGTG TCCTGTTCGC GTTTCCTTTC TTCTTATTAC TGGATAGCAA AAGTACGCTC 
ATCATCTGGT GCAGTATGAT CCTCGGCTAC AACTTAGGTC CGACGATGAT GTTTGCCGTG 
CAGCCAACAC TTTTCACCCG CATGTTCGGT ACCAAAGTAC GATATACCGG CCTTTCTTTT 
GCTTATCAAT TTTCCGCGAT TCTTGGCGGA CTAAGCCCCC TTATCGCCTC AAGTTTGCTG 
GCGCTAGGGG GAGGAAAACC GTGGTATGTC GCTCTGTTTT TATTTGCTGT CTCAGTTCTT 
TCCTTTGTTT GCATCTGGCT GATTGAGCCG ACCGATGAAC AAGAAACCGC TTCTTACCGC 
TACATCAGGG AACAATCTCA TGAAAACTGA

Protein sequence

MSEKLPAPRE GLSGKAMRRV VMGSFAGALM EWYDFFIFGT AAGLVFAPLF YPDSDPFIGL 
IAAFATFGVG FLTRPLGGIV FGHFGDKIGR KITLIWTLAI VGCSTFLIGF IPTYQEIGIW 
APLILMALRL IQGFGLGGEY GGAALMTIES APESRRGFLG SLPQTAASVG IMLATGIFAL 
CNHFLTSEQF LSWGWRIPFW LSAVMLIVGL FIRLHTEETL DFQKQKTTNN KEKSVPPLIE 
LFKKHPRNIL LALGARLAES VSSNIINAFG IVYISSQLAL SRDIPLTGML IASAIGIFSC 
PLVGWLSDRI GQKSLYLSGA GFCVLFAFPF FLLLDSKSTL IIWCSMILGY NLGPTMMFAV 
QPTLFTRMFG TKVRYTGLSF AYQFSAILGG LSPLIASSLL ALGGGKPWYV ALFLFAVSVL 
SFVCIWLIEP TDEQETASYR YIREQSHEN