Gene EcolC_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1940
Symbol
ID	6068548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2142914
End bp	2144179
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	45%
IMG OID	641601351
Product	major facilitator transporter
Protein accession	YP_001724913
Protein GI	170019959
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00090025
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTCAAA ATAAGGCTTT CAGCACGCCA TTTATCCTGG CTGTTCTTTG TATTTACTTC 
AGCTACTTCC TGCACGGCAT TAGTGTTATT ACGCTTGCCC AAAATATGTC ATCTCTGGCG 
GAAAAGTTTT CCACTGACAA CGCGGGCATT GCCTACTTAA TTTCCGGTAT CGGTTTGGGG 
CGATTGATCA GTATTTTATT CTTCGGTGTG ATCTCCGATA AGTTTGGTCG TCGGGCGGTG 
ATATTAATGG CAGTAATAAT GTATCTGCTA TTCTTCTTTG GTATTCCCGC TTGCCCGAAT 
TTAACTCTCG CCTACGGTCT GGCAGTGTGC GTAGGTATCG CTAACTCAGC GCTGGATACG 
GGTGGCTACC CCGCGCTCAT GGAATGCTTT CCGAAAGCCT CTGGTTCGGC GGTCATACTG 
GTTAAAGCGA TGGTGTCATT TGGGCAAATG TTCTACCCAA TGCTGGTGAG CTATATGTTG 
CTCAATAATA TCTGGTACGG CTATGGGCTG ATTATTCCGG GTATTCTATT TGTACTGATC 
ACGCTGATGC TGTTGAAAAG CAAATTCCCC AGCCAGTTGG TGGACGCCAG CGTAACTAAT 
GAATTACCGC AAATGAACAG CAAACCGTTA GTCTGGCTGG AAGGTGTTTC ATCGGTACTG 
TTCGGTGTAG CCGCATTCTC GACCTTTTAT GTGATTGTGG TGTGGATGCC CAAATATGCG 
ATGGCTTTTG CTGGTATGTC AGAAGCTGAG GCATTAAAAA CCATCTCTTA TTACAGTATG 
GGCTCGTTGG TCTGTGTCTT TATTTTTGCC GCACTACTGA AAAAAATGGT CCGGCCCATC 
TGGGCTAATG TATTTAACTC TGCACTGGCA ACAATAACAG CAGCCATTAT CTACCTGTAC 
CCTTCTCCAC TGGTGTGTAA TGCCGGCGCC TTTGTTATCG GTTTCTCAGC AGCTGGCGGC 
ATTTTACAGC TCGGTGTTTC GGTCATGTCA GAGTTTTTCC CAAAAAGCAA AGCCAAAGTC 
ACCAGTATTT ATATGATGAT GGGTGGACTG GCTAACTTTG TTATTCCGCT GATTACCGGT 
TATCTGTCGA ACATCGGCCT GCAATATATC ATTGTTCTCG ATTTTACTTT CGCGCTGCTG 
GCCCTGATTA CCGCAATTAT TGTTTTTATC CGCTATTACC GCGTTTTTAT TATTCCTGAG 
AATGATGTGC GGTTTGGCGA GCGCAAATTT AGCACCCGGT TAAACACAAT TAAGCATAGA 
GGTTAA

Protein sequence

MSQNKAFSTP FILAVLCIYF SYFLHGISVI TLAQNMSSLA EKFSTDNAGI AYLISGIGLG 
RLISILFFGV ISDKFGRRAV ILMAVIMYLL FFFGIPACPN LTLAYGLAVC VGIANSALDT 
GGYPALMECF PKASGSAVIL VKAMVSFGQM FYPMLVSYML LNNIWYGYGL IIPGILFVLI 
TLMLLKSKFP SQLVDASVTN ELPQMNSKPL VWLEGVSSVL FGVAAFSTFY VIVVWMPKYA 
MAFAGMSEAE ALKTISYYSM GSLVCVFIFA ALLKKMVRPI WANVFNSALA TITAAIIYLY 
PSPLVCNAGA FVIGFSAAGG ILQLGVSVMS EFFPKSKAKV TSIYMMMGGL ANFVIPLITG 
YLSNIGLQYI IVLDFTFALL ALITAIIVFI RYYRVFIIPE NDVRFGERKF STRLNTIKHR 
G