Gene EcolC_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1863
Symbol
ID	6066677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2062711
End bp	2064069
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	45%
IMG OID	641601276
Product	major facilitator transporter
Protein accession	YP_001724838
Protein GI	170019884
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.369973
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000261137
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAACAAT ATGATCAAAT TGGCGCAAGA CTGGACCGCT TGCCTTTGGC CCGGTTTCAT 
TATCGTATAT TTGGTATAAT AAGCTTTAGT CTGTTATTAA CGGGGTTTTT GAGTTACTCA 
GGTAATGTCG TCTTAGCAAA GCTGGTAAGC AATGGATGGT CAAATAATTT CCTCAATGCC 
GCCTTTACCT CGGCATTAAT GTTTGGTTAT TTCATCGGCT CACTTACTGG TGGGTTTATT 
GGTGACTACT TTGGGCGGCG CAGGGCGTTT CGCATAAATC TTCTCATCGT CGGAATTGCT 
GCAACAGGGG CCGCTTTTGT CCCTGATATG TACTGGCTCA TTTTCTTTCG CTTCCTCATG 
GGAACAGGAA TGGGGGCGCT GATTATGGTT GGCTATGCCT CATTTACGGA GTTTATCCCC 
GCGACGGTGC GTGGAAAATG GTCCGCGCGG CTCTCATTTG TTGGTAACTG GTCGCCCATG 
CTATCTGCGG CGATAGGCGT GGTGGTTATC GCTTTTTTTA GTTGGCGGAT AATGTTTCTG 
TTGGGGGGTA TTGGCATACT GTTAGCCTGG CTTCTCTCAG GTAAATACTT TATTGAGTCG 
CCACGATGGC TGGCAGGGAA AGGGCAAATC GCCGGTGCAG AAAGCCAACT TCGTGAAGTA 
GAGCAGCAAA TTGAAAGAGA GAAGAGTATT CGTTTACCCC AGCTTACTTT GAACCAGAGC 
AACAGCAAGG TTAAGGTAAT CAAGGGTACC TTCTGGCTCC TGTTTAAAGG GGAAATGTTA 
CGACGTACAT TAGTCGCGAT TACTGTTTTA ATTGCAATGA ACATTTCGCT TTATACCATC 
ACCGTATGGA TACCGACCAT ATTTGTTAAC TCCGGCATTG ATGTCGATAA ATCAATATTA 
ATGACCGCTG TTATTATGAT TGGCGCTCCG GTAGGAATAT TTATTGCGGC ATTAATTATT 
GATCATTTTC CTCGTCGATT ATTTGGCTCC GCCTTACTTA TTATTATTGC CGTGTTAGGC 
TATATCTATT CAATTCAGAC TACAGAGTGG GCGATTTTAA TCTATGGTCT GGTGATGATC 
TTCTTTTTAT ACATGTATGT TTGCTTCGCG TCGGCGGTTT ATATCCCGGA GCTTTGGCCA 
ACGCATTTAC GCCTGCGCGG TTCGGGTTTC GTTAATGCCG TCGGACGGAT CGTCGCAGTT 
TTCACGCCCT ATGGCGTTGC GGCATTATTA ACACATTATG GGTCGATCAC GGTGTTTATG 
GTGCTTGGTG TCATGTTATT GCTCTGTGCG CTGGTTCTCT CCATTTTTGG CATCGAAACG 
CGGAAGGTGT CGTTGGAAGA GATTTCTGAG GTGAATTAA

Protein sequence

MEQYDQIGAR LDRLPLARFH YRIFGIISFS LLLTGFLSYS GNVVLAKLVS NGWSNNFLNA 
AFTSALMFGY FIGSLTGGFI GDYFGRRRAF RINLLIVGIA ATGAAFVPDM YWLIFFRFLM 
GTGMGALIMV GYASFTEFIP ATVRGKWSAR LSFVGNWSPM LSAAIGVVVI AFFSWRIMFL 
LGGIGILLAW LLSGKYFIES PRWLAGKGQI AGAESQLREV EQQIEREKSI RLPQLTLNQS 
NSKVKVIKGT FWLLFKGEML RRTLVAITVL IAMNISLYTI TVWIPTIFVN SGIDVDKSIL 
MTAVIMIGAP VGIFIAALII DHFPRRLFGS ALLIIIAVLG YIYSIQTTEW AILIYGLVMI 
FFLYMYVCFA SAVYIPELWP THLRLRGSGF VNAVGRIVAV FTPYGVAALL THYGSITVFM 
VLGVMLLLCA LVLSIFGIET RKVSLEEISE VN