Gene EcolC_0607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0607
Symbol
ID	6065014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	649396
End bp	650694
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	54%
IMG OID	641600013
Product	d-galactonate transporter
Protein accession	YP_001723610
Protein GI	170018656
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAA TTAAAGGGTT ACGTTGGTAT ATGATCGCAC TGGTGACGCT CGGCACCGTG 
CTTGGTTACC TGACGCGTAA CACTGTGGCG GCAGCTGCGC CAACTCTGAT GGAAGAGTTA 
AACATCTCCA CCCAACAGTA TTCCTATATC ATCGCAGCCT ATTCTGCTGC TTATACGGTC 
ATGCAACCGG TAGCAGGTTA TGTACTGGAT GTGCTGGGTA CGAAAATCGG TTATGCAATG 
TTTGCTGTGC TGTGGGCCGT GTTCTGTGGT GCAACCGCGC TGGCAGGTAG CTGGGGTGGC 
CTGGCTGTTG CTCGTGGTGC GGTCGGTGCC GCGGAAGCAG CGATGATCCC GGCGGGTCTG 
AAAGCCAGCT CCGAATGGTT CCCGGCGAAA GAGCGTTCCA TCGCAGTAGG CTACTTTAAC 
GTAGGTTCTT CGATTGGTGC GATGATTGCG CCGCCGCTGG TGGTATGGGC AATCGTAATG 
CACAGCTGGC AGATGGCATT TATCATCTCC GGTGCATTGA GCTTTATCTG GGCGATGGCA 
TGGCTGATTT TCTATAAACA TCCGCGCGAC CAGAAGCATC TGACCGATGA AGAACGCGAC 
TATATTATTA ATGGTCAGGA AGCCCAGCAC CAGGTGAGCA CGGCGAAGAA AATGTCCGTT 
GGTCAGATCC TGCGTAACCG TCAGTTCTGG GGTATCGCGC TGCCGCGTTT CCTGGCAGAA 
CCGGCCTGGG GTACTTTTAA CGCGTGGATC CCGCTGTTCA TGTTTAAAGT TTACGGCTTT 
AACCTGAAAG AGATCGCGAT GTTCGCCTGG ATGCCGATGC TGTTTGCTGA CCTCGGTTGT 
ATCCTCGGTG GTTACCTGCC GCCGCTGTTC CAGCGTTGGT TTGGTGTGAA CCTGATCGTT 
TCCCGTAAGA TGGTCGTAAC GCTGGGTGCA GTGCTGATGA TTGGCCCGGG TATGATCGGC 
CTGTTCACCA ACCCGTATGT CGCAATTATG CTGCTGTGTA TCGGTGGTTT TGCCCACCAG 
GCACTGTCTG GCGCGCTGAT TACGCTCTCT TCCGATGTGT TTGGTCGTAA CGAAGTGGCA 
ACGGCGAACG GTTTAACCGG GATGTCCGCA TGGCTGGCAA GTACGCTATT TGCGCTGGTT 
GTCGGTGCAC TGGCTGACAC CATCGGCTTC AGCCCGCTGT TCGCAGTACT GGCAGTGTTC 
GACCTGTTAG GTGCGCTGGT TATCTGGACC GTGTTGCAGA ACAAACCGGC GATTGAGGTG 
GCGCAGGAAA CACATAACGA TCCCGCACCG CAACATTAA

Protein sequence

MRKIKGLRWY MIALVTLGTV LGYLTRNTVA AAAPTLMEEL NISTQQYSYI IAAYSAAYTV 
MQPVAGYVLD VLGTKIGYAM FAVLWAVFCG ATALAGSWGG LAVARGAVGA AEAAMIPAGL 
KASSEWFPAK ERSIAVGYFN VGSSIGAMIA PPLVVWAIVM HSWQMAFIIS GALSFIWAMA 
WLIFYKHPRD QKHLTDEERD YIINGQEAQH QVSTAKKMSV GQILRNRQFW GIALPRFLAE 
PAWGTFNAWI PLFMFKVYGF NLKEIAMFAW MPMLFADLGC ILGGYLPPLF QRWFGVNLIV 
SRKMVVTLGA VLMIGPGMIG LFTNPYVAIM LLCIGGFAHQ ALSGALITLS SDVFGRNEVA 
TANGLTGMSA WLASTLFALV VGALADTIGF SPLFAVLAVF DLLGALVIWT VLQNKPAIEV 
AQETHNDPAP QH