Gene EcolC_4245 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4245
Symbol
ID	6067948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4694705
End bp	4696210
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	51%
IMG OID	641603682
Product	D-ribose transporter ATP binding protein
Protein accession	YP_001727168
Protein GI	170022214
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0036959
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGAAGCAT TACTTCAGCT TAAAGGCATC GATAAAGCCT TCCCGGGCGT AAAAGCCCTC 
TCGGGCGCAG CGTTAAATGT CTATCCGGGC CGCGTGATGG CGCTGGTGGG CGAAAACGGC 
GCGGGTAAAT CCACCATGAT GAAAGTGCTT ACTGGTATCT ATGCTCGCGA TGCCGGCACG 
CTTTTATGGC TGGGGAAAGA AACGACATTT ACCGGGCCGA AATCTTCCCA GGAAGCCGGG 
ATTGGGATTA TCCATCAGGA ACTGAACCTG ATCCCGCAGT TGACCATTGC CGAAAACATT 
TTCCTCGGTC GTGAGTTTGT TAATCGCTTT GGCAAAATTG ACTGGAAAAC CATGTATGCC 
GAAGCGGATA AATTGCTGGC TAAACTTAAC CTGCGCTTTA AAAGCGACAA GCTGGTGGGC 
GATCTTTCCA TCGGTGACCA GCAAATGGTT GAAATCGCCA AAGTGCTGAG CTTTGAGTCG 
AAAGTCATCA TTATGGATGA ACCGACCGAT GCGCTGACCG ATACCGAAAC CGAATCCCTG 
TTCCGCGTCA TCCGCGAGCT GAAATCGCAA GGCCGCGGTA TTGTCTATAT CTCCCACCGC 
ATGAAAGAAA TCTTCGAGAT TTGCGATGAC GTTACCGTTT TTCGTGATGG GCAATTTATT 
GCTGAGCGCG AAGTGGCATC ACTGACCGAA GATTCGCTGA TTGAGATGAT GGTGGGTCGC 
AAGCTGGAAG ATCAATATCC GCACCTGGAC AAAGCGCCGG GAGATATCCG CCTGAAAGTC 
GATAATCTCT GCGGACCTGG CGTTAACGAT GTCTCTTTTA CTTTACGCAA AGGCGAAATT 
CTTGGCGTCT CTGGTTTGAT GGGCGCAGGT CGTACCGAAC TGATGAAAGT GCTCTACGGC 
GCACTACCGC GCACCAGCGG TTACGTCACC CTGGATGGGC ATGAAGTCGT TACCCGTTCA 
CCGCAGGATG GCTTGGCAAA CGGCATTGTG TATATCTCCG AAGACCGTAA ACGTGACGGT 
TTAGTGTTGG GCATGCCAGT AAAAGAGAAC ATGTCGCTGA CAGCGCTGCG CTACTTCAGC 
CGCGCTGGCG GCAGTTTGAA GCATGCCGAT GAACAGCAGG CTGTGAGTGA TTTCATTCGT 
CTGTTTAATG TGAAAACTCC GTCGATGGAA CAGGCAATTG GTCTGCTTTC CGGTGGCAAT 
CAGCAAAAAG TGGCGATTGC CCGCGGTCTG ATGACACGCC CCAAAGTGTT GATCCTTGAT 
GAACCTACCC GTGGCGTAGA TGTCGGCGCG AAAAAAGAGA TCTATCAACT GATTAACCAG 
TTCAAAGCCG ATGGCTTGAG CATCATTCTG GTGTCATCGG AGATGCCAGA AGTATTAGGC 
ATGAGCGATC GCATCATCGT CATGCATGAA GGGCATCTCA GCGGGGAATT TACTCGTGAG 
CAGGCCACCC AGGAAGTGTT AATGGCTGCC GCTGTGGGCA AGCTTAATCG CGTGAATCAG 
GAGTAA

Protein sequence

MEALLQLKGI DKAFPGVKAL SGAALNVYPG RVMALVGENG AGKSTMMKVL TGIYARDAGT 
LLWLGKETTF TGPKSSQEAG IGIIHQELNL IPQLTIAENI FLGREFVNRF GKIDWKTMYA 
EADKLLAKLN LRFKSDKLVG DLSIGDQQMV EIAKVLSFES KVIIMDEPTD ALTDTETESL 
FRVIRELKSQ GRGIVYISHR MKEIFEICDD VTVFRDGQFI AEREVASLTE DSLIEMMVGR 
KLEDQYPHLD KAPGDIRLKV DNLCGPGVND VSFTLRKGEI LGVSGLMGAG RTELMKVLYG 
ALPRTSGYVT LDGHEVVTRS PQDGLANGIV YISEDRKRDG LVLGMPVKEN MSLTALRYFS 
RAGGSLKHAD EQQAVSDFIR LFNVKTPSME QAIGLLSGGN QQKVAIARGL MTRPKVLILD 
EPTRGVDVGA KKEIYQLINQ FKADGLSIIL VSSEMPEVLG MSDRIIVMHE GHLSGEFTRE 
QATQEVLMAA AVGKLNRVNQ E