Gene EcolC_4273 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4273
Symbol
ID	6068073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4726285
End bp	4727697
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	49%
IMG OID	641603710
Product	glycoside hydrolase family protein
Protein accession	YP_001727196
Protein GI	170022242
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAT TTCCAGAAAC ATTTCTTTGG GGTGGCGCAA CAGCTGCCAA TCAGGTGGAA 
GGTGCCTGGC AGGAAGATGG CAAAGGGATC TCGACCTCAG ATTTACAGCC TCATGGCGTA 
ATGGGAAAAA TGGAACCGCG CATCCTGGGG AAAGAGAATA TCAAAGATGT CGCCATCGAT 
TTTTATCACC GTTACCCGGA AGATATCGCG TTATTTGCCG AGATGGGCTT CACCTGTCTG 
CGTATTTCCA TTGCCTGGGC GCGAATTTTC CCTCAGGGCG ACGAAGTCGA ACCGAATGAA 
GCGGGGTTAG CGTTTTACGA TCGGCTGTTT GATGAAATGG CGCAGGCGGG GATCAAGCCG 
CTGGTAACGT TATCCCATTA CGAAATGCCA TATGGGCTGG TGAAAAACTA CGGCGGTTGG 
GCTAATCGAG CGGTCATCGA TCACTTCGAG CATTACGCCC GCACGGTCTT TACTCGCTAC 
CAACATAAAG TGGCGTTATG GCTGACGTTT AATGAAATCA ACATGTCGTT ACACGCGCCA 
TTCACGGGCG TGGGGCTGGC AGAAGAGAGT GGCGAGGCGG AAGTTTATCA GGCTATCCAC 
CATCAACTGG TTGCCAGTGC GCGGGCAGTT AAAGCCTGTC ATAGCCTGCT CCCCGAAGCG 
AAAATCGGCA ATATGCTTCT CGGTGGGCTG GTTTACCCCC TCACCTGCCA GCCACAGGAT 
ATGTTGCAGG CCATGGAAGA GAACCGGCGC TGGATGTTCT TTGGTGATGT TCAGGCGCGT 
GGCCAGTATC CCGGCTATAT GCAGCGTTTC TTCCGCGACC ACAATATCAC CATTGAGATG 
ACTGAAAGTG ACGCAGAAGA TTTAAAACAT ACCGTCGATT TCATCTCTTT TAGTTATTAC 
ATGACTGGTT GTGTTTCCCA CGACGAAAGC ATTAATAAAA ATGCGCAGGG CAACATACTG 
AATATGATCC CCAATCCGCA TCTGAAAAGT TCAGAGTGGG GGTGGCAAAT TGATCCGGTT 
GGATTACGGG TTCTGTTAAA TACGCTTTGG GATCGTTATC AAAAACCGTT ATTTATTGTC 
GAGAACGGAT TAGGCGCAAA AGACAGCGTT GAAGCGGATG GTTCGATACA GGACGATTAT 
CGAATTGCCT ATTTAAACGA TCACCTGGTA CAGGTAAATG AAGCGATTGC CGATGGTGTG 
GATATTATGG GGTACACCAG TTGGGGGCCA ATTGATTTAG TCAGTGCATC TCATTCACAA 
ATGTCTAAGC GCTACGGCTT TATTTATGTG GATCGTGATG ATAATGGCGA AGGAAGCCTC 
ACAAGAACAC GCAAGAAAAG CTTCGGATGG TATGCAGAGG TGATCAAGAC GCGGGGGCTG 
TCATTAAAAA AAATAACCAT TAAAGCACCT TAA

Protein sequence

MKAFPETFLW GGATAANQVE GAWQEDGKGI STSDLQPHGV MGKMEPRILG KENIKDVAID 
FYHRYPEDIA LFAEMGFTCL RISIAWARIF PQGDEVEPNE AGLAFYDRLF DEMAQAGIKP 
LVTLSHYEMP YGLVKNYGGW ANRAVIDHFE HYARTVFTRY QHKVALWLTF NEINMSLHAP 
FTGVGLAEES GEAEVYQAIH HQLVASARAV KACHSLLPEA KIGNMLLGGL VYPLTCQPQD 
MLQAMEENRR WMFFGDVQAR GQYPGYMQRF FRDHNITIEM TESDAEDLKH TVDFISFSYY 
MTGCVSHDES INKNAQGNIL NMIPNPHLKS SEWGWQIDPV GLRVLLNTLW DRYQKPLFIV 
ENGLGAKDSV EADGSIQDDY RIAYLNDHLV QVNEAIADGV DIMGYTSWGP IDLVSASHSQ 
MSKRYGFIYV DRDDNGEGSL TRTRKKSFGW YAEVIKTRGL SLKKITIKAP