Gene EcE24377A_4230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4230
Symbol
ID	5590178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4219076
End bp	4220470
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	48%
IMG OID	640927846
Product	6-phospho-beta-glucosidase
Protein accession	YP_001465205
Protein GI	157156633
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAT TTCCAGAAAC ATTTCTTTGG GGTGGCGCAA CAGCTGCCAA TCAGGTGGAA 
GGTGCCTGGC AGGAAGATGG CAAAGGGATC TCGACCTCAG ATTTACAGCC TCATGGCGTA 
ATGGGAAAAA TGGAACCGCG CATCCTGGGG AAAGAGAATA TCAAAGATGT CGCCATCGAT 
TTTTATCACC GTTACCCGGA AGATATCGCG TTATTTGCCG AGATGGGCTT CACCTGTCTG 
CGTATTTCCA TTGCCTGGGC GCGAATTTTC CCTCAGGGCG ACGAAGTCGA ACCGAATGAA 
GCGGGGTTAG CGTTTTACGA TCGGCTGTTT GATGAAATGG CGCAGGCGGG GATCAAGCCG 
CTGGTAACGT TATCCCATTA CGAAATGCCA TATGGGCTGG TGAAAAACTA CGGCGGTTGG 
GCTAATCGAG CGGTCATCGA TCACTTCGAG CATTACGCCC GCACGGTCTT TACTCGCTAC 
CAACATAAAG TGGCGTTATG GCTGACGTTT AATGAAATCA ACATATCGTT ACACGAGCCA 
TTCACGGGCG TGGGGCTGGC AGAAGAGAGT GGCGAGGCGG AAGTTTATCA GGCTATCCAC 
CATCAACTGG TTGCCAGTGC GCGGGCAGTT AAAGCCTGTC ATAGCCTGCT CCCCGAAGCG 
AAAATCGGCA ATATGCTTCT CGGTGGGCTG GTTTACCCCC TCACCTGCCA GCCACAGGAT 
ATGTTGCAGG CCATGGAAGA GAACCGGCGC TGGATGTTCT TTGGTGATGT TCAGGCGCGT 
GGCCAGTATC CCGGCTATAT GCAGCGTTTC TTCCGCGACC ACAATATCAC CATTGAGATG 
ACTGAAAGTG ACGCAGAAGA TTTAAAACAT ACTGTAGATT TCATCTCTTT TAGTTATTAC 
ATGACTGGTT GTGTTTCCCA CGACGAAAGC ATTAATAAAA ATGCGCAGGG CAACATACTG 
AATATGATCC CCAATCCGCA TCTGAAAAGT TCAGAGTGGG GGTGGCAAAT TGATCCGGTT 
GGATTACGGG TTCTGTTAAA TACGCTTTGG GATCGTTATC AAAAACCGTT ATTTATTGTC 
GAGAACGGAT TAGGCGCAAA AGACAGCGTT GAAGCGGATG GTTCGATACA GGACGATTAT 
CGAATTGCCT ATTTAAACGA TCACCTGGTA CAGGTAAATG AAGCGATTAC CGATGGTGTG 
GATATTATGG GGTACACCAG TTGGGGGCCA ATTGATTTAG TCAGTGCATC TCATTCACAA 
ATGTCTAAGC GCTACGGCTT TATTTATGTG GATCGTGATG ATAATGGCGA AGGAAGCCTC 
ACAAGAACGC GTAAGAAAAG CTTCGGATGG TATGCAGAAG TGATCAAAAC GCGGGGGCTG 
TCATTAAAAA AATAA

Protein sequence

MKAFPETFLW GGATAANQVE GAWQEDGKGI STSDLQPHGV MGKMEPRILG KENIKDVAID 
FYHRYPEDIA LFAEMGFTCL RISIAWARIF PQGDEVEPNE AGLAFYDRLF DEMAQAGIKP 
LVTLSHYEMP YGLVKNYGGW ANRAVIDHFE HYARTVFTRY QHKVALWLTF NEINISLHEP 
FTGVGLAEES GEAEVYQAIH HQLVASARAV KACHSLLPEA KIGNMLLGGL VYPLTCQPQD 
MLQAMEENRR WMFFGDVQAR GQYPGYMQRF FRDHNITIEM TESDAEDLKH TVDFISFSYY 
MTGCVSHDES INKNAQGNIL NMIPNPHLKS SEWGWQIDPV GLRVLLNTLW DRYQKPLFIV 
ENGLGAKDSV EADGSIQDDY RIAYLNDHLV QVNEAITDGV DIMGYTSWGP IDLVSASHSQ 
MSKRYGFIYV DRDDNGEGSL TRTRKKSFGW YAEVIKTRGL SLKK