Gene EcE24377A_1735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1735
Symbol	celA
ID	5590659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1734727
End bp	1736166
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	45%
IMG OID	640925413
Product	6-phospho-beta-glucosidase
Protein accession	YP_001462818
Protein GI	157155768
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGGAT TTAAAAAAGG TTTTTTATGG GGCGGTGCGG TAGCCGCGCA TCAGTTGGAA 
GGTGGCTGGA ATGAAGGAGG AAAAGGCATC AGCATCGCTG ATGTGATGAC TGCTGGCGCT 
CACGGGGTGC CGCGTGAAGT GACAGAAGGC GTTATCGACG GGCTTAATTA TCCCAATCAT 
GAAGCAATTG ATTTTTATCA TCGCTATAAA ACAGATATTC AGTTATTTGC CGAGATGGGA 
TTCAAATGCT TTCGAACTTC CATTGCCTGG ACACGAATCT TTCCGCAAGG TGACGAACAG 
GAGCCGAATG AAGAGGGTTT ACAATTTTAT GATGATCTGT TCGATGAATG CCTTAAGCAG 
GGAATGGAAC CTGTGGTGAC GCTTTCACAT TTTGAGATGC CTTATCATCT GGTGACAAAA 
TATGGTGGCT GGCGAAACCG TAAACTGATC GACTTTTTTA TCCGCTTCGC ATCAACGGTC 
TTCACGCGCT ATAAAGAAAA AGTAAAGTAC TGGATGACGT TTAACGAAAT CAATAATCAG 
GTGAATTTCA GCGAAAGCCT GTGTCCATTT ACTAATTCCG GTATCTTGTA TTCGCCAGAG 
GAAGATATCA ATGAGCGCGA ACAAATAATG TACCAGGCGG TACATTACGA GTTAGTTGCC 
AGTGCCCTGG CGGTACAGAC TGGAAAATCG ATCAATCCTG AATTTAACAT TGGCTGTATG 
ATCGCCATGT GTCCCATCTA TCCTCTGACG TGTGCACCCA ACGATATGAT GATGGCCACG 
AAAGCAATGC ATCGTCGTTA CTGGTTTACT GATGTTCATG CTCGTGGATA TTATCCGCAA 
CATATGCTGA ATTACTTTGC CAGGAAAGGA TTCAACCTCG ATATCACACC AGAAGATAAC 
GCGATTCTTG CCAGTGGTTG TGTCGACTTT ATCGGCTTTA GCTACTACAT GTCTTTTACG 
ACACAATTTT CGCCCGATAA CCCGCAACTG GATTATGTTG AACCACGAGA TTTGGTCAGC 
AACCCTTATA TCGATACATC CGAATGGGGA TGGCAAATTG ATCCGGCAGG GCTACGTTAT 
TCACTCAACT GGTTCTGGGA TCATTTCCAG TTGCCGCTGT TTATTGTCGA AAATGGATTT 
GGTGCGGTTG ACCAGAGACA AGCTGACGGC ACGGTGAACG ATCACTATCG CATTGATTAC 
TTTGCTTCCC ATATTCGGGA AATGAAAAAA GCCGTAGTTG AAGATGGTGT TGACTTAATT 
GGCTACACCC CGTGGGGCTG CATTGACCTG GTTTCTGCCG GAACAGGGGA AATGAAAAAG 
CGCTACGGAA TGATTTATGT CGACAAAGAC AACGAAGGGA AGGGAACGCT GGAACGGATA 
CGTAAAGCGT CGTTTTACTG GTATCGGGAT CTCATCGCCA ACAATGGCGA AAATATTTGA

Protein sequence

MSGFKKGFLW GGAVAAHQLE GGWNEGGKGI SIADVMTAGA HGVPREVTEG VIDGLNYPNH 
EAIDFYHRYK TDIQLFAEMG FKCFRTSIAW TRIFPQGDEQ EPNEEGLQFY DDLFDECLKQ 
GMEPVVTLSH FEMPYHLVTK YGGWRNRKLI DFFIRFASTV FTRYKEKVKY WMTFNEINNQ 
VNFSESLCPF TNSGILYSPE EDINEREQIM YQAVHYELVA SALAVQTGKS INPEFNIGCM 
IAMCPIYPLT CAPNDMMMAT KAMHRRYWFT DVHARGYYPQ HMLNYFARKG FNLDITPEDN 
AILASGCVDF IGFSYYMSFT TQFSPDNPQL DYVEPRDLVS NPYIDTSEWG WQIDPAGLRY 
SLNWFWDHFQ LPLFIVENGF GAVDQRQADG TVNDHYRIDY FASHIREMKK AVVEDGVDLI 
GYTPWGCIDL VSAGTGEMKK RYGMIYVDKD NEGKGTLERI RKASFYWYRD LIANNGENI