Gene EcolC_2494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2494
Symbol
ID	6067647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2744787
End bp	2745812
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	53%
IMG OID	641601900
Product	beta-hexosaminidase
Protein accession	YP_001725452
Protein GI	170020498
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.566967
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000031052
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGGTCCAG TAATGTTGGA TGTCGAAGGT TACGAACTGG ACGCGGAAGA GCGTGAAATA 
CTGGCGCATC CGCTGGTGGG AGGGCTGATT CTCTTTACGC GTAACTATCA TGATCCTGCC 
CAGTTACGTG AACTGGTGCG CCAGATCCGC GCAGCTTCGC GCAATCATCT GGTGGTGGCG 
GTTGATCAGG AAGGTGGACG CGTGCAGCGT TTTCGTGAAG GTTTTACCCG CTTGCCAGCG 
GCGCAATCAT TCGCTGCGCT GTCAGGAATG GAAGAGGGTG GCAAACTGGC GCAGGAGGCA 
GGTTGGTTGA TGGCCAGCGA AATGATCGCT ATGGATATTG ATATCAGCTT TGCGCCTGTG 
CTGGATGTCG GGCATATCAG CGCGGCGATT GGCGAGCGTT CTTATCATGC CGATCCACAA 
AAAGCCCTGG CAATTGCCAG CCGGTTTATT GATGGTATGC ATGAAGCCGG AATGAAAACG 
ACCGGGAAAC ACTTCCCAGG ACACGGTGCA GTAACGGCAG ACTCACACAA AGAAACACCG 
TGCGATCCAC GTCCACAAGC GGAGATTCGC GCTAAAGATA TGTCGGTCTT CAGTTCCTTA 
ATCCGCGAAA ATAAACTCGA CGCCATTATG CCTGCGCATG TGATCTACAG TGATGTTGAT 
CCGCGTCCGG CGAGCGGCTC TCCCTACTGG CTGAAAACCG TTTTGCGTCA GGAACTGGGT 
TTTGACGGCG TGATTTTCTC TGACGATTTA TCGATGGAAG GTGCCGTGAT TATGGGCAGT 
TATGCCGAAC GCGGGCAGGC ATCACTGGAT GCGGGTTGCG ATATGATCCT GGTCTGCAAT 
AATCGTAAAG GGGCCGTCAG CGTGTTAGAT AATCTGTCAC CGATCAAGGC AGAACGTGTT 
ACACGTTTGT ATCATAAAGG TTCATTTTCG CGACAGGAAC TGATGGACTC GGCTCGCTGG 
AAAGCGATCA GCGCCCGTCT GAATCAGTTA CATGAACGCT GGCAGGAAGA GAAAGCAGGT 
CACTAA

Protein sequence

MGPVMLDVEG YELDAEEREI LAHPLVGGLI LFTRNYHDPA QLRELVRQIR AASRNHLVVA 
VDQEGGRVQR FREGFTRLPA AQSFAALSGM EEGGKLAQEA GWLMASEMIA MDIDISFAPV 
LDVGHISAAI GERSYHADPQ KALAIASRFI DGMHEAGMKT TGKHFPGHGA VTADSHKETP 
CDPRPQAEIR AKDMSVFSSL IRENKLDAIM PAHVIYSDVD PRPASGSPYW LKTVLRQELG 
FDGVIFSDDL SMEGAVIMGS YAERGQASLD AGCDMILVCN NRKGAVSVLD NLSPIKAERV 
TRLYHKGSFS RQELMDSARW KAISARLNQL HERWQEEKAG H