Gene Ent638_0442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_0442
Symbol
ID	5113613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	498926
End bp	501310
Gene Length	2385 bp
Protein Length	794 aa
Translation table	11
GC content	58%
IMG OID	640490610
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001175181
Protein GI	146310107
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3525] N-acetyl-beta-hexosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.327931
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCGTT ACAACCTCCT GACCGCCGGG CTTTTGCTCG GCTCTTCTGC TCTTGCGGCA 
CCGGCGGGCG ATTTGCCCCT CATGCCGTGG CCTGCCCACG TTGAGCGCCC AACGACGCAA 
GGCGCGCTGG TTCTGAACGA TAAACTTTCT GTCAGCGTGA GCGGTGACGA TCTCGGTGAT 
GCCGTGGACC GTCTGCGTCA GCGCATCGCG CTGCAAACCG GCTGGACGCT TCAGCCGCAG 
GCTGTGAATC CGGATAAACC CACCATTCGC ATCGCTATCG CCAAAAAAGT TAACCCGCAA 
CCTCTGCCCG ACAGCGATGA ACGTTACACG CTCACCGTCG ACGCCAACGG CGTCAATATC 
GCCGCCAACA CCCGATTTGG TGCGCTGCGG GCGATAGAAA CGCTGCTCCA GCTCATTCAA 
AACGGCGCGG AAAACACCTC GCTGCCGTGG GTGAAAATTG AAGATGCCCC GCGCTTCCCA 
TGGCGCGGTC TGCTGCTCGA CTCCGCGCGT CATTTCATCC CGCTTGAAGA TATCAAACGG 
CAGATCGACG GCATGGCGGC CGCCAAACTG AACGTGTTGC ACTGGCATTT AACCGACGAT 
CAGGGCTGGC GATTTGCCTC GAAACGCTAT CCAAAACTGA CGCAACTGGC GAGCGACGGA 
CTGTTTTACA CCTCTGATCA GATGCGTGAC ATCGTGCGCT ACGCCACCGC GCGCGGCGTG 
CGCGTGGTGC CAGAAATCGA CATGCCGGGC CACGCGTCGG CGATTGCCGT GGCCTATCCG 
GAGCTCATAA GCGCACCAGG GCCGTATGAA ATGGAACGCC ATTGGGGGGT GTTGAAACCG 
GTTCTCGATC CGACAAAAGA AGCGACGTAT GCCTTTGCTG AGGCGATGGT GAGCGAACTG 
GCGGCGATCT TCCCCGATCC GTATCTGCAT ATCGGCGGCG ATGAAGTTGA CGATACGCAG 
TGGAAAGAAA ACAAAGCCAT TCAGCAATTT ATGCGCGACA ACAAACTTGC GGACAGCCAC 
GCTTTACAGG CGTATTTCAA CCGCAAGCTG GAAACGATCC TTGAAAAACA TCACCGCCAG 
ATGGTCGGCT GGGATGAGAT TTACCATCCG GATCTGCCCA AAAGCATTCT GATTCAGTCC 
TGGCAGGGGC AGGACGCGCT CGGCGAAGTG GCGAAGCAGG GTTACAAAGG CATTCTCTCC 
ACCGGTTTTT ATCTCGATCA GCCGCAAAGC ACGGCCTATC ACTATCGCAA TGAAATCGTG 
CCGCAAGGCT TAAACGGCGT GGATATTATC GCCGATAACG ACAGCGCACA AAGCTGGACA 
TTCACCATGC CGCGCCTGAA AGGCAAGCCG GTTGAGGGCA GCTTTACGCT GGTGAAAGCG 
GTTTCTGGCT GGCGCGGATT TATTGATTTC AACGGTAAAT CCCGGCGTGC GGTGAATAAT 
ATTGAGTGGC GTGATGACAA TCAGGTGACG TTCACCGTTG ATACCTGGAT GGGCGAAACG 
CGCCCGGTGG TGAACGTCGC GGACGACAAG CTGACGGGCT ATTTCCTGGT GGGTAACGCG 
CGCTATCCGA TTTCCGGTGC GCGTCTGGAT GACGTACCAA AAGGCACGCA ACCGGTGGTG 
CCGGATGCCG ATCAGCAGGC TAATCTGATG GGCGGCGAAG CGGCGCTGTG GGCGGAAAAC 
GTGGTCGCAC CGGTGCTGGA TATCAAGCTG TGGCCGCGCG CGTTTGCGGT GGCGGAGCGT 
CTGTGGTCCG CGCAGGACGT GAAGGATGTC GACAATATGT ACACCCGTTT GCAGGCGATG 
GACACCTGGA CGACGGTATC GGTCGGCCTT CAGCAGCACA GCCAGCAGCA GGCGTATTTC 
ATACGTCTGG CGAATACGAC CGAGACGCTG CCGCTGCAGA TTCTCGCGCA GGCGCTGGAG 
CCGGCGCAGT ATTACACCCG TCAGCATCTC AAATTCCAGG CCGGAAATTA TCATCAGTTT 
GAGCCGCTAA ACCGTTACGC CGATGCGCTG AGCGCGGAGA GCAACACCGT GCGCCAGATG 
AACAAATGGG CCGAACGCCT GGTCAGCGAT GCGGAAGACA CCGAAAGCGC AGAGGCGCTG 
CGCCACGTGT TTACCCGCTG GCAAAGCAAT ACCAGCGATG CGCTGGCGCT GAGTGACAAT 
AATTATCAGC TCAAAGCCAT CAAGCCCGTT ATTCAGGAGG TGGATAAGCT GGCATCGATT 
GGCCTGCGGT TGGCCGACCT GGTGGCGCGA CAGGGTACGC TGGATGACAA GGAGATCGCT 
TCTATTCAGA AGGAGTTGGA TAAGGCCGCG GAGATTCAGG ATGAAGTGGT GATTGCGGCG 
GTTTATCCGG TTGAGACGTT GCTAAGGGCG ACAAGGAATC AGTAA

Protein sequence

MLRYNLLTAG LLLGSSALAA PAGDLPLMPW PAHVERPTTQ GALVLNDKLS VSVSGDDLGD 
AVDRLRQRIA LQTGWTLQPQ AVNPDKPTIR IAIAKKVNPQ PLPDSDERYT LTVDANGVNI 
AANTRFGALR AIETLLQLIQ NGAENTSLPW VKIEDAPRFP WRGLLLDSAR HFIPLEDIKR 
QIDGMAAAKL NVLHWHLTDD QGWRFASKRY PKLTQLASDG LFYTSDQMRD IVRYATARGV 
RVVPEIDMPG HASAIAVAYP ELISAPGPYE MERHWGVLKP VLDPTKEATY AFAEAMVSEL 
AAIFPDPYLH IGGDEVDDTQ WKENKAIQQF MRDNKLADSH ALQAYFNRKL ETILEKHHRQ 
MVGWDEIYHP DLPKSILIQS WQGQDALGEV AKQGYKGILS TGFYLDQPQS TAYHYRNEIV 
PQGLNGVDII ADNDSAQSWT FTMPRLKGKP VEGSFTLVKA VSGWRGFIDF NGKSRRAVNN 
IEWRDDNQVT FTVDTWMGET RPVVNVADDK LTGYFLVGNA RYPISGARLD DVPKGTQPVV 
PDADQQANLM GGEAALWAEN VVAPVLDIKL WPRAFAVAER LWSAQDVKDV DNMYTRLQAM 
DTWTTVSVGL QQHSQQQAYF IRLANTTETL PLQILAQALE PAQYYTRQHL KFQAGNYHQF 
EPLNRYADAL SAESNTVRQM NKWAERLVSD AEDTESAEAL RHVFTRWQSN TSDALALSDN 
NYQLKAIKPV IQEVDKLASI GLRLADLVAR QGTLDDKEIA SIQKELDKAA EIQDEVVIAA 
VYPVETLLRA TRNQ