Gene Daro_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2034
Symbol
ID	3566752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2184790
End bp	2185809
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	57%
IMG OID	637680505
Product	beta-hexosaminidase
Protein accession	YP_285249
Protein GI	71907662
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	0.362016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCATT TACCGCTCGG CCCGCTGATG ATCGACATTA CTGGCACCGA ACTGACAGAT 
CTTGATCGCG AACGCCTTTG CCATTCATTG GTTGGTGGGA TCATCCTGTT TTCTCGAAAC 
TATGCCAACC AGGATCAATT GCTAGAACTC TGTTCGGCAA TCCATACCTT GCGCTCGCCA 
TCGCTGCTGA TTGCCGTTGA TCACGAGGGG GGCAGGGTTC AGCGTTTTCG CGACGGTTTT 
ACCCGTCTGC CACCCATGGC CACGTTGGGG AAACTTTGGG ATAGGGATCC GCAGGCGGCA 
CTTGTCGCCA CCCGCCAGAC TGGCTACGTG CTGGCCGCCG AACTTCGCGC CCGTGGCGTC 
GATTATTCCT TTACACCGGT GCTTGATCTC GATTATGGCC CCTCACGCGT CATCGGCGAT 
CGTGCTTTCC ACCGCCAACC GGACGCGGTA ATCGCGCTCG CCGCTGCGCT AGGTGAAGGT 
CTGCGCCAGG CAGGCATGGG CAGTTGTGGC AAGCATTATC CGGGACACGG TTATGTCATC 
CCCGATTCGC ATGTCGAACT GCCGGTCGAT GATCGTGCTT TCGAAGCAAT GCAGGAAGAT 
ATCGCTCCCT ACCGGAATCT TCCGCTGGAT GGCGTGATGG CTGCCCATGT GATTTACAAC 
TGCATGGACT GCAATACGGC TGTATTTTCA AATAAATGGA TAAGTTATTT GAGAAATGAC 
ATTAAATTTA ACGGGGCGGT TTTCACCGAC GATTTATCGA TGGCCGGCGC CGGTGTGGTC 
GGCGGCATGC TGTCTCGGGT CGAGACAGCT TACGCAGCCG GCTGCGACAT GCTGCTCGTG 
TGTAATGCCC CTGATGTTGT CGGCGATGTG CTGGAAAACT GGAAGCCGGA AATCGATTTG 
CGGCGCGGCA AACGGGTCGA GGCGCTGATC CCCAAGACGC CCGCCGTGCC TTGGCAAGTG 
CTTCAGGCAG ACCCGGCTTA TCAGGCGGCC CAAAAGACCA TCGCCGAATT GATGGCCTGA

Protein sequence

MMHLPLGPLM IDITGTELTD LDRERLCHSL VGGIILFSRN YANQDQLLEL CSAIHTLRSP 
SLLIAVDHEG GRVQRFRDGF TRLPPMATLG KLWDRDPQAA LVATRQTGYV LAAELRARGV 
DYSFTPVLDL DYGPSRVIGD RAFHRQPDAV IALAAALGEG LRQAGMGSCG KHYPGHGYVI 
PDSHVELPVD DRAFEAMQED IAPYRNLPLD GVMAAHVIYN CMDCNTAVFS NKWISYLRND 
IKFNGAVFTD DLSMAGAGVV GGMLSRVETA YAAGCDMLLV CNAPDVVGDV LENWKPEIDL 
RRGKRVEALI PKTPAVPWQV LQADPAYQAA QKTIAELMA