Gene Dole_0295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0295
Symbol
ID	5693114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	339512
End bp	340543
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	62%
IMG OID	641262876
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_001528182
Protein GI	158520312
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCAA CCGACAAACG CCCTTTTTCC CTCTCCGGCT TTTCCGATGA CATGCTGGCT 
GGCCAGCGGC TTGTGGCCGG ATTTGAGGGA ACAACCCTCA ACGACGACCT CAAATACCTG 
ATCGACACCC TCAAGGTGGG GGGTATTATT CTGTTTGCCG TGAACCTGGA GCACCCCGAT 
CAGATTCGCG ACCTGTGCGC TTCGGCCCAG GCCCATGCCG CGGCCTGCCG CCTGCCGCCC 
CTGTTTGTGG CCATCGACCA GGAAGGGGGA CAAGTGGCCC GGCTCAAACC GCCCTTTACC 
CGGTTTGAGG GCAACCCTTC AATCACCACG GATGACCAGG CCCGGCACTT CGCCCGAATC 
ACCGCGTCCG AGCTGGCCGG CATCGGGGTG AATATGAACA TGGCGCCGGT GCTGGACGTG 
GCCGACGGGG TTACCGACAG CGTCATGGCC GGCCGGGCCT TTGCCGGCGG CCCCCGGGAA 
GTGGCCCGGC TGGGCGGCGT GGTCATTGAA GAGATGCAGA AAAACGGCAT AATGGCCGTG 
GGCAAGCACT TTCCCGGCAT CGGCCGCACC ACGGCCGACT CCCACATCGA CCAGCCCTGG 
CTGGCGGCCG ATCCCGCAGA AATGGAAACC ACCGACCTGG TGCCGTTTAA GACGGCCATC 
GAACGGGACG TGGCCGGCAT CATGCTTTCC CATATCCGCT ACACCGCCCT GGATCCGGAC 
CTGCCGGCCA GCATGTCGAC ACCTATTGCA AAAACCCTGC TGCGGGAAAA ATTGGGATAT 
GAAGGCCTGG TGATGACCGA CGATCTGGAC ATGGGCGCCA TTCGCAACCA CCATGTTATG 
GATCAGGTGG TGCGATGCGC GGACCGGGCC GGCATCGACA TGGTGCTGGT CTGCCACAAG 
GGGCCGGACA GAAAAAAGGC GGTTGAGTCC TTCAGGGAAC TGCTGGAAAC ATCGGACACG 
CACAGAAAAC AGGCCCTGTG CTCAGTGGAG CGGATTCTGC GGGCCAAGGC CCGTTATCTT 
TGCCGCATTT GA

Protein sequence

MAATDKRPFS LSGFSDDMLA GQRLVAGFEG TTLNDDLKYL IDTLKVGGII LFAVNLEHPD 
QIRDLCASAQ AHAAACRLPP LFVAIDQEGG QVARLKPPFT RFEGNPSITT DDQARHFARI 
TASELAGIGV NMNMAPVLDV ADGVTDSVMA GRAFAGGPRE VARLGGVVIE EMQKNGIMAV 
GKHFPGIGRT TADSHIDQPW LAADPAEMET TDLVPFKTAI ERDVAGIMLS HIRYTALDPD 
LPASMSTPIA KTLLREKLGY EGLVMTDDLD MGAIRNHHVM DQVVRCADRA GIDMVLVCHK 
GPDRKKAVES FRELLETSDT HRKQALCSVE RILRAKARYL CRI