Gene Dole_0991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0991
Symbol
ID	5693826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1163735
End bp	1165018
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	60%
IMG OID	641263588
Product	peptidase U32
Protein accession	YP_001528878
Protein GI	158521008
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAATG AACTGCGGAA CACCATGAGC CACCCGTTAA AAAAAGTGGA GCTGCTGGCC 
CCTGCCGGTA CCCCGGAAAA ACTGGAGATC GCCATTCACT ACGGCGCGGA CGCCGTCTAC 
CTGGCGGACA GCCGCTTTTC CCTGCGCAAT TTCGCGGGCA ACTTCACCTG CGACCAGTTA 
ACGGCGGCGG CCGGCCTTGC CCGAAAACAC GGGGTGAAAC TGTATGTGGC CTGCAACATC 
TATGCAAGGA CCGATGAAAC CGAGGCCCTG TGCGAATACT TTCACCGGCT CTCCGCCATC 
GGCCCGGACG GCATCATCAT AGCGGATCCC GGCGTGCTGA AACTGGCCAG GGCCACCATT 
CCCCATATTC CTGTTCACCT CAGCACCCAG GCCAACACCA CCAGCCTGGA GGCGGTCCGC 
TTCTGGGAAC AGCAGGGCGT GTCCCGTATC AACCTGGCCC GGGAGCTCAC CCTGACCGAG 
CTTGCCCAAA TCGCCTCTCA AACATCGGTC CAGATCGAAA CCTTTGTCCA TGGGTCCATG 
TGCATGGCCT ATTCCGGCCG GTGCCTGCTC AGCGGTTTTC TCACCGGCCG GGAGAGCAAC 
CGGGGCCTGT GCAGCCAGCC GTGCCGGTGG CAATATTCCC TGGCCGAGGA GACCCGGCCC 
GGGGTCTGGA TGCCGGTGTT TGAAGATGAC CGGGGGGCCT ATGTGTTTAA CGCAAAAGAC 
CTGTGCATGA TCGAACACAT CGACAGCCTG ATCAACGCCG GCATCGCCGC CTTAAAAATT 
GAAGGCCGCA TGAAAAGCAT TCATTATCTG GCCGCCACTG TAAAGGTCTA TCGCGAGGCC 
ATTGATGCTT ATTACGAAAA ACCGGAAAAA TATCGTGTGC AGACCGCCTG GATCGAAGAA 
CTTGAAGCCG TCAACAACCG GGGGTTTTCC ACCGGCTTCT ACTTCGGTCC CCCGGAAAGC 
GGGGGCATCA ACCGAACCGG TGCCCGGCCC GGCACAGCAT ACCGCTTCCT GGCGAGGATC 
CTTCGGGCCC GGCCATCGGG CCGGGTCACG GCCGAGGTGA AAAACAAGCT GTGCGAAGGC 
GACGCCGTTG AAATTTTGAC CGCCGGAGGA CCGGTTCGGC CAGGCACGGT GCTGAACATT 
TTTGATGCCG ACGGCAACCC AATGGAAGCG GCCATGCCCA ACAGCACGGC CACCCTGGTC 
CTTTCCGCCA CCTGCGGACC CAACGACCTG ATCCGGTGCC GGGAAACCCC GCCTGCGACA 
CAGGGGGGGG AACACCTGCG ATAA

Protein sequence

MYNELRNTMS HPLKKVELLA PAGTPEKLEI AIHYGADAVY LADSRFSLRN FAGNFTCDQL 
TAAAGLARKH GVKLYVACNI YARTDETEAL CEYFHRLSAI GPDGIIIADP GVLKLARATI 
PHIPVHLSTQ ANTTSLEAVR FWEQQGVSRI NLARELTLTE LAQIASQTSV QIETFVHGSM 
CMAYSGRCLL SGFLTGRESN RGLCSQPCRW QYSLAEETRP GVWMPVFEDD RGAYVFNAKD 
LCMIEHIDSL INAGIAALKI EGRMKSIHYL AATVKVYREA IDAYYEKPEK YRVQTAWIEE 
LEAVNNRGFS TGFYFGPPES GGINRTGARP GTAYRFLARI LRARPSGRVT AEVKNKLCEG 
DAVEILTAGG PVRPGTVLNI FDADGNPMEA AMPNSTATLV LSATCGPNDL IRCRETPPAT 
QGGEHLR