Gene Dret_0716 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0716
Symbol
ID	8418529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	850833
End bp	852059
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	64%
IMG OID	645037280
Product	peptidase U32
Protein accession	YP_003197586
Protein GI	258404844
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0755954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.409296
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCGAG GAGGATTGCC GGAACTCCTC GCTCCGGCAG GGGATTGGGA ACGGCTTCGC 
ACCGCCCTGG TGTACGGCGC CGACGCCGTC TATCTCGGTG GCAGCGGTCT GGATCTGCGC 
GCGCAAAGCA AAGGATTCTC TCCGGGGGAA CTCCCCGCCG CTGTGGCTTT CGCCGCCAGA 
CACAGCGCCA AGGTCTATTT TTGCTTGAAC ATCCTGGCCC GGCAACACCA TCTGTCCCAG 
ATAGAAGCCA CCCTGGAGCA GCTGGCCGCC ACCCCGATAC ACGGCCTCAT CGTGGCCGAC 
CCCGGCGTGA TCGCCCTGGC CCGGCGCCTG GCCCCGGGTA TCCCCTTGCA TCTGAGCACC 
CAGGCCAATA CCTCGAACGC CGCCAGCATC GCCTTCTGGC GCGATTGCGG TGTCCAGCGG 
GTCAACTTGG CGCGCGAACT CTCCGGCCCG GAAATGCGCC GCATCCGCAG GGAGGTGCCG 
GACATGGAAT TGGAATCCTT TGTCCACGGC GCCCAGTGCA TGGCCATTTC CGGACGCTGC 
CTGCTCAGCG ACCACCTCAA CGGGCGCTCC GCCAATCTGG GGGCCTGTAC CCACCCCTGT 
CGTTTCGGCT ACCGGCGCCA CATTCTGGAG GAAGGAGTCC GTCAGGGCCA GCCGTGTTGG 
GAGATTGAAC AGGACAGAGA TTTTACGCAC ATCCTGGCCG CCGAGGACCT GTGTCTGGTG 
CCCTACCTGG CCTGGTTCGT CCACCAGGGG TGGCAGAGTC TCAAAATCGA AGGGCGAATC 
AAGACCTGTT CCTATGTCGG CCAGGTCGTG GACGTCTACC GCACCGCTCT GGACGATATC 
GCCGCCCGCC GTTTTCGGCG AGACACCTAC CTGCGGGAAT TGGAGCCAAG CGCCACCAGG 
AATCTGGGAA CAGGATTTTT CCTGCCCCAT GCCCGCGGAC TGACACTTCG CGCCGCCCCC 
AGCTACCGCA CCCCCATTGT GGCTCGTATC GAACGCGAAC TTGCGCCGGG AACCTGGGAA 
ATCAGCGCCC GGCACCGCTT TGCCGTGACT GACGATATCG AAATCGTGGC TCCCGGGCTG 
CAGCGCCCTT GCCTTGGCTC ATTCGGACTG GAAAAAGAGG ACGGAAACCG GATCGAGACC 
ATCCACTCCG GGGTCCGCGG CCGACTGCGA AGCGACAATC CCGCCTTGCG CCCCGACCTG 
CTGTTACGAG CCCGTCTGCA GGCCTAG

Protein sequence

MSRGGLPELL APAGDWERLR TALVYGADAV YLGGSGLDLR AQSKGFSPGE LPAAVAFAAR 
HSAKVYFCLN ILARQHHLSQ IEATLEQLAA TPIHGLIVAD PGVIALARRL APGIPLHLST 
QANTSNAASI AFWRDCGVQR VNLARELSGP EMRRIRREVP DMELESFVHG AQCMAISGRC 
LLSDHLNGRS ANLGACTHPC RFGYRRHILE EGVRQGQPCW EIEQDRDFTH ILAAEDLCLV 
PYLAWFVHQG WQSLKIEGRI KTCSYVGQVV DVYRTALDDI AARRFRRDTY LRELEPSATR 
NLGTGFFLPH ARGLTLRAAP SYRTPIVARI ERELAPGTWE ISARHRFAVT DDIEIVAPGL 
QRPCLGSFGL EKEDGNRIET IHSGVRGRLR SDNPALRPDL LLRARLQA