Gene Dret_0736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0736
Symbol
ID	8418550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	868353
End bp	869594
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	56%
IMG OID	645037301
Product	hypothetical protein
Protein accession	YP_003197606
Protein GI	258404864
COG category	[R] General function prediction only
COG ID	[COG1896] Predicted hydrolases of HD superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000863321
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGTA TTCGCAAGGG GCTATTGCAG CTTGTTTTTT CCGGATCCTA TATGAAACGC 
TGGAACGACA AGCTCCGGCC CATGGAATTG TGGGAGGTCG ACAAGCAGGC CCACAAAATG 
ATCGTGGCCT GGCTGCTTTT TCTCTGCAAC ACCCGCTCCA TGTCTGAGGC CCAGCGAACT 
GAGGTGGGCA ATGGAATTAT CGAAGGGGGG CTCTTTGAGT ATTTTTACCG CTTGGTGATC 
ACCGATATCA AACCCCCGGT CTTTTACCAG ATCAAAGCCA ACCCGGAACA CTACGAGCAA 
TTGACCAAGT GGGTCCTGTC CCAACTCCAT CCCCGGGTTC GGCCCCTGGG CGGGGCATTT 
TGGGAACGCC TGGAAGCGTA TTTTCTTTTG CCTTCCGAAC ACACCCTGGC CGAGGACATC 
CTCGAGGCTG CCCATATGTG GGCCAGTTCC TGGGAGTTCC AACTCATCAA GGGGGTCAAT 
CCATGGGACG ACGAACTCGA GGCCATCGAA GCCAATTTCG CGGAGAAACT GGAAGCCAAA 
TCCCATCTCC ACGGGGTCTC GGAGATTACG GCCGGTCCCC ACTCCGCGCT GGGGCGGTTG 
GCCCACCTCT GTGGGCAATT GCGTTTTCAA AAACGGTGGT CGCAGATTCC GCGCATCCCT 
GAAACATCGG TCCTCGGGCA CATGTTTATC GTGGCCAGTT ATGCGTTTTG CATGAATCTC 
GTGTTGGAGA CAGGACAACG GCGGCGGATG AATACGTTCT TTTCCGGTTT GTTTCACGAT 
TTGCCCGAAT TGCTGACCCG GGACATCATT TCCCCGGTCA AACGGTCGGT GCAGCCGATC 
GGGGAGATGA TCAAGGAGTA CGAAGAGCAG GAATTGACTC GGCGGGTCCT GTCTCCGCTT 
CAAAGTGGCG GGCACAGCGA TGTTGCCCAA ACCTTGTCCT ATTATCTGGG GTTGGAGGCC 
GGTTCGGAGT TCGCGGATAC GGTGCGCGAA AACGGGGTGG TGCGCAGGGT GGAGTGGGAC 
AATTTCGCCA GCCAGTGGGA TCGTGACGAA CTCGACCCCA AGGACGGCCG GGTGGTGAAG 
GTCTGCGACC ATCTGGCCGC GTTTATCGAG GCCTATACCT CCACCCGCAA CGGTATCAAC 
ACCGACCAAT TACAACAGGC GTTGTGGCGT TTGCGCAGTC AATACAGCCA GGTTTCCCTG 
GGCGAACTCC ATATCGGAGC CCTGCTGGCG GATTTCGATT GA

Protein sequence

MTSIRKGLLQ LVFSGSYMKR WNDKLRPMEL WEVDKQAHKM IVAWLLFLCN TRSMSEAQRT 
EVGNGIIEGG LFEYFYRLVI TDIKPPVFYQ IKANPEHYEQ LTKWVLSQLH PRVRPLGGAF 
WERLEAYFLL PSEHTLAEDI LEAAHMWASS WEFQLIKGVN PWDDELEAIE ANFAEKLEAK 
SHLHGVSEIT AGPHSALGRL AHLCGQLRFQ KRWSQIPRIP ETSVLGHMFI VASYAFCMNL 
VLETGQRRRM NTFFSGLFHD LPELLTRDII SPVKRSVQPI GEMIKEYEEQ ELTRRVLSPL 
QSGGHSDVAQ TLSYYLGLEA GSEFADTVRE NGVVRRVEWD NFASQWDRDE LDPKDGRVVK 
VCDHLAAFIE AYTSTRNGIN TDQLQQALWR LRSQYSQVSL GELHIGALLA DFD