Gene Dret_1148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1148
Symbol
ID	8418976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1344161
End bp	1345411
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	62%
IMG OID	645037723
Product	metallophosphoesterase
Protein accession	YP_003198014
Protein GI	258405272
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.809261
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTTC GTTTTCTCCA CGCCGCCGAC CTCCATCTCG ATAGCCCGCT GCGGGGCCTG 
GAAACCTATC CCGACGCCCC GGTGGAGCAG ATTCGTAACG CCACCCGCCG GGCCCTGGAC 
AATCTGGTCA CCCTGGCCCA GGAGCAGGAG GTCGCCTTTG TCCTTTTGGC CGGGGATATC 
TTCGACCAGT CCTGGCGCGA CTTCCACACC GCCCTGTTTT TCGCCCAGTG CATGGGCCGG 
CTTCGTGAGG CCGGGATCCC GGTCTATGGG GTCAGCGGCA ACCACGACGC GGCCAACCCC 
ATCGGCAAGA CCTTGCGCCC GCCGGACAAT GTCCACTTTT TTTCCGCCAC CAAACCAGGG 
TCGGTGACCC TGGAGCACTG CAACACAGTC ATCCACGGCC AGAGCTATTC CAGCCGCGAG 
ACCAGCGAGG ACTTGGCCGC CGAGTATCCG CCGGCCGTCG CCGGGGCCTT GAATATCGGC 
CTGCTGCACA CCAGTTTGAC CGGACGTCCC GGTCACGAAC CCTACGCCCC GACCCATCCG 
GATATCCTGG GCAACAAGGG CTACGACTAC TGGGCCCTGG GCCATGTCCA CGAACGAGAG 
GTTGTCACCC GTGATCCCTG GATCGTCTTT CCCGGCACCA TCCAGGGCCG GCACATCCGG 
GAAACTGGTC CCAAAGGGTG CAGTCTGGTC GAGGTCGAGG ACGGTCGCAT CAGGGATGTC 
GTGCATCAGG ACATTGATGT CCTGCGCTGG TTTCGCGGTA ACGTCGAGTG TGGTCCTTGT 
ACCTGCGATG ACGATGTCCG CCACGCAGTC CGCGCAGAAC TGCAGGCCGC CCGGGACGCC 
GGTGAGGGCC GCCCGGTCGC GGTCCGCCTG GAATGCACCG GCGCGACCCA AATGCACGCC 
CAGCTCCACG ACAGGCAACG CCATTTCCAG GAGGAATGGC GGACACTGGC CGCTGAAATG 
GGCGATCTGT GGATCGAACA GATTCGGCTG CACACCCGTC CACCAGAAGA TCAATCCCAG 
GAGGTGGATC CGGAATCACC GCTGGGGGAA TTGATGCAGT GTATTGCAGC CCAGGAATTG 
CCGGAAAGTT GCACCAATGA GTTGGAAGAT TTGATGAAAC AACTGCCCAA GGAGATCACC 
GAGGGCGAGG AGGGTTTCAA TCTCAAGGAT CCACAGCAGT GGCAGCGGAT GCAGGACGAC 
GTCCGTGAAC TCCTGCTTGG GCGTTTGCTG CGCCAGGGAG GTCCGCAATG A

Protein sequence

MTFRFLHAAD LHLDSPLRGL ETYPDAPVEQ IRNATRRALD NLVTLAQEQE VAFVLLAGDI 
FDQSWRDFHT ALFFAQCMGR LREAGIPVYG VSGNHDAANP IGKTLRPPDN VHFFSATKPG 
SVTLEHCNTV IHGQSYSSRE TSEDLAAEYP PAVAGALNIG LLHTSLTGRP GHEPYAPTHP 
DILGNKGYDY WALGHVHERE VVTRDPWIVF PGTIQGRHIR ETGPKGCSLV EVEDGRIRDV 
VHQDIDVLRW FRGNVECGPC TCDDDVRHAV RAELQAARDA GEGRPVAVRL ECTGATQMHA 
QLHDRQRHFQ EEWRTLAAEM GDLWIEQIRL HTRPPEDQSQ EVDPESPLGE LMQCIAAQEL 
PESCTNELED LMKQLPKEIT EGEEGFNLKD PQQWQRMQDD VRELLLGRLL RQGGPQ