Gene Dret_1404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1404
Symbol
ID	8419233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1637872
End bp	1638903
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	58%
IMG OID	645037979
Product	metal dependent phosphohydrolase
Protein accession	YP_003198269
Protein GI	258405527
COG category	[R] General function prediction only
COG ID	[COG3481] Predicted HD-superfamily hydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.248325
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTCAA AGAACCTGTT TGTTTCCGAT CTGCAACAGG GCTCGGCCAT TGAAGATCTG 
TTCCTTATTG CCGAAGCCCG AAGCGCGGAA ACACGCAACG GCCAGCCCTA TTGGGATCTC 
GTCCTCCAGG ACGCAACCGG GAAGGTGTCG GCCAAGATAT GGGCGCCGTT GAGCCAACAG 
GCCAACGGCC TGGCTCCAGG GCAATTTCTT CATGTCCAGG CCAAAGTCGA ACTCTTTCGC 
GAAAAATTCC AGCTCAATAT CACTCGGTTT GAGGAAATCG ATCCTGAAGG GGAGACATTG 
GACTGGTCGG CATTTGTGCC CCGGACAGCA GAAGCGCCGG AAACCATTTT AGAGGATCTG 
GAACAACTCT GCAGAGACGA ATTGCAGCAC AAACCGTGGC GCGCCCTCTG CCGCTCCGTG 
CTCCGGGATC CTGAAATCCG GCAACGACTC CTGCAGGCCC CCGCGGCCAA ATCGGTCCAC 
CACGCCTATC GCGGTGGCCT TCTGGAACAC ACCCGACAAG TCTGTCGCGT CTGTCTGCAA 
TTCGCCGCGC TCTATCCGGA TCTGGACAAG GAATTGCTCT TTGTCGCGGC CTTGTTCCAT 
GATTTCGGCA AGGCCTGGGA ACTTGAGGGG CTGGCGACAT GGGATTACAG TGATGCTGGC 
CAACTCCTGG GGCATATCCA TCTTGGGCTC GAACGTCTCG AGCCGTTTCT GCGCCGCCAA 
AAAGGCCTGG ATCCGGAATT GGCCCTGCAC CTCAAGCACG CCATCCTCAG CCACCACGGG 
GAGTTGGAGT TCGGGTCGCC GAAACGACCG AAAACCCCGG AAGCCTTTGC CCTGCACTTT 
GCAGACAACC TCGATTCCAA ATTGACAACA GCGTCCGCCG CGCTCAATGA CCTGGGCGAA 
CATGATGGGG GGTGGACACC GAAAGTCTGG GCGCTCCAGC GGCAACTGTT CAAACGGACA 
CCGACACCGG CTCCGATGGC GACACAACAC CGCCCCAGGG AGGATCAATG TTCATTACCT 
TTGAAGGAAT AG

Protein sequence

MQSKNLFVSD LQQGSAIEDL FLIAEARSAE TRNGQPYWDL VLQDATGKVS AKIWAPLSQQ 
ANGLAPGQFL HVQAKVELFR EKFQLNITRF EEIDPEGETL DWSAFVPRTA EAPETILEDL 
EQLCRDELQH KPWRALCRSV LRDPEIRQRL LQAPAAKSVH HAYRGGLLEH TRQVCRVCLQ 
FAALYPDLDK ELLFVAALFH DFGKAWELEG LATWDYSDAG QLLGHIHLGL ERLEPFLRRQ 
KGLDPELALH LKHAILSHHG ELEFGSPKRP KTPEAFALHF ADNLDSKLTT ASAALNDLGE 
HDGGWTPKVW ALQRQLFKRT PTPAPMATQH RPREDQCSLP LKE