Gene Dole_1124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1124
Symbol
ID	5693958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1333981
End bp	1335144
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	59%
IMG OID	641263718
Product	metal-dependent phosphohydrolase
Protein accession	YP_001529008
Protein GI	158521138
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00000827426
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCCCTA CATGGAATAC CATTAAGTCC GTACTTGAGC GGCGTGAACA GCAGACCCTT 
TCCTCCCGGG CCGAGTCCAG CGCGGCCGGC ATTCGGCGAA GAAGTGAAGA CCAACTGGAC 
CGGGACTACC GGCTGGCCTT TGCCGTGGAC GTGGACCGCA TTCTTCACTC CCTGGCCTAT 
ACCCGGTACA TCGACAAGAC CCAGGTCTTT TACCTGATTG AAAACGATCA CATCACCCAC 
CGGGTGCTGC ATGTGCAGCT GGTGTCCAAG GTGGCCCGCA CCATCGGCCG GGCCCTGGGC 
TTAAACGAAG ACCTGATCGA GGCCATTGCC CTGGGCCACG ATATCGGACA CGCCCCTTTC 
GGCCATGAAG GCGAGACCTA CCTGTCGAAG CTGTGCGAAC AGGCGGGCAT CGGCCCGTTT 
CTGCACAACG TGCAGAGCGT CCATTTTCTT GAATCGGTGG AGCGAAAGGG CAGGGGGTGC 
AACCTCTGCC TTCAGACACT GGACGGCATT CTGTGCCATG ACGGGGAGAT CCACACCACC 
AGCCTGAAGG CCGACCGGAA GAAAAATTTT CAGACTTTTG AAGAGGAGAT CGCGGCCAAG 
CGGCGTGATC CCTCCCTGCA ACTGACCCCC ATGACCATGG AGGGGTGCGT GGTGCGGTTT 
GCCGACACCA TCAGCTACAT CGGCCGGGAC ATCGAAGACG CCATTCGGCT GGGCCTGGTC 
CGGCGGGAGG ATCTCCCGGC GCAAAGCACG ACCGTGCTGG GCGACACCAA CGGCAAGATC 
GTCTACAGCC TGGTGACCGA CGTCGTGACC CAGAGCATGG ACAAGGACCA TGTGGCCTTC 
AGCGAGGCGG TGTCCGCGGC TCTGCGGGCC CTGAAGCGGT TCAACTATGA GCATATCTAC 
ATGAACCAGA GGATCAAGTC CGCTTCCAAC CGTATTGAGT CCCTGTTTGC CCTGCTTTTT 
GAACGATACC ATGGCGACCT GGAGGCGGAT AACCGGTCAT CGGTGATTTT CACCCATTTT 
TTAAAAGACA TGTCCCCGGA CTACCTGGAG CGGCACACGC CGCCGGAGGT TGTTCGGGAT 
TTCATATCCG GCATGACGGA CAACTATTTT CTGCGCCAGT GTCCGCCGGA CATGCAGCCG 
GTGCTTGATG TGGCCGGAAC GTGA

Protein sequence

MSPTWNTIKS VLERREQQTL SSRAESSAAG IRRRSEDQLD RDYRLAFAVD VDRILHSLAY 
TRYIDKTQVF YLIENDHITH RVLHVQLVSK VARTIGRALG LNEDLIEAIA LGHDIGHAPF 
GHEGETYLSK LCEQAGIGPF LHNVQSVHFL ESVERKGRGC NLCLQTLDGI LCHDGEIHTT 
SLKADRKKNF QTFEEEIAAK RRDPSLQLTP MTMEGCVVRF ADTISYIGRD IEDAIRLGLV 
RREDLPAQST TVLGDTNGKI VYSLVTDVVT QSMDKDHVAF SEAVSAALRA LKRFNYEHIY 
MNQRIKSASN RIESLFALLF ERYHGDLEAD NRSSVIFTHF LKDMSPDYLE RHTPPEVVRD 
FISGMTDNYF LRQCPPDMQP VLDVAGT