Gene Dole_3209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3209
Symbol
ID	5696071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	3845848
End bp	3847218
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	64%
IMG OID	641265828
Product	hypothetical protein
Protein accession	YP_001531089
Protein GI	158523219
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000788974
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATATTC CGGAAATCAT CTACAGTGCG GCCGCCGGCG CCCTTGCCGG CATTTTTTTC 
ACCTGGCTGG TCATGCGGGC CCGCCGGGCT GTGCTGGCCG ACCGGCTGGC GAGTGCCACC 
ACTGAAATTG AAACCACCAG AACCGAGCGG GATGCTTTGC GCGGCGAGCT GTCCGACCAC 
TCGGCCCGGT TCGCCCGGCT TGAATCGGCC CTGGAGCAGG AGCGGGAAAA ATCAAAAGAG 
ATGGCCGCCT TTGCCCAGGC CGCCACGCAA ACCCTGAAGG ACACCTTCAA GGGGCTTTCC 
GCCGACACCC TGGCCCAGAG CAGCGAGCAG TTTCTGCACC TGGCCAAAAG CGCGTTTGAG 
TCCTTTCACG TCAAGGCGTC CGGTGATCTG GCCCAGCGGC AGAAGGCCGT GGAAGAGATT 
GTCCGGCCGG TAAAAGAGGC CCTGGACAAG GTCAACACCC AGGTGGCCGA GGTGGAAAAG 
AGCCGCAAGC AGGCCTACGG GTCGCTGACC GCCACGGTGG AGTCCCTGCT GCGCGGCCAG 
AAGGAGCTTT CCACGGAAAC CGGCAACCTG GTCTCGGCCC TGCGCAAGCC CATGGTGCGG 
GGCCGGTGGG GCGAGATCCA GCTGCGCCGG GTGGTGGAGT TTGCCGGCAT GCTGCCCCAC 
TGCGACTTTG TGGAGCAGAG TTCGGTGAAG ACCGAAACCG GCACCCTGCG GCCCGACATG 
CTGGTCCGCC TGCCCGGCGG CAAGCTGGTG GTGGTGGATT CAAAGGCCCC GCTGGAGGCC 
TATCTTTCGG CGGTCAGCGC CGAAGACGAG GCCACGCGCA AAAAATTCAT GGCCGACCAC 
ACCCGGCACC TGCGCACCCA TATTCAGCAA CTGTCGGACA AGGCCTACTG GGAGCAGTTT 
GACCAGGCCC CGGATTTCGT GGTGCTGTTC CTGCCGGGCG AACCCTTTTT CAGCGCGGCC 
CTGGAGCAGG ACGAAGGGCT CATTGAGTTC GCCGTGGCCC GCCGCATCAT TCTGGCCTCC 
CCCACCACCC TGATCACCCT GCTTCAGGCG GTCTCCTACG GCTGGCAGCA GGAGCAGATC 
GCGGAAAACG CCCGCCACAT TCAGGAGCTC GGGGCCGATC TGTACCGGCG GATTTCAAAG 
ATGGCCGACC ATTTCGGCAC GGTGGGAAAA TCCCTGGACA GGGCCGTCAA AAGTTACAAC 
GATGCCGTGG GCTCCCTGGA GGCCCGGGTC CTGCCCGCGG CCCGCCGCTT TTCCGAGCTG 
GACACCAGCA TCAAAAACGA GATTCCCAAG ATCGAGCCGG TGAATGTGGT GTCAAGAGAT 
ATCTCCGCTC CGGAGCTGAT TGAACCGCCG GAGGAGGAAG AGGAGACCTG A

Protein sequence

MHIPEIIYSA AAGALAGIFF TWLVMRARRA VLADRLASAT TEIETTRTER DALRGELSDH 
SARFARLESA LEQEREKSKE MAAFAQAATQ TLKDTFKGLS ADTLAQSSEQ FLHLAKSAFE 
SFHVKASGDL AQRQKAVEEI VRPVKEALDK VNTQVAEVEK SRKQAYGSLT ATVESLLRGQ 
KELSTETGNL VSALRKPMVR GRWGEIQLRR VVEFAGMLPH CDFVEQSSVK TETGTLRPDM 
LVRLPGGKLV VVDSKAPLEA YLSAVSAEDE ATRKKFMADH TRHLRTHIQQ LSDKAYWEQF 
DQAPDFVVLF LPGEPFFSAA LEQDEGLIEF AVARRIILAS PTTLITLLQA VSYGWQQEQI 
AENARHIQEL GADLYRRISK MADHFGTVGK SLDRAVKSYN DAVGSLEARV LPAARRFSEL 
DTSIKNEIPK IEPVNVVSRD ISAPELIEPP EEEEET