Gene Dole_0687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0687
Symbol
ID	5693517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	813100
End bp	814128
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	47%
IMG OID	641263279
Product	putative DNA-binding protein
Protein accession	YP_001528574
Protein GI	158520704
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.30359
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGCAAT CATCCGGCAC CTCCGAAATT GTCTTTTATC AGACCGAGGA TGGCAAGATA 
AAGATAGACA CGGTTTTTCA GGATGAAACC ATCTGGCTGA CCCAGGCAAA AATGGCGGAA 
CTGTTTGCCG TCAATGTTCC CGCCATATCC AAACACCTAA ACAATATATT TGAAGAGGGG 
GAACTGCAAA AGGAGGCAAC TGTTTCCAAA ATGGAAACAG TTCAACAGGA AGGCAGCCGG 
CAGGTGACCC GGACCAGGGA CTTCTACAAT CTTGATGCCA TTATCGCCGT GGGTTACCGG 
GTCAATTCCA AAAGAGCGAC TCAGTTCAGA ATCTGGGCGA CCCATATCTT AAAAGAGTAC 
ATCATCAAAG GTTTTGCCAT GAATGATGAC CGCCTGAAAC AGGCGGACCG GTGGGACTAC 
TTTGATGAAT GGCTGGAACG TATCCGTGAC ATCAGGGCAT CGGAAAAGCG GTTCTACCAG 
AAAATCCGTG ATATTTACGC TACTTCTATA GATTACGATA AACACTCGGA ACAGGCGCAG 
ATTTTTTTCA AGAAGGTGCA AAATAAAATG CTCTGGGCCA TTACCGGCAA AACCGCCGCC 
GAAATTATCG AATCCCGCAG CAATCCGGAC AAACCCAATA TGGGACTGAC CTCATGGCGG 
GGTTCCACAG TCAGAAAATT TGATGTGGGT ATTGCCAAGA ATTACCTGAA GGCAGATGAG 
ATAAAAGACC TGAATGAGAT CGTGACCATG TATCTGGATT ATGCCGAAAG GCAGGCCCGG 
CAGAGAAAAA CCGTGACCAT GGAACAGTGG TCGGGCAAAC TCGATGCCTT TCTGAAATTC 
AATGAGCAGG AGTTGCTGAC CCATGCGGGA GCAGTGAAGG CGGAAGTCGC CAGAAAAATC 
GCTGAAGACC GATACGAAGC GTTTGATAAA AAAAGAAAAA CAGCCGAGGC CCGGGCTGCG 
GATAAGGAAG ATTTAAAGGA GCTGGAAGAA ATCGAAAAAA GGCTTCTTGA AAAGCGACAT 
AAGAAATAA

Protein sequence

MTQSSGTSEI VFYQTEDGKI KIDTVFQDET IWLTQAKMAE LFAVNVPAIS KHLNNIFEEG 
ELQKEATVSK METVQQEGSR QVTRTRDFYN LDAIIAVGYR VNSKRATQFR IWATHILKEY 
IIKGFAMNDD RLKQADRWDY FDEWLERIRD IRASEKRFYQ KIRDIYATSI DYDKHSEQAQ 
IFFKKVQNKM LWAITGKTAA EIIESRSNPD KPNMGLTSWR GSTVRKFDVG IAKNYLKADE 
IKDLNEIVTM YLDYAERQAR QRKTVTMEQW SGKLDAFLKF NEQELLTHAG AVKAEVARKI 
AEDRYEAFDK KRKTAEARAA DKEDLKELEE IEKRLLEKRH KK