Gene Dole_2110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2110
Symbol
ID	5694953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2562757
End bp	2563755
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	60%
IMG OID	641264711
Product	KpsF/GutQ family protein
Protein accession	YP_001529991
Protein GI	158522121
COG category	[M] Cell wall/membrane/envelope biogenesis [T] Signal transduction mechanisms
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation [COG2905] Predicted signal-transduction protein containing cAMP-binding and CBS domains
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000613072
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAGA AAAAAGAGAT CACGGACATC ACTCAGCAGG CCATTGATGT TCTGAAGAAT 
GAGGCAAAAG GAATTCTGGA GGTGGCCGCC AACCTGGACC ACCAGTTTGA AAAGGCGGTG 
GACCTGATCT GCCGGTCAAA AGGCCGGCTG GTTGTCAGCG GCATCGGCAA ATCGGGCATC 
GTGGGCCAGA AAATCGTGGC CACCCTCAAC AGCACCGGCA CCCGTGCCCT GTTTCTCCAT 
CCGGTGGAGG CCATGCACGG CGACCTGGGC ATCGTGGGGC CGAAGGACGT CTTTCTGGGC 
CTCTCTAACA GCGGAGAGAC CGAAGAACTT ACCGGCCTGA TTCCCACAAT CCGCAACGTG 
GGCTGCAGGG TAATCGCCTT TACCGGCAAT ACCCACTCCT CCCTGGCCCG GCAGAGCGAT 
ATCGTAATTA ATGTGGGCGT GAAAAAAGAG GCCTGCCCCC TGGGACTGGC CCCCACTACC 
AGCACCACGG CCCTTATGGC CATGGGCGAC GCCCTGGCCG TGTCCTTGAG CATCAGAAAA 
GACTTCAAGT CCAGTGATTT CCAGCGGTTC CACCCCGGCG GCTCCCTGGG CCGGCGCCTG 
GCCCTCAACG TATCGGAGAT CATGCTCACC GGTGACAGGG TGCCCGCGGT TCCGGTCAAA 
ACCCCCATTG AGGAGGCCCT GGCCGTCCTG GACCGTCAGA ACCTGGGGGC ACTGCTGGTG 
GTCAGAAAAA ACAACACCCT GGCAGGCATT CTGACAGACG GTGACCTTCG GCGGTTGTAT 
CTGGCAAAAG AACCCCTGTC GGGCGGCCCC GTGGACAGCA TAATGACGAA AAACCCTTTG 
ACCGTCCATC CGGACTCCCC GGTCTACGAC GCACTGAACA TCCTGGAGCA GCACCAGGTC 
ACGGCATTGC CGGTGACCGC CGCCGGCAAA AAGGTGTGTG GCATTCTGCA CCTGCACGAC 
ATCCTGGGCA AAGGGGCGTT CAAGTTCAAC GGCCGGTAA

Protein sequence

MKQKKEITDI TQQAIDVLKN EAKGILEVAA NLDHQFEKAV DLICRSKGRL VVSGIGKSGI 
VGQKIVATLN STGTRALFLH PVEAMHGDLG IVGPKDVFLG LSNSGETEEL TGLIPTIRNV 
GCRVIAFTGN THSSLARQSD IVINVGVKKE ACPLGLAPTT STTALMAMGD ALAVSLSIRK 
DFKSSDFQRF HPGGSLGRRL ALNVSEIMLT GDRVPAVPVK TPIEEALAVL DRQNLGALLV 
VRKNNTLAGI LTDGDLRRLY LAKEPLSGGP VDSIMTKNPL TVHPDSPVYD ALNILEQHQV 
TALPVTAAGK KVCGILHLHD ILGKGAFKFN GR