Gene Dole_2016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2016
Symbol
ID	5694856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2444654
End bp	2446975
Gene Length	2322 bp
Protein Length	773 aa
Translation table	11
GC content	59%
IMG OID	641264614
Product	SH3 type 3 domain-containing protein
Protein accession	YP_001529897
Protein GI	158522027
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000554023
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTTAA AACATTCCGC TTTTGTCAGG GGAGCGGCGG TTGTTTTCGC AACCGTGCTG 
GCGGTATGGC TGCTGGCTGC CTGTGCCCCG TGGTATCGCG CGTATGACAT TGCGTCGGAC 
GAGGATTTGA CAAAGATTTC CGCCATTCCA GAGCTTCAAA AAGCGTTGAA GGACAGCAAG 
CCCGATGTTC GGGTCATGGC GGCACAGACC CTCGGAAGAA TCGGTCCCAA TGCCAGGAGC 
GCGCTTCCCG ACCTGGTGGA TGTGCTGGAT GATGACAGGT ATGAGGTCCG GGCCGCAGGG 
GCCGATGCCA TTGAGAAAAT TATCGGTCCT GATCCGGGAG AGGAAGACAG GGACCTGATG 
GTGCGGGTCC ATATCAATCG CCTGGAGTCA AAAGACTGGA TAGCCCGCCT GAATGCCGCC 
AATCATCTGG CGGAAATGGG ACCGGAAGGG GCCGATGCAG TGCCGGCCCT GGTCTCCGCC 
CTGCTGGATA AGTCGGACTG GAACTCCCGT TACAATGAAG TGCGGCGGGC CGCCGCCCAT 
GCCCTTGGCG AAATGCGGTT TGCGGCCAGG GCCGCCAATC CAGCCCTTAT TGAGGCTTCC 
CGGTTCCATG ACTATGATGT CCGCCTGGAG GCGGTAAAGG CCCTGGGGAA GATCGGTCCC 
AAGAACGATA CCTCGGTGAT TGAGGCATTG AAAGCTTCCC TGAAGGACCC CGATTTTGAC 
GTGCGGCGTG AGGCGGCCAA CTCCCTGGGC GGGTTCGAAG TTTACGCGGA CAGCACCGTC 
CCCAACCTGG TCAAGGCCCT TTCCGACCGG GATTTTGATG TTCGGCGTGA GGCGGCCCAT 
TCTCTGGGCC GCATCGGCCC CAAGACCGAC GGGACAGTGG ATGCCCTTGT GATACTTCTG 
GATGATGAAT ACGCCGATGT GCGCAAGGCG GCAACAGAGG CCCTGGGCAA TGTTTCCCCC 
GACTACCGGG AAAAGGTGCT GCCCGGGATT CTTTCGCGGC TGGACGATAT AAACGAGGAG 
GTTCGCCTGG CGGCGGTGAA TACCATTGCC AAGTTTCGCA TCGGCAACGA GCCGGTGTTC 
CAGGCCCTGG AACGGTCAGC CCACGAGGAC CAGTCTTTTA AAGTAAAAAA ATCAGCCCTT 
GAGACACTTT ACGTATTAAA GGGCCTGGAC GCCGGTACTG CAGTGGCCGG ACTTCGGACC 
CGTCCGGCAG GTCCTGCTTC GGTGGCGGTT GAAGCCCCGG TTATCCTGCA AAAGACACCG 
GCAAAAATCC GATCCACCGT GGATGTGCTT AACATCCGGT CCATGCCCAG CGTTAACAGC 
CAGCGGATTG GCAAGCTTTA TCCCAACGAA ACCCCGCTCT TGCTTGAAAC CATGCCCGAC 
TGGCTCAAGA TCAAAAAGCC GGACGGCACC ACCGGGTATG TTTTCAGGGA GTACGCCGAG 
GTGGTGTCGA TGGCGGGAGC TGCGCCGGCT ACAATGGAGA CCGGCACTAT GAAGACCGCA 
GCCGCGGCTG CGGCTGGTGC CGCTGTGACG GTGCCGGCAG CAGTAACGCC CCCGTCTGCG 
ATGATGATCC GTTCCACCGC GGATGTCCTT AACATTCGGT CTGTTCCGGA CCTGAAGGGC 
CGTCGCGTTG GAAAGCTTGT GTTAAATGAA GAGGCCAAAG TCCTGGAATC GGACGGCGAC 
TGGCTGAAGA TCAGAAAACC GGACGGCACC ACCGGTTATG TGTTCAGGGA GTACACCGAG 
GTGGTGGCAA AGGCCGGAGA TGCGCCGGCG GCAATGAAGG CCGCAGCCGC AGCCGCTGCC 
GGTACCGCTA TGACGGCGCC GGCAACGATG ATCCGTTCCA CCGCGGATGT CCTTAACATT 
CGGTCTGTTC CGGACCTGAA GGGCCGTCGT GTTGGAAAGC TTTTCTTAAA TGAAGAGGCC 
GATGTCCTGG AATCGGACGG CGACTGGCTC AAGATCAGAA AACCGGACGG CACCACCGGT 
TATGTGTTCA GGGAGTACAC CGAGGTGGTG TCCGGTACAA CGGCAGCCCC AGAACCTTCG 
CCGGTAACAG TGGTAAAGCC TCAGGCTCCG GAAACCCTTC CGGCTGTAAC GCCGCCGGCG 
CCGGTGGAAA CGGCGGCCGT GCCGTCGGTG CCAAAGGTCC GTTCAATCGT GGAGTCCCTG 
GATATCCGGT CCGAGCCCTA TGGTGATGAG CAGGTGGGCC AGCTGGCGCA GGGAGAAGAA 
GTGGAGGTGC TCGACACCCT TGCCGAGTGG GTTAAAATCA AAAAAGCAGA CGGCACCACT 
GGGTATGTGT TCAAGGAATA CACCTCGCTT GTCAATAATT AG

Protein sequence

MPLKHSAFVR GAAVVFATVL AVWLLAACAP WYRAYDIASD EDLTKISAIP ELQKALKDSK 
PDVRVMAAQT LGRIGPNARS ALPDLVDVLD DDRYEVRAAG ADAIEKIIGP DPGEEDRDLM 
VRVHINRLES KDWIARLNAA NHLAEMGPEG ADAVPALVSA LLDKSDWNSR YNEVRRAAAH 
ALGEMRFAAR AANPALIEAS RFHDYDVRLE AVKALGKIGP KNDTSVIEAL KASLKDPDFD 
VRREAANSLG GFEVYADSTV PNLVKALSDR DFDVRREAAH SLGRIGPKTD GTVDALVILL 
DDEYADVRKA ATEALGNVSP DYREKVLPGI LSRLDDINEE VRLAAVNTIA KFRIGNEPVF 
QALERSAHED QSFKVKKSAL ETLYVLKGLD AGTAVAGLRT RPAGPASVAV EAPVILQKTP 
AKIRSTVDVL NIRSMPSVNS QRIGKLYPNE TPLLLETMPD WLKIKKPDGT TGYVFREYAE 
VVSMAGAAPA TMETGTMKTA AAAAAGAAVT VPAAVTPPSA MMIRSTADVL NIRSVPDLKG 
RRVGKLVLNE EAKVLESDGD WLKIRKPDGT TGYVFREYTE VVAKAGDAPA AMKAAAAAAA 
GTAMTAPATM IRSTADVLNI RSVPDLKGRR VGKLFLNEEA DVLESDGDWL KIRKPDGTTG 
YVFREYTEVV SGTTAAPEPS PVTVVKPQAP ETLPAVTPPA PVETAAVPSV PKVRSIVESL 
DIRSEPYGDE QVGQLAQGEE VEVLDTLAEW VKIKKADGTT GYVFKEYTSL VNN