Gene Dole_1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1940
Symbol
ID	5694780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2343735
End bp	2345303
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	58%
IMG OID	641264538
Product	SH3 type 3 domain-containing protein
Protein accession	YP_001529821
Protein GI	158521951
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCTGGA AAACTCACAC CATTGTCAGA GGCACAATCG TTATATTCGG TATTGTCCTG 
GCGGCATGGA TGCTGGCTGC GTGTGCCCCG TGGTACCGGT CTTATGACAT CACGTCGGGC 
GAGGATTTGA CAAAAATTTC CGCCGTTCCC GAGTTACGAA AAGCTCTGAA GGACAGTAAG 
CCGGACGTTC GAATGGCGGC GGCCACGGCC CTTGGACGGA TCGGGCCCGA CGCAAGGGAT 
GCGCTCTCCG ATCTTGTGGA TGTACTGGGC GACAACAGGC ACGAGGTGCG CGAGGCATCG 
GCAAATGCGA TTTCGTCTAT TATCGGAACC GCACCGGTAT CGGAAGCGGA TAAGAACCTG 
ATGGTGCAGG TGCAGGCCAA CCGCCTTGCG TCCGAGGACT GGGCGGCTCG TGTGGACGCC 
GCCGACCAGT TGGCCCAAAT GGGCCCGGCT GGCGCGGATG CGGTTCCCGT GTTGATTTCC 
ACCCTGTCGG ACGAAACAGA ATGGAGTTAT TACTGGACCC GGCAGTACGA TAAAGTAAGA 
CGCGCCGCCG CAAACGCCCT TGGGGAGATG CGTTCCGCGG CAACGGCCGC CAGTCCCGCG 
CTGATCAAGG CCTCAAAATA TCAAGATCCC GGGGTTCGCC TGGAGGCGGT CAGGGCCCTG 
GGTAAAATCG GCACTCCATC CGACAGCACT GTAGTTAAGG CATTAACGGC CGCGTTAAAG 
GACGATGACG CGGGTGTGCG TCGCGAGGCG GCCGACGCAC TGGGGGCCTT TGAGGTGTAT 
GCAAACAATA CGGTTCCCAA CCTGGTAGAC GCTCTTTCCG ATCAGGATGT TGATGCGCGA 
AGAAAGGCGG CTCAGGTACT GGGCCGCTTC GGTCCCAAGA CAGACGCGGC GGCGGAAGCC 
CTTGTGGCCG CGCTGAAGGA TACCGACAAA GCGGTCAGGC AGACGGCGGC CCGCGCAATT 
GCCGAATTTG GCATCGACAA CAAGACGGCG GCAGCCACCC CCCTGAGACC GCCGGTTGCC 
GCTATGGCCC CTGAAGAGAC TGCAGCAGTG GAGACTACGG CACAACCGGA GACAAAAATC 
CGTTCCACTG TGGATCTGCT TAACATTCGG GCCATGCCCA GTGTAAACAG CCGACGTGTA 
GGTAAACTGC TGCAAAACGA AATTGCAACA GTGGTTGAGA CCCTGGTGGA TTGGGTCAAA 
ATCGAGAAAC CCGACGGCAC CACCGGCTAT GTGTTTAAAG AGTACACAGC GATGGTGCAT 
GAGACAGGGG ATGCCTCCAG GGTGCTACAA CCAGAGTCAC AGAAGGCGCA AGCCACTGTC 
AACATGCCGA TGGTACCGGT TGTCACCGCA CCGGTTGCCG TTGCTTCGGC TTCGACAGTT 
CCCAAAATAC GGCCAATCGT GGATGCCCTT GAGATGCGAT CAGAGCCTTT TGGGAGTGAA 
CAGGTCGGCC AACTGCTGCG TAATGAAGCG GCGGAGGTTG TCGAGAGCCG GGCCGGATGG 
ATCAAAATAA AAAAAGCCGA CGGCACCACC GGCTATGTGT TTAAAGAATA TACAGAGAGT 
GCCCCCTGA

Protein sequence

MPWKTHTIVR GTIVIFGIVL AAWMLAACAP WYRSYDITSG EDLTKISAVP ELRKALKDSK 
PDVRMAAATA LGRIGPDARD ALSDLVDVLG DNRHEVREAS ANAISSIIGT APVSEADKNL 
MVQVQANRLA SEDWAARVDA ADQLAQMGPA GADAVPVLIS TLSDETEWSY YWTRQYDKVR 
RAAANALGEM RSAATAASPA LIKASKYQDP GVRLEAVRAL GKIGTPSDST VVKALTAALK 
DDDAGVRREA ADALGAFEVY ANNTVPNLVD ALSDQDVDAR RKAAQVLGRF GPKTDAAAEA 
LVAALKDTDK AVRQTAARAI AEFGIDNKTA AATPLRPPVA AMAPEETAAV ETTAQPETKI 
RSTVDLLNIR AMPSVNSRRV GKLLQNEIAT VVETLVDWVK IEKPDGTTGY VFKEYTAMVH 
ETGDASRVLQ PESQKAQATV NMPMVPVVTA PVAVASASTV PKIRPIVDAL EMRSEPFGSE 
QVGQLLRNEA AEVVESRAGW IKIKKADGTT GYVFKEYTES AP