Gene Dole_2300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2300
Symbol
ID	5695148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2787973
End bp	2789421
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	60%
IMG OID	641264906
Product	hypothetical protein
Protein accession	YP_001530181
Protein GI	158522311
COG category	[S] Function unknown
COG ID	[COG3333] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.704493
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATCAC TGATGATTGA GCAGGTTGTT GCAGCGACTC ACCTGATAGC CACGCCGGCC 
ACCCTTTCGG TCATGCTGCT GGGCATTGTC CTGGGGGTGT TTTTTGGGAT CATGCCCGGC 
ATCGGGGGGC TGACCGCCCT GGCGCTCCTG CTGCCGTTTA TCTATGACAT GAACCCTGCC 
ACCGGTCTCT GTTTTCTGGT GGCTACCCAT GCCGCCGTGG ATGCGGGCGG CGTGGTCACC 
TCCATCATGC TGGGTATTCC CGGTTCTCCT GCCAACGCGG CGGTGATTGA AGACGGGTTC 
GCCTTACGGC GGGAGGGCAG GGGGCTGTAT GCCGTGGGCG CGGCCCTGAC CGCCTCGGTG 
GCCGGCGGCC TTTTCAGCGC CGCCCTGCTG GTGGTGCTGC TGCCTGTACT CCAGACGGTT 
GTACTTTCTT TCGGCTCACC GGAAATCTTT CTGATCGTTC TGACCGGCCT CACCTATGTG 
GCGGTGCTGG GCCGGGGCTC CACCCTCAAG GCCTTTGTTG CGGTGGCCCT GGGCGTGTTT 
CTCTCTTCAA TCGGTTATCA GCGCATCACC GGAGAACCGC GGCTGTGGTT CGGTGTCGAA 
TACCTTCTGG ACGGCGTGCG CCTGATTCCC CTAGTGCTGG GCCTGTTTGC CGTTCCGGAA 
ATTCTCAACC TGTTTGCGTC AAAAAAAAGA ATCGACGATA CGGATAATCG CCGCGAGTCT 
ATTTTTCAAA TGTGGGCGGG CGCGCGGGAG GTGTTCAAGC GGCCCCTGCT GCTGGTCAAG 
TCCTCGGTGA TCGGCATGGT GGTCGGCATT ATTCCCGGCG TAGGAGGCGA AACCGCGCCG 
TTTCTGGCCT ATGCCTCGGC AAAAAAGTCA TCGAACGAAA GAATCGTGGG TGTCATCGCG 
CCGGAGAGCA GCAACAACGC CAAGGAGGGG GGCGCGCTGG TGCCGACCCT GGCCCTGGGG 
ATTCCGGGAA GCGCGGGCAT GGCCATACTG ATGAGCGGTT TTTTGATACT GGGGATCAAT 
CCCGGCCCCA AGTTCATCAA CCAGCACATG GACATCGCCC TGGGACTGGT CTTTACCCTG 
GCGATCACCA ACGTGGTGTC GGCCCTGGTG GTGATACCGC TGGCCGCCTA TGTGGCAAAG 
ATCATCAGGA TTCAGGCTGT GATACTGGCG CCGGCCCTGT CGGCCCTGGT GATCTTCGGC 
ACGTATGCGT CAAGCCATAA TCCGTATGAT GTGGCGGCGC TGTTTGCCTG CGGTCTGCTG 
GGCATCGGCA TGCAGCGGTT TTCCTTCAGC CGGCCGATCC TGATTTTAAG TTTCATCCTG 
GCCCCGATCA TTGAAACCTA TCTGCACATA TCCATACAGG CTTACGGCCT GGGCATGTTT 
GCGCGCCCCA TCTTCCTGGT GCTGCTGGTG GTGCTGGTGT TAAGCGGTAT CGGGCTGAAG 
AAAAAATAG

Protein sequence

MASLMIEQVV AATHLIATPA TLSVMLLGIV LGVFFGIMPG IGGLTALALL LPFIYDMNPA 
TGLCFLVATH AAVDAGGVVT SIMLGIPGSP ANAAVIEDGF ALRREGRGLY AVGAALTASV 
AGGLFSAALL VVLLPVLQTV VLSFGSPEIF LIVLTGLTYV AVLGRGSTLK AFVAVALGVF 
LSSIGYQRIT GEPRLWFGVE YLLDGVRLIP LVLGLFAVPE ILNLFASKKR IDDTDNRRES 
IFQMWAGARE VFKRPLLLVK SSVIGMVVGI IPGVGGETAP FLAYASAKKS SNERIVGVIA 
PESSNNAKEG GALVPTLALG IPGSAGMAIL MSGFLILGIN PGPKFINQHM DIALGLVFTL 
AITNVVSALV VIPLAAYVAK IIRIQAVILA PALSALVIFG TYASSHNPYD VAALFACGLL 
GIGMQRFSFS RPILILSFIL APIIETYLHI SIQAYGLGMF ARPIFLVLLV VLVLSGIGLK 
KK