Gene Dole_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1984
Symbol
ID	5694824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2400673
End bp	2401845
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	60%
IMG OID	641264582
Product	hypothetical protein
Protein accession	YP_001529865
Protein GI	158521995
COG category	[S] Function unknown
COG ID	[COG3876] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000750429
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAACCA GACCAGGCAT CGAGATACTG TGTGAATCGC CGGGCCGGTG GCCCCTGACC 
GGACGGCTGG GACTGCTGGC CAACCCCGCG TCCGTAGATG GGCACCTGCG CCATGCCAGG 
GACCTGCTCC GCGAAACGTT TCCCGGCCGG CTGACCGCCC TCTTTTCCCC CCAGCACGGG 
TTTTTTGCCG AAAAACAGGA CAACATGGTC GAGTCCGCCG GTTTTACAGA CCCCGACCTG 
GGCATTCCGG TCTTCAGTCT CTACGGTGAC ACCCGGATTC CCACCCCGGA AATGATGGAT 
GCCATCGACA CCCTGGTCAT CGACCTTCAG GATGCCGGCA CCCGGGTCTA TACCTTTATT 
TACACCCTGT CCTACTGTAT GGAAGCGGCC CGTGATCACG GGAAACCGGT GGTGGTGCTG 
GACCGGCCCA ACCCGATAAA CGGCATCACC ATGGAGGGAA ACCTTCTGGC GCCGGAATGG 
GCCTCTTTTG TGGGACGGTA TCCCCTTCCC ATGCGCCACG GCCTGACCAT CGGCGAACTG 
GCCCGGCTTT TCAACGACCG GTTCGGCATC GGGTGTGACC TGACCGTTGT GCCCATGGCC 
CACTGGCAGC GGTCCATGCG ATTTGCCGAC ACCGGCCTGC CCTGGGTGGC GCCCTCGCCC 
AACCTGCCCA CGCCGGATTC AGCGCTTGTT TATCCCGGCC AGGTGATCTG GGAAGGCACC 
AACATCTCCG AAGGCCGGGG CACCACCCGG CCCTTTGAAT ATTTCGGCGC CCCCTTTCTT 
GATACGCACG CCGTGGCGGC CCGCATTCAA CCCGAATTTT TAAAAGGCGT GGTGCTGCGG 
CCCATGGTGT TTGAACCCAC GTCGAGCAAG TGGCAGGGCG TGCCGTGTCA GGGCTTTCAA 
ATTCACCCGG TCGCGCCTGA TCATTACCGT TCCTATACGC TCTCCCTGGC CCTGCTGCAG 
GTGGTGATCA ATATTCACGG CGATGCCTTT GCATGGAAAC CGCCGCCCTA CGAATATGAA 
CATGAGCGCA TGCCCATTGA CCTGATCCTG GGGGACGGCA ACCTGCGAAA ACGGATCGAA 
CAGCAGGAAG AAATTTTCGC CCTGGAACAG GAATGGCACG ACGATCTTGA ATCGTTTAAG 
ACCCTGAGCA AAAACTTTCA CCTCTACACA TAA

Protein sequence

MRTRPGIEIL CESPGRWPLT GRLGLLANPA SVDGHLRHAR DLLRETFPGR LTALFSPQHG 
FFAEKQDNMV ESAGFTDPDL GIPVFSLYGD TRIPTPEMMD AIDTLVIDLQ DAGTRVYTFI 
YTLSYCMEAA RDHGKPVVVL DRPNPINGIT MEGNLLAPEW ASFVGRYPLP MRHGLTIGEL 
ARLFNDRFGI GCDLTVVPMA HWQRSMRFAD TGLPWVAPSP NLPTPDSALV YPGQVIWEGT 
NISEGRGTTR PFEYFGAPFL DTHAVAARIQ PEFLKGVVLR PMVFEPTSSK WQGVPCQGFQ 
IHPVAPDHYR SYTLSLALLQ VVINIHGDAF AWKPPPYEYE HERMPIDLIL GDGNLRKRIE 
QQEEIFALEQ EWHDDLESFK TLSKNFHLYT