Gene Dole_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1643
Symbol
ID	5694480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1951350
End bp	1952498
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	61%
IMG OID	641264238
Product	saccharopine dehydrogenase
Protein accession	YP_001529524
Protein GI	158521654
COG category	[S] Function unknown
COG ID	[COG3268] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGATC TGGGAGGCAT CATGGACAAT CAGAAAATCG TACTTTTTGG CGCTACCGGC 
TATACCGGAA AGCAGGTGGC CCAGGAGCTG GTCAGGCGGG GCCTTTTGCC GATTCTGTGC 
GGCCGCAGCC GTGAAAAGCT GGAGTCTGTG GCCGCGGAAC TGGGCGGCCT GAAAACCGCG 
GTTGTCGATG TTGCCGACCC GGCCGGTCTG GCGGCCCTGG TGGGGAAAGG GGATATTCTG 
GTCTCCACGG TGGGGCCGTT TGCAAAGTAC GGCACAACCG CGGTTTCCGT TGCCGCTGAA 
AAAGGCGCTG TTTATATCGA CTCCACCGGT GAACCCTCCT TTATCGCCCG GGTGTTTGAA 
ACTTACGGAC CGCAGGCCCG TTCCACCGGC GCCACTCTGC TGACCGCCTG CGGGTACGAC 
TATATTCCGG GCAACTGCGC GGCCGGCATT GCCTTGAGCG CATCGGGCAA GAAGGCGGTG 
CGGGTGGACG TGGGCTATTA TTCAAAAAAG AAGGGCAGGG TCCAGCCCCT TGACATGAGC 
CAGGGGACCG CCTCTTCCCT TCGTCTGGCC ATGATCGATC CCGTCAAGGT ATGGCAGTCG 
GGGAAGCTGG TGGAGCAGAC CGGCGGTATC CGCACGCGCA CTTTTGATCT GGACGGCCAA 
CCCCATCCCG GTCTGACCGT GTCGTGTACC GAACATTTCT CCCTGCCGCG GGTTTTTCCC 
GAGCTGCGGG AGATCAATAC CTACCTGGGA TGGTTTGCCG GCAAAACTTA TATCATGCAG 
AAGGCGGCCC TGTTCCAGTC GGTTGCCGGA AAAATCCCAG GATACCGTTC ACTGGCAAGG 
GCCGCGCTGT CCATGCTGCC GGAGAGCACA GGCAAAGGAC CGTCACCGGA AATACTGCAA 
CAGCACCAGA CCCACGTGGT GGCTGAAACC TTTGACGAAA AAGGCCGCCT GCTGGCCCGG 
GCCGATCTTG TGGGTGTTGA CGGTTACTCG TTTACGGCGA AAATGATGGC CTGGGCCGCT 
CACCGGGCCG CCGTCCAGGG GTTTCGGGCC ACCGGCGCTG TCGGCCCCAT CGAAGCCTTT 
GACCTGGACG GCCTGATCGA GGGGTGTGAG GCATGCGGAT TGACGCCGTC GGTGCATCTG 
GGAAAATAA

Protein sequence

MKDLGGIMDN QKIVLFGATG YTGKQVAQEL VRRGLLPILC GRSREKLESV AAELGGLKTA 
VVDVADPAGL AALVGKGDIL VSTVGPFAKY GTTAVSVAAE KGAVYIDSTG EPSFIARVFE 
TYGPQARSTG ATLLTACGYD YIPGNCAAGI ALSASGKKAV RVDVGYYSKK KGRVQPLDMS 
QGTASSLRLA MIDPVKVWQS GKLVEQTGGI RTRTFDLDGQ PHPGLTVSCT EHFSLPRVFP 
ELREINTYLG WFAGKTYIMQ KAALFQSVAG KIPGYRSLAR AALSMLPEST GKGPSPEILQ 
QHQTHVVAET FDEKGRLLAR ADLVGVDGYS FTAKMMAWAA HRAAVQGFRA TGAVGPIEAF 
DLDGLIEGCE ACGLTPSVHL GK