Gene Dole_1271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1271
Symbol
ID	5694106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1519583
End bp	1520686
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	60%
IMG OID	641263865
Product	radical SAM domain-containing protein
Protein accession	YP_001529154
Protein GI	158521284
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACAG TGCTCTCAGA CCGCCGGCTT TTGCCGGTGT GGGAAAAGGT GAAAAACAGC 
GTACGGCTGG ATGCCGAAGA CGGCATGCGG CTTTACGAGA GCAACGACCT TGCCGGCATC 
GGCGGCATCG CCGATTATGT GCGCAAAAAA CGCCACGGCA ACAAGGCCTT CTACGTTCAT 
AACCGCCACA TCAACTACAC CAACATCTGC GTCAACCGCT GCCTGTTCTG CGCCTATTCA 
AAGGACAAGG GCGATACCGG CACCTATGTG CTTTCTCCGG ACCAGGTGGG CAGTGACGCA 
AAAAAACCGG AAAATGCCGG GGTCCGGGAG TTTCACATTG TGGGCGGAAT CAACCCGGAC 
CTGCCCTTTG ATTATTACCT GGACCTGATC CGGGCTCTCA AAAAGGCCCG GCCCGATGCC 
ACGGTCAAGG CCTTTACCGC CGTTGAGATC GACTTTATCG CCCGCATGGC CGGCCTCTCC 
CTGGAGGACA CCATCGCCGG GCTGAAGGCG GCCGGCCTTG CCATGCTGCC CGGTGGCGGG 
GCCGAGGTGC TGTGCGACCG GGTGAGGCAG AAGCTTTTTG CCAAAAAAAT TTCAGCGGCC 
CGTTGGCTGG AGGTGATGGA GACGGTGCAC CGGGCCGGGC TGGTCACCAA CGCAACGCTG 
CTGTACGGCC ATATTGAGAC CCTCGAAGAG CGGGTGGACC ATCTGCTGAC CCTGCGCCGG 
CTTCAGGACA CCACCGGCGG GTTTTCCGCC TTTATTCCCC TGGCCTTTCA CTCGGCCAAC 
ACAAAGCTTT CAGCACTTCC GCCTACCACC GCCTACGATG ATTTAAAGAC CATTGCCGTT 
GCCCGGCTGC TTCTGGACAA CATCGATCAT ATCAAGGCCT ACTGGGTGAT GATCGGAGAA 
AAGCTGGCCC AGGTGGCGCT CTCCTTCGGC GCCGATGACC TGGACGGCAC CATCATCGAG 
GAGCGGATCA CCCACACGGC AGGGGCCACA TCGGCAAAGG GACTGACGGT TTCCCAGCTG 
CGGCACATGG TTGAATCGGC CGGGTTCGAG GCTGTTGAGC GGGACTCGTT TTACCGGCCG 
GTGCCGGAAG AAGGGGGCGC CTGA

Protein sequence

METVLSDRRL LPVWEKVKNS VRLDAEDGMR LYESNDLAGI GGIADYVRKK RHGNKAFYVH 
NRHINYTNIC VNRCLFCAYS KDKGDTGTYV LSPDQVGSDA KKPENAGVRE FHIVGGINPD 
LPFDYYLDLI RALKKARPDA TVKAFTAVEI DFIARMAGLS LEDTIAGLKA AGLAMLPGGG 
AEVLCDRVRQ KLFAKKISAA RWLEVMETVH RAGLVTNATL LYGHIETLEE RVDHLLTLRR 
LQDTTGGFSA FIPLAFHSAN TKLSALPPTT AYDDLKTIAV ARLLLDNIDH IKAYWVMIGE 
KLAQVALSFG ADDLDGTIIE ERITHTAGAT SAKGLTVSQL RHMVESAGFE AVERDSFYRP 
VPEEGGA