Gene Daud_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1089
Symbol
ID	6027346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	1146549
End bp	1147655
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	65%
IMG OID	641593904
Product	radical SAM domain-containing protein
Protein accession	YP_001717233
Protein GI	169831251
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGACTTCT GGTTCGTGGA CGATAGGCTC GAAGCGGTTG CCGGGAAGGT GCGGAATGGT 
GAGCGGCTCG GGTTGGAGGA CGGGGTGATC CTTTTCCGGT CCCCGGACCT GATCGGAGTC 
GGGCAGCTGG CCGACGCCGT CCGGCGCAAG AAACACGGCG ACCGGGTATA CTTCGTGGTG 
AATCGGCACA TCAACCACAC CAACATCTGC GTGAACGGTT GCCGGTTTTG CGCTTTCGGC 
AAGGAGCCGG GCGAGCCGGG CGGCTACGTG ATGTCCCTGG ACGAGATCGA GGCCCGGGCC 
CGCGAATCCT GGGCACTCGG CATCTCCGAA GTGCACGTCG TTGGGGGTCT GCACCCCGAC 
CTGAACCTGG ACTACTACCG GGAGATGCTC ACCCGGCTCC GGAACACCGT CCCCGGCGTG 
ATCATCCAGG CCCTGACCGC GGTCGAGGTG GACTACCTAG CCGGCCTGCA CGGGCTTGAG 
CTGGAGGATG TACTTACCGA ACTCCGGGCG GCTGGCCTTG ATTCCCTGCC TGGCGGCGGG 
GCCGAGGTTT TCGCCCCCCG GGTGCGGGAG TCGGTCTGCC CGAAAAAGAT CAGCGGTGCA 
CGGTGGCTCG CCGTACACGA GACGGCGCAC CGGCTGGGCA TCCGCACCAA CGCCACCATG 
CTCTACGGGC ATGTGGAAAC GCTGGAGGAG CGAGTCGAGC ACCTCCTACA ACTGCGGGAA 
CTTCAGGATC GGACCGGGGG CTTTCAGGCT TTCATCCCGC TGGCCTTCCA CCCGTGGAAC 
ACCGCCCTCG AACCGGAGGT GCCCGCCGGC ACTACCGGGT ACGACGATCT GAAAATGCTG 
GCGGTGGCGC GGCTCATGCT CGACAACTTC GACCACATCA AGGCCTTCTG GGTGATGATC 
GGACCCAAGC TGGCCCAGAT TTCCCTAAAC TTCGGGGTCA ACGACATCGA CGGCACGGTG 
GTCGAGGAAC GAATCACCCG CGCGGCCGGT GGGCAGACGG CCCATGGTCT GGAGCGCGGG 
GAACTCTTGC GGCTCATCCG GGCGGCGGGC CGGGTGCCGG TGGAACGCGA TACGTTGTAT 
AACGTGGTCA GGGAGGATTT CGCCTGA

Protein sequence

MDFWFVDDRL EAVAGKVRNG ERLGLEDGVI LFRSPDLIGV GQLADAVRRK KHGDRVYFVV 
NRHINHTNIC VNGCRFCAFG KEPGEPGGYV MSLDEIEARA RESWALGISE VHVVGGLHPD 
LNLDYYREML TRLRNTVPGV IIQALTAVEV DYLAGLHGLE LEDVLTELRA AGLDSLPGGG 
AEVFAPRVRE SVCPKKISGA RWLAVHETAH RLGIRTNATM LYGHVETLEE RVEHLLQLRE 
LQDRTGGFQA FIPLAFHPWN TALEPEVPAG TTGYDDLKML AVARLMLDNF DHIKAFWVMI 
GPKLAQISLN FGVNDIDGTV VEERITRAAG GQTAHGLERG ELLRLIRAAG RVPVERDTLY 
NVVREDFA