Gene Daud_1905 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1905
Symbol
ID	6026579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	2008203
End bp	2009168
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	68%
IMG OID	641594723
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001718030
Protein GI	169832048
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000989791
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTACCGC GGAAGCCCGG CTTTCGTCCC GGACGAAGGC CGGGCTTTTT TATTCTTAAT 
ACAAAGGGGA TGCTTGAGAT GATGGGGATG GAATTGGTAG AACCGCAAGC GGTGCCCGGG 
GCGGTCCGGG CCTGCGCGGC GGGGCGGCCG TACCGGCTGG CCGGCAGGGG CCACGGCGGC 
GCAAACACGG TGGTCCGGGT GGGCCGGGCG GAGTTCGGCT CTGGCGCGGT GAACGTAATC 
GCCGGCCCGT GCGCCGTGGA GAGCCGGGAA CAAATGACGG CCGCGGCCCG GGCGGCGGCC 
GGGTCCGGGG CGAAGGTCCT GCGGGGCGGC GCCTACAAGC CCCGGACTTC TCCCTACAGT 
TTCCAGGGCC TGGAGCGCGA GGGGCTCGAG TTGTTGGCCG AGGCCGCGGC GGCGGCGGGG 
TTGGCCAGCG TGACCGAAGT GATCGACGAG GAGAGCCTGG CGGCGGCGGT AGAGTACGTG 
GATATGCTCC AGGTCGGTTC GCGGAACATG CAGAACTTCC ACCTGCTGCG GGCGGTGGGG 
CGGGCGAACA AGCCGGTGCT TTTGAAGCGC GGGTTCTCCG CCACGATCGA GGAGTGGCTG 
ATGGCGGCCG AGTACATCCT GGCCGGGGGA AATACCCAGG TGGTGCTGTG CGAGCGGGGC 
ATCCGTACTT TTGAGACCTA CACCCGGAAT ACGCTGGACT TGAGCGCCGT CTCCCTGGTG 
AAAAAACTGA GCCACCTGCC GGTGATCGTC GACCCGAGTC ACGCCACCGG CAGGGCGGAA 
CTGGTCGCTC CGATGTCCCT GGCGGCGGTG GCGGCCGGGG CGGACGGGAT CATCGTCGAG 
ATGCACCCGG AGCCCGAAAA AGCCCTCTGT GACGGCAAGC AGTCCCTGGA CCCGGCCGCC 
TTTGACCGGC TGATGCGGGA AGTGGACATC ATCGCCCGGG CGTTGAACCG GGGCGTTGTG 
GATTGA

Protein sequence

MVPRKPGFRP GRRPGFFILN TKGMLEMMGM ELVEPQAVPG AVRACAAGRP YRLAGRGHGG 
ANTVVRVGRA EFGSGAVNVI AGPCAVESRE QMTAAARAAA GSGAKVLRGG AYKPRTSPYS 
FQGLEREGLE LLAEAAAAAG LASVTEVIDE ESLAAAVEYV DMLQVGSRNM QNFHLLRAVG 
RANKPVLLKR GFSATIEEWL MAAEYILAGG NTQVVLCERG IRTFETYTRN TLDLSAVSLV 
KKLSHLPVIV DPSHATGRAE LVAPMSLAAV AAGADGIIVE MHPEPEKALC DGKQSLDPAA 
FDRLMREVDI IARALNRGVV D