Gene Daud_1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1904
Symbol
ID	6026477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	2007071
End bp	2008189
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	67%
IMG OID	641594722
Product	prephenate dehydratase
Protein accession	YP_001718029
Protein GI	169832047
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0916421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACCA TAGCCTATCT CGGGCCGGAG GGAACTCATT CGGAAGAAGC GGCTTCCCGG 
TGGGCGGGTG ACCGCCCGAT GCTTCTCCGC CCATTGCGTT CCCTGGTCGA AGTGGTCGGG 
GCGGTGGAGG GCGGGAGCGT GGACTGGGGT CTCCTGCCGG CGGAAAACTC GGGCGAAGGT 
TCCCTGGGAC TGACACTGGA CCTTTTGGCC CACCAGGCCG ACCGGGTCCA GATCTGCGGG 
GAGGTGGTGC TCCGTATCCG GCACCACCTG CTGGCCCGCC CGGGGGTGAG CCGGGAGCGG 
GTCACCCGGA TCATTTCTCA TTCCCAGGCG CTGGCACAGT GCCGCGAGCA CCTGGCCCGA 
GACTTTCCCG GGGTCGAACT GGTGGAGAGC ACCAGTACCG CCGAGGCGGC ACGAGCGGTG 
GCGCAAACCG GCCGGCCGTG GGCGGCGGTG GGCACCCGGA AAGCGGCTCG GCTGCACGGC 
CTGTCGGTGT TGGCGGAGGA CGTGGCCGAC CTCAAGGAGA ACGCCACCCG CTTCCTGGTG 
ATCGGGCGGC GGGGCTGCCG GACCGGGCCG GGCGACAAGA CCACGGTCCT GGTCGCGGTC 
GATGGCCGCC GTCCTGGTTC CCTGTACCGC CTGCTGGGCG AATTCGCGCG CCGGGGCATC 
AACCTGACGC GCATTGAATC GCGGCCGGCC AAGACCCGGC TGGGGGAATA CATTTTCTTC 
ATCGATCTGG AGGGACATCC GGGTGAACCC GAGGTTGACG AAGCTCTGGC TGGCGTGCGG 
GCGAGAAGCA GTTTTTGCAA AATCCTGGGA TCCTACCCGG CGGACGGTGC TTCTCAGACG 
CCGCGGGACC CGGTGTCGTC CGACCTGGAG ACGATCCGGG CCGAAATCGA CGTGACCGAC 
AGCCAGATTG TGGCCCTCTT GGCCGAGCGG GCCGAACTGG CGCGCCGGGC CGGGAAATTC 
AAGGACGGGA GACCGGTGCG CGACCCGGAA CGGGAAGCGG AGATCAAGGA ACGGCTGCGG 
GCGCTGGCCG TGAGGAAGGG ACTCGATGCC GACATAGTCA CCGGAGTCTA TGAGTTGCTG 
CTGCCTTATT TCGTCGAGTT GCAGGGTGGC CCCGGCTAG

Protein sequence

METIAYLGPE GTHSEEAASR WAGDRPMLLR PLRSLVEVVG AVEGGSVDWG LLPAENSGEG 
SLGLTLDLLA HQADRVQICG EVVLRIRHHL LARPGVSRER VTRIISHSQA LAQCREHLAR 
DFPGVELVES TSTAEAARAV AQTGRPWAAV GTRKAARLHG LSVLAEDVAD LKENATRFLV 
IGRRGCRTGP GDKTTVLVAV DGRRPGSLYR LLGEFARRGI NLTRIESRPA KTRLGEYIFF 
IDLEGHPGEP EVDEALAGVR ARSSFCKILG SYPADGASQT PRDPVSSDLE TIRAEIDVTD 
SQIVALLAER AELARRAGKF KDGRPVRDPE REAEIKERLR ALAVRKGLDA DIVTGVYELL 
LPYFVELQGG PG