Gene Daud_1183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1183
Symbol
ID	6027523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	1238479
End bp	1239492
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	641593998
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001717326
Protein GI	169831344
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.337643
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCATTG TAATGCACCA TAAGGCGAGC GAAGCTGAGA TTGAGGCAGT CGTGAAGAGA 
ATAGAGTCGG CCGGCTACCG GGCCCACCTG TCCCGCGGGG TGGAGCGGAC CATTATCGGG 
GCCATCGGCG ATGAGACCCT CCTCGGGGAT GCCGGGATTG AACTCCTGCC GGGGGTGGAC 
AAGGTTATTC CGATCATGGC CCCCTACAAG CTGGCCAGCC GGGTGATGAA AGCAGAAGGC 
ACGGTGATCA CCGTCGGGGA CGTGACCATC GGGGGCGACA CCATCCAGGT GATGGCCGGC 
CCATGTGCGG TGGAGAGCAA GGAACAGCTG TTCGAGGTGG CGGAAAAAGT AAGGGCTGCC 
GGGGCCCGGA TTCTACGGGG CGGCGCCTAC AAGCCCCGCA CTTCTCCGTA TTCGTTCCAG 
GGACTGGCCG AGAAGGGGCT GCAACTCCTG GCCGAGACCC GGGAGCGGTA TGGTCTTCTG 
ATTGTGACCG AGGTAATGGA CGTCCGGACT CTGCCGCTGG TGGCCGAGTA CGCGGACATC 
ATCCAGATCG GCACCCGGAA CATGCAGAAC TTCTACCTGC TGCGCGAGGT CGGCCGGTAC 
AGCAAACCGG TTCTGCTGAA ACGTGGCCTG TCGGCCACCA TCGAAGAATG GCTGATGGCG 
GCCGAGTACA TCCTGAACGA GGGGAACCAG AACGTAATCC TGTGCGAACG CGGGATCCGC 
AGTTTTGAAA CCTTTACCCG GAACACGCTG GATCTTTCGG CTGTGCCGAT CGTAAAGTAT 
CTCTCCCACC TGCCGGTGGT GGTGGACCCC AGTCACGGCA TCGGTAAGTA CCGGTTTGTG 
CCGCCGATGG CCCTCGCCGC GGTGGCCGCC GGGGCCGACG GCCTCTTGAT CGAAGTTCAC 
CCCAACCCGG CGGAGGCCTT GTGTGACGGG GCGCAGTCCC TGACCCCGAA GAAGTTCGGG 
AAGACTATGG TTCAACTGGC GCAGATCGCA CAGGCGGTCG GCCGGAGAGT TTAG

Protein sequence

MVIVMHHKAS EAEIEAVVKR IESAGYRAHL SRGVERTIIG AIGDETLLGD AGIELLPGVD 
KVIPIMAPYK LASRVMKAEG TVITVGDVTI GGDTIQVMAG PCAVESKEQL FEVAEKVRAA 
GARILRGGAY KPRTSPYSFQ GLAEKGLQLL AETRERYGLL IVTEVMDVRT LPLVAEYADI 
IQIGTRNMQN FYLLREVGRY SKPVLLKRGL SATIEEWLMA AEYILNEGNQ NVILCERGIR 
SFETFTRNTL DLSAVPIVKY LSHLPVVVDP SHGIGKYRFV PPMALAAVAA GADGLLIEVH 
PNPAEALCDG AQSLTPKKFG KTMVQLAQIA QAVGRRV