Gene Daro_3324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3324
Symbol
ID	3566308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3574262
End bp	3575341
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	62%
IMG OID	637681796
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_286523
Protein GI	71908936
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000917904
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGATGCCGC AAAGTAAACC GAATACCGAC GACCTTCGCA TCAAGGAAAT CAAGGAGCTG 
GTGCCGCCAG CCCACGTTTT CCGCGAGTAT CCGGTGTCCA CTCGGGCGGC GCAAACGACC 
TATGTCGCCC GCCAGGCAAT TCACCGCGTG CTGCATGGCG CCGACGACCG CCTGCTGGTC 
GTCATCGGCC CCTGCTCGAT CCATGACTAC GAACTGGCCA TGGATTACGC CAAGAAACTG 
GCCAAGGAAG CCGAGAAATA CGCCGAGGAC CTGATCGTCG TCATGCGCGT CTATTTTGAA 
AAGCCGCGGA CCACAGTTGG CTGGAAAGGC CTGATCAACG ATCCGCGCAT GGACAACACC 
TTCCGCATCA ACGAAGGCCT GCGTCTGGCC CGCCGCATCC TGCTTGAGGT CAATGAGCTG 
GACCTGCCTT GCGCCACCGA GTTCCTCGAC ACCATCACGC CGCAATACAC CGCCGACCTG 
ATCGCCTGGG GCGCCATCGG TGCGCGCACC ACCGAGTCGC AGGTGCACCG CGAGCTGGCT 
TCCGGCCTTT CCTGCCCGGT CGGTTTCAAG AACGGCACCG ACGGCAACAT GCGCATTGCC 
GTGGATGCGA TCCGCTCGGC CAACTCGCCA CACCATTTCC TGTCGGTGAC CAAGTCCGGC 
CACACCGCCA TCGTGTCGAC GATGGGCAAC GAGGACTGCC ACGTCATCCT GCGCGGCGGC 
AAGGAACCGA ACTACGACGC GGCCAGCGTC GATGCCGCAT GCACCGAAAT CGCTAAATCC 
GGCCTCGCCG CCCGGCTGAT GGTCGATTTC TCGCACGGCA ACAGCCGCAA GCAATACAAG 
CTGCAAATGG AAGTCTGCGA CAGCGTGGCC GAGCAGATCG CCGGTGGCGA AGACCGCATT 
GTTGGCGTCA TGGTCGAATC GCACCTCGTC GAAGGCCGCC AGGACATCTC GCCGGACAAG 
CCGCTGACCT ACGGCCAGAG CGTGACTGAT GCCTGTATCA ACTGGGATGA CAGCCTGAAA 
GTGCTCGAGA AACTGGCAGC TGCCGTCAGG GCAAGACGAG TCGCCGAAGC GTCAGAGTAA

Protein sequence

MMPQSKPNTD DLRIKEIKEL VPPAHVFREY PVSTRAAQTT YVARQAIHRV LHGADDRLLV 
VIGPCSIHDY ELAMDYAKKL AKEAEKYAED LIVVMRVYFE KPRTTVGWKG LINDPRMDNT 
FRINEGLRLA RRILLEVNEL DLPCATEFLD TITPQYTADL IAWGAIGART TESQVHRELA 
SGLSCPVGFK NGTDGNMRIA VDAIRSANSP HHFLSVTKSG HTAIVSTMGN EDCHVILRGG 
KEPNYDAASV DAACTEIAKS GLAARLMVDF SHGNSRKQYK LQMEVCDSVA EQIAGGEDRI 
VGVMVESHLV EGRQDISPDK PLTYGQSVTD ACINWDDSLK VLEKLAAAVR ARRVAEASE