Gene Cwoe_4999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_4999
Symbol
ID	8735465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	5330639
End bp	5331712
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	73%
IMG OID	646505626
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_003396785
Protein GI	284046445
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0260647
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCATCA CTCGACACCT CGACGACGTC CGCGACCAGC GCATCGCCCA TGTCGTCCCG 
CTCGTGACGC CCGCGCTGAT GCTCCACCAG CTCCCGCTGA CGGACGCCCA GGCGGAGGTC 
GTCGTCCGCG GGCGCGGCGA CGCCGCGCGC ATCCTCGACG GCGCCGACGA CCGGCTGCTC 
GTCGTCGTCG GGCCGTGCTC GGTGCACGAT CCCGACGCGG CGCTGGAGTA CGCCCGCCGG 
CTCGCCCCGG TCGCCGCCGA GCACAAGCAG GACCTGTGCG TCGCGATGCG CGTCTACTTC 
GAGAAGCCGC GCACGACGAC CGGCTGGAAG GGCCTGATCA ACGACCCGCA CCTCGACGGT 
TCCAACGACG TCAACACCGG CCTGCGGATG GCGCGCAGAC TGCTGCTGCA GGTGCTGGAG 
CTGGGGCTCC CGGTCGGCTG CGAGTTCCTC GACCCGATCA TCCCGCAGTA CATCGCCGAC 
ACCGTCGCCT GGGGCGCGAT CGGCGCGCGC ACGACCGAGA GCCAGACGCA CCGCCAGCTC 
GCCTCGGGCC TGTCGATGCC GGTCGGCTTC AAGAACCGCA CGGACGGCAA CGTCGGCGTC 
GCGGTCGACG CCGTCCGCGC CGGCGCCGCG CCACACACCT TCGCCGGCGT CGACGTGACC 
GGAACGCCGG CCGTCTTCAC CACGCGCGGC AACCCGGACT GCCACATCAT CCTGCGCGGC 
GGGCGCGGCA TGACGAACTA CGGGCCGGCG CAGGTCGCCG AGGCGCTGTC GGCGATGCAC 
GCCGCCGGCC TGCGCGAGCG CGTCATCGTC GACGCCTCGC ACGACAACAG CGGCAAGGAC 
CACGAGCGCC AGCCGCTCGT GGCGCAGGCG CTGGCCGAGC AGGTCGCGGG CGGCGACAGA 
GCGCTCGTCG GCGTGATGCT GGAGTCGTTC CTCGTCGCCG GCAGCCAGAG CCTCGGCGAC 
GGCAAGGACC TCACGTACGG CCAGTCGATC ACGGACAAGT GCATCGACTG GGAGACGACG 
GTCGACGTGC TCGCCGGCCT CGCCGCCGCG GCGAGAGCGC GCCGCACCGC CTGA

Protein sequence

MSITRHLDDV RDQRIAHVVP LVTPALMLHQ LPLTDAQAEV VVRGRGDAAR ILDGADDRLL 
VVVGPCSVHD PDAALEYARR LAPVAAEHKQ DLCVAMRVYF EKPRTTTGWK GLINDPHLDG 
SNDVNTGLRM ARRLLLQVLE LGLPVGCEFL DPIIPQYIAD TVAWGAIGAR TTESQTHRQL 
ASGLSMPVGF KNRTDGNVGV AVDAVRAGAA PHTFAGVDVT GTPAVFTTRG NPDCHIILRG 
GRGMTNYGPA QVAEALSAMH AAGLRERVIV DASHDNSGKD HERQPLVAQA LAEQVAGGDR 
ALVGVMLESF LVAGSQSLGD GKDLTYGQSI TDKCIDWETT VDVLAGLAAA ARARRTA