Gene Cwoe_3738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_3738
Symbol
ID	8734193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	3971049
End bp	3972092
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	71%
IMG OID	646504360
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_003395530
Protein GI	284045190
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.945238
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0752567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGTGA TGAAGCAGGA CGCGACCGAG GAAGAGATCC AGGCCGTCAT CGAGCGCGTC 
GAGGGCGCGG GCGCCCGCGC GCACCGCATC AACGGCGAGG AGCTGACGGT GATCGGCGCC 
CTCGGCGACC GCGAGCACGT CCAGAAGCTG GAGCTGGAGG GTTCACCCGG GGTCGAGAAG 
CTGCTCCCGA TCCAGAAGCC TTACAAGCTC GCCTCGTCGC AGATCCGCCA CGGCGAGCCG 
AGCGTCCTCG AGATCGGTGG CCGCAAGATC GGCGGCGACA ACTTCGCGCT GATCGCCGGC 
CCCTGCACGG TCGAGTCGCG CGAGCAGACG CTCGGCACCG CCGCGACGGT CGCCGCCGCC 
GGCGTCACGC TCTTCCGCGG CGGCGCGTAC AAGCCGCGCA CGTCCCCTTA CGCCTTCCAC 
GGCCTCGGGC AGGAGGGGCT GCGGCTGCTC GCCGAGGCCA AGCGGGAGAC CGGCCTGCCG 
ATCGTCACCG AGCTGATGGA CGTGCGCGAC CTCGAGCCCG TGCTGGAGGT CGCCGACGTG 
ATCCAGATCG GCGCGCGCAA CATGCAGAAC TACACGCTCC TGACCGAGCT CGGCCGCGCC 
GGCCGCCCGG TCCTGCTCAA GCGCGGTCTG TCGGCGACGC TGGAGGAGCT GCTGAACGCC 
TCCGAGTACA TCCTCAAGGA GGGCAACGAG GCGGTGATGC TGTGCGAGCG CGGGATCCGC 
ACGTTCGAGA CCGCCTACCG CTTCACGCTC GACCTGACCG CGGTGCCGGT GCTGAAGGAG 
CTGACGCACC TGCCGATCAT CGTCGACCCG TCGCACGCCG CCGGCCGGCG CGACCTCGTG 
CAGCCGCTGT CGCTGGCCGC CGCCGCGGTC GGCGCCGACG GCATCATCGT CGAGGTCCAC 
CCGAACCCCG ACGAGGCGAT CTGCGACGGA CCTCAGCAGC TCGTCGCGGC CGAGTTCGCC 
GCCTACGCGG AGAAGGTCGC GCAGGCCGCG GCCGTCGCCG GCAAGACGAT CTCGACCCTG 
GCCGCCGAGG CCACGGCCGC CTGA

Protein sequence

MIVMKQDATE EEIQAVIERV EGAGARAHRI NGEELTVIGA LGDREHVQKL ELEGSPGVEK 
LLPIQKPYKL ASSQIRHGEP SVLEIGGRKI GGDNFALIAG PCTVESREQT LGTAATVAAA 
GVTLFRGGAY KPRTSPYAFH GLGQEGLRLL AEAKRETGLP IVTELMDVRD LEPVLEVADV 
IQIGARNMQN YTLLTELGRA GRPVLLKRGL SATLEELLNA SEYILKEGNE AVMLCERGIR 
TFETAYRFTL DLTAVPVLKE LTHLPIIVDP SHAAGRRDLV QPLSLAAAAV GADGIIVEVH 
PNPDEAICDG PQQLVAAEFA AYAEKVAQAA AVAGKTISTL AAEATAA