Gene Anae109_0367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_0367
Symbol
ID	5377717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	420477
End bp	421493
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	72%
IMG OID	640841876
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001377566
Protein GI	153003241
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.719946
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.246047
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTCG TCATGAAGCC CCACGCCAGC GAGGGGGAGA TCGCCGCGGT CGTCGAGCGG 
ATCGCCTCCC TCGGGCTCAC CGCCCACCCC ATCCCGGGCG CGCAGCGCGT CGCCATCGGG 
ATCACCGGCA ACAAGGGCGG CCTCGAGGCG GAGCTCTTCG AGACGATGCC GGGCGTGCAG 
GAGGCGCTCC GCGTCTCGCA GCCCTTCAAG CTCGTGTCGC GCGAGGTGAA GGCGGACGAC 
ACGGTCCTCG ACGTCGGCGG CGTCCCGCTC GGCGGGAACG CGCTCGCCAT CATGGCGGGG 
CCGTGCTCGG TCGAGTCCCG CGAGCAGCTG CTCGAGGCGG CGCACGCGGT CCGCGCCGCA 
GGCGCGCGCT TCCTCCGCGG CGGCGCCTAC AAGCCGCGCA CGAGCCCCTA CGAGTTCCAG 
GGGCTCGCCG AGGAGGGCCT GAAGCTGCTC GCCCTCGCGC GCGAGGAGAC CGGCCTCAAG 
GTGGTGACCG AGGTGATGGA CGTCGAGACG CTGCCGATGG TGTCCGAGTA CGCCGACGTC 
CTCCAGATCG GCGCCCGGAA CATGCAGAAC TTCTCGCTCC TGAAGCAGCT CGGCGAGCTC 
CGCAAGCCGG TGCTCCTGAA GCGCGGCCCC TCCGCCACCG TCAAGGAGTG GCTCATGGCC 
GCCGAGTACG TGGTCTCGCG CGGCAACTAC CAGGTGGCGC TGTGCGAGCG CGGGATCCGC 
ACGTTCGAGA CCATGACGCG CAACACGCTC GACCTGAACG CCGTGCCGGT GCTGAAGGCG 
CTCACCCACC TTCCCGTGGT GGTGGACCCG TCGCACGGCA TCGGCCTGCG GGCCCACGTC 
GCCGCCATGG CGCGGGCCGG GGTCGCCGCC GGCGCGGACG GCCTCATCGT CGAGGTCCAC 
CCGCACCCGG AGAAGGCCCT CTCCGACGGG CAGCAGTCGC TCACGCCGCG CGAGTTCGAG 
GAGCTCATGC GGCAGGTGCG CGTCATCGCC GGCGCGGTCG GCCGCGCCAT CGCCTGA

Protein sequence

MLVVMKPHAS EGEIAAVVER IASLGLTAHP IPGAQRVAIG ITGNKGGLEA ELFETMPGVQ 
EALRVSQPFK LVSREVKADD TVLDVGGVPL GGNALAIMAG PCSVESREQL LEAAHAVRAA 
GARFLRGGAY KPRTSPYEFQ GLAEEGLKLL ALAREETGLK VVTEVMDVET LPMVSEYADV 
LQIGARNMQN FSLLKQLGEL RKPVLLKRGP SATVKEWLMA AEYVVSRGNY QVALCERGIR 
TFETMTRNTL DLNAVPVLKA LTHLPVVVDP SHGIGLRAHV AAMARAGVAA GADGLIVEVH 
PHPEKALSDG QQSLTPREFE ELMRQVRVIA GAVGRAIA