Gene Msil_0124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0124
Symbol
ID	7094254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	117749
End bp	119140
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	64%
IMG OID	643463458
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002360468
Protein GI	217976321
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3200] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01358] 3-deoxy-7-phosphoheptulonate synthase, class II

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGTCG AGTCCTGGTC GCCGTCGAGC TGGAGAGCCA AGCCGATCGA GCAGTCGCCC 
GTCTATTCCG ACGCCGCGGC GCTCGCGGAT GTCGAACGGC AGCTCGCCGG CTTTCCTCCG 
CTCGTCTTTG CCGGCGAAGC GCGCAAGTTG AAGCGCATGC TCGGCAAGGT CGCCAATGGC 
GAAGCTTTTC TGCTTCAGGG CGGCGATTGC GCCGAAAGCT TTGCCGAGCA TTCGGCGGAC 
AATATTCGCG ATTTCTTCCG CGTCTTCCTG CAGATGGCGG TGGTGGAAAC CTTCGCCGCC 
GCGCTGCCGG TGGTCAAGGT TGGCCGCATC GCCGGCCAGT TCGCCAAGCC CCGTTCGGCG 
CCGAACGAGA CCGTCGGCGG CGTGTCGCTG CCGAGCTATC GCGGCGATAT CGTCAATGAC 
ATTGCGTTTG AGGCGAGCGC CCGCGTGCCA GACCCCGCGC GCCAGCTCAT GGCCTATCGG 
CAGGCGGCGG CGACCTTGAA CCTGCTGCGC GCCTTCGCGA CGGGCGGCTA CGCCAATCTT 
GAAAACGCGC ATCAATGGAT GCTGGGCTTC ATCAAGGACA GCCCGCAGTC GGCGCGCTAT 
CAGGAGCTTG CCGACCACAT CACCCAAACG CTCGGCTTCA TGCGGGCGAT CGGGCTCGAT 
CCCGAGTCCC ATCAGGAGCT GCGGCAGACC GATTTTTACA CCTCGCATGA GGCGCTGCTG 
CTCGGCTTCG AGGAGGCGCT GACGCGCGTC GATTCGACGA CCGGGGATTA TTACGCGACC 
TCCGGCCATA TGATCTGGAT CGGCGACCGC ACGCGTCAGC CCGGCCACGC CCATATCGAA 
TATGCGCGCG GCGTTAAAAA CCCGATCGGC CTCAAATGCG GCCCGACGCT GAACCCTGAT 
GAGCTGATCC GGCTGATCGA CATCCTGAAC CCGGACAATG AGGCCGGGCG CCTGACGCTG 
ATCTGCCGCT TCGGCGCCGA CAAGGTCGAG GCCAGCCTGC CGACCCTGAT CCGCGCCGTT 
CAACAGGAAG GACGCAGCGT CGTGTGGTCT TGCGATCCGA TGCATGGCAA CACGGTCAAG 
GCCGCCTCCG GCTACAAGAC GCGGCCGTTC GACAAGATCA TGAGCGAGAT CCGCTCCTTC 
TTCGCGGTCC ACCAGGGCGA AGGAACCTAT CCGGGCGGCG TGCATCTCGA AATGACCGGA 
AAGAACGTCA CCGAATGCAC CGGCGGCGCG CGCGCGATCT CCGACGCCGA TCTGCATGAT 
CGCTATCATA CCTATTGCGA TCCGCGCCTC AATGCAGAGC AGGCGATCGA GGTGGCTTTC 
CTGATCGCCG AACTGTTGAA GACCGGCCGT ATGGGCAAGG GCCTGCAGGC CCATCCCGCC 
GCCGCCGAAT GA

Protein sequence

MSVESWSPSS WRAKPIEQSP VYSDAAALAD VERQLAGFPP LVFAGEARKL KRMLGKVANG 
EAFLLQGGDC AESFAEHSAD NIRDFFRVFL QMAVVETFAA ALPVVKVGRI AGQFAKPRSA 
PNETVGGVSL PSYRGDIVND IAFEASARVP DPARQLMAYR QAAATLNLLR AFATGGYANL 
ENAHQWMLGF IKDSPQSARY QELADHITQT LGFMRAIGLD PESHQELRQT DFYTSHEALL 
LGFEEALTRV DSTTGDYYAT SGHMIWIGDR TRQPGHAHIE YARGVKNPIG LKCGPTLNPD 
ELIRLIDILN PDNEAGRLTL ICRFGADKVE ASLPTLIRAV QQEGRSVVWS CDPMHGNTVK 
AASGYKTRPF DKIMSEIRSF FAVHQGEGTY PGGVHLEMTG KNVTECTGGA RAISDADLHD 
RYHTYCDPRL NAEQAIEVAF LIAELLKTGR MGKGLQAHPA AAE