Gene Msil_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2030
Symbol
ID	7094228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2201709
End bp	2202935
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	62%
IMG OID	643465354
Product	5-aminolevulinate synthase
Protein accession	YP_002362332
Protein GI	217978185
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0156] 7-keto-8-aminopelargonate synthetase and related enzymes
TIGRFAM ID	[TIGR00858] 8-amino-7-oxononanoate synthase [TIGR01821] 5-aminolevulinic acid synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTACG AACAAGGCTT CCAGGTCCGG ATCGACGCCC TGCATGCGGA GGGGCGATAC 
CGCGTCTTCG CCGACATCAT CCGCCAGCGC GGAGCCTTTC CCAAAGCCGA GCATTTACGG 
GGCGGCGCGC ATCGCAGCGT GACGGTCTGG TGCTCCAATG ATTACCTCGG CATGGGGCAG 
CATCCCGTCG TGCTCGCGGC GATGCATGAG GCCCTCGATA CGGCCGGCGC AGGATCGGGC 
GGAACGCGGA ATATTTCCGG CACCACCCAT TATCACGTCG AACTCGAGGC CGAGCTGGCT 
GACCTGCATG GCAAGGAATC CGCCTTGTTG TTTACGTCCG CCTATGTCGC CAATGATGCC 
GCGATCGCGA CGTTGGTCAA ATTGCTCCCG GGCTGCGTCA TTTTTTCCGA CGAGAAAAAT 
CACGCGTCTC TGATTGCGGG GATTCGTCAC GGCGGCGGCC AGAAGGAAAT CTGGCGCCAC 
AACAACATCA AGGATCTTGA GGCCAAACTC AGCAAATATC CAAGGCACGC GCCGAAATTG 
ATTGTCTTTG AAAGCGTCTA TTCGATGGAC GGCCATATTG CGCCGATTGC GGAGGTCTGC 
GCGCTGGCGA AGAAATATAA CGCGCTGACC TACCTCGACG AGGTTCATGG CGTCGGCCTC 
TATGGCGCGC GTGGCGCCGG CGTCGCCGAG CGCGACGGCG CGATGGATCA GGTCGACATC 
ATAAATGGCA CGCTCGCCAA GGGCTTCGGC GTGATGGGCG GCTACATCGC GGGCAGCCGC 
GCCTGCTGCG ACGCAATCCG CTCCTATGCG GCGGGCTTCA TCTTCACGAC CTCGCTCGCG 
CCCGTCATCG CCGCCGGCGC GAGGGCCAGC ATCCGCCACC TGAAAGCCAG CAGCGCCGAG 
CGCGTACTTC ACCAGCAGCG CGCGATCACA TTGAAGCAGC GCCTCACCGA CGCCGGCTTG 
CCGGTCATGA GAAGCCAAAG CCACATCGTG CCGGTGATCG TCGGCGATCC GGTGCACTGC 
AAGGCGATCA CCGATCTGTT GCTCGACGAT TATGCGATCT ATGTGCAGCC GATCAACTAC 
CCGACCGTCG CGCGCGGTTC GGAGCGCATA AGGCTGACGC CGTCGCCGGT GCATACGGAC 
GCCCAGATGG ACTATCTCGT CGACACGCTG TCACATCTCT GGTCGCGGTG TCCGATGTCG 
CAGGCGATGG CGATTGCCGC GCAATAA

Protein sequence

MNYEQGFQVR IDALHAEGRY RVFADIIRQR GAFPKAEHLR GGAHRSVTVW CSNDYLGMGQ 
HPVVLAAMHE ALDTAGAGSG GTRNISGTTH YHVELEAELA DLHGKESALL FTSAYVANDA 
AIATLVKLLP GCVIFSDEKN HASLIAGIRH GGGQKEIWRH NNIKDLEAKL SKYPRHAPKL 
IVFESVYSMD GHIAPIAEVC ALAKKYNALT YLDEVHGVGL YGARGAGVAE RDGAMDQVDI 
INGTLAKGFG VMGGYIAGSR ACCDAIRSYA AGFIFTTSLA PVIAAGARAS IRHLKASSAE 
RVLHQQRAIT LKQRLTDAGL PVMRSQSHIV PVIVGDPVHC KAITDLLLDD YAIYVQPINY 
PTVARGSERI RLTPSPVHTD AQMDYLVDTL SHLWSRCPMS QAMAIAAQ