Gene Msil_3009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3009
Symbol
ID	7093504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3322095
End bp	3323852
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	62%
IMG OID	643466320
Product	acetolactate synthase, large subunit, biosynthetic type
Protein accession	YP_002363282
Protein GI	217979135
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID	[TIGR00118] acetolactate synthase, large subunit, biosynthetic type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.161058
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAATT TGATCACCGG AGCCGAGATG GTCGTCCGGG CGCTGCAGGA CCAGGGCGTC 
GACAGTATCT TCGGCTATCC GGGCGGCGCG GTGCTGCCGA TCTATGACGC CCTGTTCCAT 
CAGAACCAGA TCGTTCACGT GCTGGTGCGC CATGAGCAGG GCGCGGCCCA TGCGGCGGAG 
GGCTATGCGC GCTCGAGCGG CAAGGTCGGC GTCGTTCTCG TGACCTCGGG GCCCGGCGCG 
ACCAACGCCA TCACCGGCCT CACCGACGCG TTGATGGATT CGATCCCGCT GGTTTGCATC 
ACCGGACAGG TTCCGACGCA TCTCATCGGC TCCGACGCGT TCCAGGAATG CGACACGGTT 
GGCATCACTC GCCATTGCAC CAAGCATAAT TACCTCGTGC GTTCGATCGA GGACCTGCCG 
CGCGTTCTGC ATGAGGCGTT CTACGTCGCG CAGACGGGCC GCCCCGGTCC CGTCGTCATC 
GACATCCCGA AGGACGTTCA ATTCGCGCTT GGCGATTACT TCGGCCCGCA CAAGATCGAG 
CACAAGACCT ATAAGCCGAG GCTCGACGGC GACGCCGAGA AGATCGAGCA CGCCGTCACC 
ATGATGCTTG CGGCGCGTCG GCCGGTTTTT TACACGGGCG GCGGCGTGAT CAATTCGGGG 
CCGGAAGCCT CGCGCCTCCT GCGCGAGCTC GTCGAGCTGA CCGGCTTTCC GATCACCTCT 
ACCCTGATGG GCCTCGGCTC CTATCCGGCT TCGGGCGACA AATGGCTCGG CATGCTTGGC 
ATGCATGGGA CGTTCGAGGC CAATAACGCC ATGCATGATT GCGATCTCAT GATCGCCGTC 
GGATCGCGTT TCGACGACCG CATCACCGGC CGGCTCGACG CTTTCTCGCC CGGCTCGAAG 
AAGATCCACA TCGACATCGA TCCCTCCTCG ATCAACAAGA ACGTCAAGAT CGATCTCGGC 
ATTATCGGCG ATTGCGCCCA TGTGCTGCGG CAGATGTTAG ACGCCTATCG CGCGCGGAAA 
TCGGCGCCCG ACGAAGCGGC GCTGACCCGC TGGTGGCAGG AGATTAACAA ATGGCGCGCG 
CGCAAGTCGC TCTCCTTCAA GCAGTCGAGC GCGGTGATCA AGCCGCAATA TGCGGTGCAG 
CGCCTGTATG AGCTGACGAA GAATCGCGAC ACCTACATTA CGACGGAAGT CGGCCAGCAT 
CAGATGTGGG CGGCGCAGCA TTATCATTTC GAGGAGCCGA ACCGCTGGAT GACCAGCGGC 
GGGCTCGGCA CGATGGGCTA CGGCCTGCCG GCGGCGATCG GCGCGCAGAT CGCCCATCCG 
GGCGCGCTCG TCGTCGACAT CGCGGGCGAA GCTTCGATTC TGATGAACAT CCAGGAGCTG 
TCGACCGCCA TACAATTCCG CCTGCCGGTC AAGATCTTCA TCCTCAACAA TGAATATATG 
GGGATGGTCA GGCAATGGCA GGAGCTGCTG CATGGCGGAC GCCTGTCGCA GAGCTATTCG 
GAGGCGCTGC CGGATTTCGT CAAGCTCGCC GAAGCCTATG GCGCGCAAGG CATCCGCTGC 
TCGGACCCCG CAAGTCTCGA TGACGCCATC ATCGAGATGA TCGATTCGCC GCGTACCGTG 
GTGTTCGACT GCATTGTCGA CAAGACCGAA AACTGCCTAC CGATGATTCC CTCGGGCAAG 
GCCCATAATG AAATGCTGAT GCCCGACGAA GACGATATAG AGGCCGTGAT CGACGCGGCC 
GGCAAGATGC TGGTTTGA

Protein sequence

MSNLITGAEM VVRALQDQGV DSIFGYPGGA VLPIYDALFH QNQIVHVLVR HEQGAAHAAE 
GYARSSGKVG VVLVTSGPGA TNAITGLTDA LMDSIPLVCI TGQVPTHLIG SDAFQECDTV 
GITRHCTKHN YLVRSIEDLP RVLHEAFYVA QTGRPGPVVI DIPKDVQFAL GDYFGPHKIE 
HKTYKPRLDG DAEKIEHAVT MMLAARRPVF YTGGGVINSG PEASRLLREL VELTGFPITS 
TLMGLGSYPA SGDKWLGMLG MHGTFEANNA MHDCDLMIAV GSRFDDRITG RLDAFSPGSK 
KIHIDIDPSS INKNVKIDLG IIGDCAHVLR QMLDAYRARK SAPDEAALTR WWQEINKWRA 
RKSLSFKQSS AVIKPQYAVQ RLYELTKNRD TYITTEVGQH QMWAAQHYHF EEPNRWMTSG 
GLGTMGYGLP AAIGAQIAHP GALVVDIAGE ASILMNIQEL STAIQFRLPV KIFILNNEYM 
GMVRQWQELL HGGRLSQSYS EALPDFVKLA EAYGAQGIRC SDPASLDDAI IEMIDSPRTV 
VFDCIVDKTE NCLPMIPSGK AHNEMLMPDE DDIEAVIDAA GKMLV