Gene Msil_0226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0226
Symbol
ID	7090543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	252329
End bp	253942
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	64%
IMG OID	643463560
Product	alpha amylase catalytic region
Protein accession	YP_002360569
Protein GI	217976422
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.547651
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACG GCCGCCCCCC CGCGATCCTC GGCGACTGGT GGCGCCCCGG CGCGATCTAC 
CAGATCTATC CGCGCTCCTT CCAGGATTCG GGCGGCGACG GCATTGGCGA TCTCGAAGGG 
ATCCGGCGCC GTCTCGATTA TCTCGTCGGC CTTGGCGTCG ACGCGATCTG GATTTCGCCG 
TTCTATCCCT CGCCGATGCA TGACTTCGGC TATGACGTCT CCAATTATTG CGACGTCGAT 
CCGATTTTCG GCTCCCTTCG CGATTTCGAT CTTCTTCTGG CGGACGCGCA TCGGAGCGGC 
CTCAAGATCG TCCTGGATTT CGTGCCGAAC CACACCTCGA TCGAGCATGA ATGGTTCGCT 
GCAAGCCGAC AAAGGCGGGA CGACAAGAGC GACTGGTATA TCTGGCGCGA CGGCGCGCCC 
TCCGGCGGCC CGCCCAACAA TTGGCGCAGC CATTTTGGCG GCCCGGCCTG GAGTTTCGAT 
TCCGCGCGCG GCCAATATTA TTATCACGCC TTTTTGCCGC AGCAGCCCGA CCTCAACTGG 
CGCAATCCCA AGGTCAAGGC GGCGATGTTC GACGTGCTGC GGTTCTGGCT GCGGCGCGGC 
GTCGACGGTT TTCGCGTCGA CGTCATTTCG CAGCTCATGA AGGATGAAGC GCTGCGCGAC 
AATCCGGCAA ATCCCGGTTG GACGCCGCTC CGGCCGCAGA TCGAGGAGCT GCTTCAGCTC 
TATTCCGGCG ATCAGGATGA TATTCATCCT TTGATTGCGG AGATGCGCGG CGTTCTCGCC 
GAATTTGGCG ATCCTTTGCT GATCGGCGAG ATCTATCTGC CGATGGAGCG CCTTGTCGCT 
TATTACGGCG CGGCGCTTTC CGGCGCGCAT CTGCCGTTCA ATTTTCAGCT TCTCGAAACC 
CCCTGGCAGG CTGAATCGCT TGGCGCGATG ATCGCCTCCT ACGAGGCCCT TTTGCCGGAG 
GGCGCGTGGC CGAACTGGGT CCTCAGCAAC CACGATCGGC CGCGTGTGGC GACGCGCGTT 
GGCGACGCGC AGGCGCGCGT CGCGACGATG CTGCTCCTGA CCCTGCGCGG CACGCCGACG 
CTGTATTATG GGGATGAGCT CGGGATCGGC CATGTCGACA TTTCGCCGCC CCGCATCCGC 
GACCCCTGGG CCCTGCGCGA ACCCTCGCTC GCGGTGGGGC GCGATCCGGT GCGCACGCCC 
ATGCAATGGG ACGACAGCGC CAACGCCGGC TTCTCGACGC ATGAGCCATG GCTGCCGCTG 
ACGCCGGACT GGCCAGAGCG GAACGTCGAG CGCTTCGAGG CGGAGCCCGC ATCGCTGCTT 
CATCTGACGC GCCGCCTGCT CCACTACCGC CGCGATCATC GCACGCTGTC GCTCGGCTCA 
TGGCGCCTGC TGGCGAGCAG CAATGAACTG CTCGCCTATG AACGCCGCTC CGGGCAAGAG 
ACGACAATCG TCGTGCTCAA TCTCGGCGGC GCGTCGCAGC TTTGGCGGCT CGATCCCGCG 
GGCTCGTCGT TTTGCGTGGC GATTTCGACT TATTGTGACC GGGCGGGCGA ACGCGTCGAT 
CAAGTGCTGC GCCTGCGGCC GGATGAGGGC GTTGTGCTCG CGGTGTTGGG CTGA

Protein sequence

MTDGRPPAIL GDWWRPGAIY QIYPRSFQDS GGDGIGDLEG IRRRLDYLVG LGVDAIWISP 
FYPSPMHDFG YDVSNYCDVD PIFGSLRDFD LLLADAHRSG LKIVLDFVPN HTSIEHEWFA 
ASRQRRDDKS DWYIWRDGAP SGGPPNNWRS HFGGPAWSFD SARGQYYYHA FLPQQPDLNW 
RNPKVKAAMF DVLRFWLRRG VDGFRVDVIS QLMKDEALRD NPANPGWTPL RPQIEELLQL 
YSGDQDDIHP LIAEMRGVLA EFGDPLLIGE IYLPMERLVA YYGAALSGAH LPFNFQLLET 
PWQAESLGAM IASYEALLPE GAWPNWVLSN HDRPRVATRV GDAQARVATM LLLTLRGTPT 
LYYGDELGIG HVDISPPRIR DPWALREPSL AVGRDPVRTP MQWDDSANAG FSTHEPWLPL 
TPDWPERNVE RFEAEPASLL HLTRRLLHYR RDHRTLSLGS WRLLASSNEL LAYERRSGQE 
TTIVVLNLGG ASQLWRLDPA GSSFCVAIST YCDRAGERVD QVLRLRPDEG VVLAVLG