Gene Msil_0405 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0405
Symbol
ID	7093564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	442505
End bp	443938
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	63%
IMG OID	643463735
Product	Glucan 1,4-alpha-glucosidase
Protein accession	YP_002360741
Protein GI	217976594
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.878783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCTC CCTTCAAACA ACAGGCGTCG CTCGATGTCT GGATGCGCCG TCAATATGGG 
CTTTCCGCCG CGAAAATGAT GAGCGCCATT TCACGGGTCG ACCTCGTCAA GGAGCGGCGC 
GGTTTTGGAC GGCTGTTGCG GCCGGCGAAA GGCTCGATCC TCGCTTCGCC CGTGATCGCC 
GCCTATGATC CGGACCCCGA CTATTTCTTC CACTGGCTGC GCGATTCTGC CGTTATCATT 
GACGCCTTGC GGCTGTTGAT CGAGAGCGAG GAAATCGCGC GGCCCGAGGG CCTTGCGCAT 
TTTTCCGATT TCCTCGGCTT CAGCCTGACG CTGTGCGGTC TCGACGGGCG CTCATTTCTG 
GCGGGAGCCG GCGATTACCG GGCGAAGGTC GAGCCTCATT TCGCGCAATT TCTGCGGCCC 
GAGGCGGATC TTCTCGCCAT CTCAGGCGAC GATATCTTGG GCGAACCGAG ATTCGATCCC 
GACGGTTCGA TCGACATCCT GAAATGGTCG CGGCCGCAAC ATGATGGGCC GGCCCTGCGC 
GTGCTCGCGG TCGCCCGATT CTGCCAGTCG GTCGGCCCGG GGCCGGACAT TTTCAAGCAG 
GCGGAAGAGC TCATCATCCG CGATCTCGGC TTCACCTTCG CCCGCTGGCG CGCGCCATCT 
TTCGATATCT GGGAGGAAGA GCTCGGGCGC CACTATTATA CGCAGCTCGT CCAATGCGAG 
GCGTTGCGCG AGGGCGGCTT ATGGCTCGAG TCGCGCGGCG CAATCGAGAG CGCCACCGCA 
TATCTTGACG CATCGCAGGA GATCGCCGCG GGCCTCGACG ACTTCTGGAG CGCGCCGCAA 
GGTTTTGTAC GAAGCCGCAT CGCCGCGGCG GGCTCCGGCC CGCAAAAGGA GCTCGACATC 
GCGACCGTGC TCGCTGTGAT CCACGCCGGG CGCGAGGCTG GCGCGCATAG CGTGTGCGAC 
TCGAGACTGA TTGCGACGCT TGGCCGGCTC GAAGCGCTTT TCGCCGATGC CTATACAATC 
AACACGACAC AACCGGGCGC AGACGCCCCG GCAATGGGCC GCTATGACGG CGATCGCTAC 
TACAGCGGCG GCGCCTATTT TTTCTCGACG CTCGGCGCGG CAGAATTCCA TTTCAAAGCG 
GCGCAGGCCG TGGCGAAGGG TTTCCTCCAC GACGCCTCGG AATGGGCGCG CATCGGGCTC 
GATTCAAAAC ATGACGGTCA TCATCTCTTT GAGGCGCTCC TGCGGTGCGG CGATCTGTTC 
ATGACGACGG TCGCCGCCTA CACGTCGGAG AACGGCGACC TCTCCGAACA ATTCGATCAA 
ACGACTGGCG TCCAGACATC GGCTAAAAAT CTCGCCTGGA GCCACGCCGC TTTCATCAGC 
GCCTACGCCA GCCGGGAGAA GGCGCTTCGT TCCGCCAAAG GCGTCTCGCC GTGA

Protein sequence

MSAPFKQQAS LDVWMRRQYG LSAAKMMSAI SRVDLVKERR GFGRLLRPAK GSILASPVIA 
AYDPDPDYFF HWLRDSAVII DALRLLIESE EIARPEGLAH FSDFLGFSLT LCGLDGRSFL 
AGAGDYRAKV EPHFAQFLRP EADLLAISGD DILGEPRFDP DGSIDILKWS RPQHDGPALR 
VLAVARFCQS VGPGPDIFKQ AEELIIRDLG FTFARWRAPS FDIWEEELGR HYYTQLVQCE 
ALREGGLWLE SRGAIESATA YLDASQEIAA GLDDFWSAPQ GFVRSRIAAA GSGPQKELDI 
ATVLAVIHAG REAGAHSVCD SRLIATLGRL EALFADAYTI NTTQPGADAP AMGRYDGDRY 
YSGGAYFFST LGAAEFHFKA AQAVAKGFLH DASEWARIGL DSKHDGHHLF EALLRCGDLF 
MTTVAAYTSE NGDLSEQFDQ TTGVQTSAKN LAWSHAAFIS AYASREKALR SAKGVSP