Gene Msil_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2037
Symbol
ID	7094235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2207402
End bp	2208832
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	67%
IMG OID	643465361
Product	PUCC protein
Protein accession	YP_002362339
Protein GI	217978192
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAGC TGAACGAAAA GCTCGCGCGC AACTGGAAGC GGCTCAGCCC GAGCCTTCTC 
CCCTTCGCCG ACGCAGCCAC TGTGGAGTTG CCGCTTGGCC AGCTGTTGCG GCTTTCGCTG 
TTTCAAGTCA GCGTCGGCGT TTCCATTGTT CTGCTGGTCG GCACGTTGAA CCGCGTCATG 
ATCGTCGAGC TTGGCGTTCC GGCCTGGCTC GTCGCGCTGA TGGTTTCGCT GCCTCTGGTT 
TTCGCTCCGT TTCGCGCCCT CGTCGGCTTC CGCTCCGACG CCCATCGTTC CGCGCTCGGA 
TGGCGCAGGG TGCCTTATCT CTGGCTCGGG ACGCTCATCC AGTTCGGCGG GCTGGCGATC 
ATGCCCTTCG CCTTGATTGT TCTTTCCGGC GATTCCAATG GACCCGTCTG GGTCGGCCAC 
GTCGCGGCGG CGCTCGCCTT TCTTCTGGTT GGCGCGGGCC TGCATACAAC GCAGACGGTG 
GGGCTCGCGC TTGCGACAGA TCTGGCTCCG GCCCACGCGC GTCCGCGCGT CGTCGCCCTG 
CTTTGCATGA TGCTTCTCGT TGGCATGCTT GCGAGCGCCC TCGCGTTCGG AGCGCTTCTC 
GCCAACTTCA GCGAACTTCG CCTGATCAGG GTGGTTCAGG GCGCCGCCGT CTTGACCATG 
GGCCTCAACA TGATCGCCTT GTGGAAGCAG GAGCCGCGCC GGGCGCTTCA GCCGCTCATC 
ATGCCGCGCC CGTCCTTCGC CGCCTCCTGG AACGCCTACC TGCGCCAGAG CGAGCGCGCC 
AAACGCCGGC TCCTTGTGAT CGCGCTTGGC ACGGCGGCGT TCAGCATGGA GGACATTCTG 
CTTGAACCGT ATGGCGGGCA GGTGCTGCAC TTGCCGGTTG GCGCGACGAC CGCGCTGACC 
GCGATGCTGG CGATCGGAAG CATTTGCGGC CTTTGGCTCG CCGCGCGGCT TCTTGGCGGG 
GGCGCCGATC CGCACCGCGT GTCGGCCTAT GGGCTGCTCG CGGGGCTCGC CGCCTTCAGC 
GCTGTGATCT TCGCCGCCCC GCTCGACTCC GCCCGCCTGT TCGGCGTGGG AACAGTGCTG 
ATCGGCTTCG GCGCCGGACT GTTCGCCCAT GGCACGCTGA CCGCGACAAT GAACCAGGCC 
AGGCGCGACG CCGCCGGAAT GGCGCTCGGC GCCTGGGGGG CGGCGCAGGC GAGCGCCGCC 
GGGCTCGCGA TCGCGCTCGG AGGCGCCATC GCCGACGGGG TATCGACGTT CGCCGCGCAA 
GGAGCGTTCG GGCCGACTGT CGCCGGTCCG GCCACGGGTT ACATAGCCGT TTATATGATC 
GAGCTCATGC TGATGTTCGT GACCCTTGTC GCAATCGGCC CTCTCGTGCG CCACGACGCA 
CGAGAGGGCG GTGCGGCAGG CGCATTCGAG CTCGGCAAGA GTGCTGGTTG A

Protein sequence

MTKLNEKLAR NWKRLSPSLL PFADAATVEL PLGQLLRLSL FQVSVGVSIV LLVGTLNRVM 
IVELGVPAWL VALMVSLPLV FAPFRALVGF RSDAHRSALG WRRVPYLWLG TLIQFGGLAI 
MPFALIVLSG DSNGPVWVGH VAAALAFLLV GAGLHTTQTV GLALATDLAP AHARPRVVAL 
LCMMLLVGML ASALAFGALL ANFSELRLIR VVQGAAVLTM GLNMIALWKQ EPRRALQPLI 
MPRPSFAASW NAYLRQSERA KRRLLVIALG TAAFSMEDIL LEPYGGQVLH LPVGATTALT 
AMLAIGSICG LWLAARLLGG GADPHRVSAY GLLAGLAAFS AVIFAAPLDS ARLFGVGTVL 
IGFGAGLFAH GTLTATMNQA RRDAAGMALG AWGAAQASAA GLAIALGGAI ADGVSTFAAQ 
GAFGPTVAGP ATGYIAVYMI ELMLMFVTLV AIGPLVRHDA REGGAAGAFE LGKSAG