Gene Msil_0953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0953
Symbol
ID	7093632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1038283
End bp	1039302
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	68%
IMG OID	643464292
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_002361284
Protein GI	217977137
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.00207331
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACTATT TCACTTCCTT TGTGCTCGAT GAATCCGAGC CTGCGCCGCA GGATGACGCG 
GCCGCGCTGA CACGCGATTT CCCCGCGGAT GACGGGGCGC TGCTCGACGC CTATTCGAAA 
AGCGTGACGC GCATCGTCGA GGAGGTCGGC CCGAGCGTCG TGCGGCTCGA CGTCAAGCGC 
GGGGACGGCC GCAGCGGCGG CTCTGGCTCC GGCGTCATCG TCTCGCCGGA CGGGCTCATC 
CTGACCAACA GCCATGTCGT CGGCGGCGCG CGCCGCGCAA CCGTGACGAC GCTGGACGGG 
CGCAATCTGT CCGGCCGGGT CCTTGGCGAT GATCCAGACA CCGACCTCGC CTTGGTGCGG 
GTCGATGAGA ACGTCACTTT GCCGGCGGCG CGGCTCGGCG ATTCGAAACG GCTGAAGCCG 
GGTGAAATCG CGGTCGCCAT CGGCAATCCG CTCGGCTTCG ATTCGACCGT GACGGCGGGC 
GTCATTTCGG CGCTCGGGCG TTCGCTGCGC TCGAACAATG GCCGCATGAT CGACGATGTG 
ATCCAGACCG ACGCCGCGCT CAATCCCGGC AATTCCGGCG GACCGCTGGT CGCCTCGAAC 
GGCGCCGTCA TCGGCGTCAA CACCGCGATC ATCGCTGGCG CGCAGGGCAT CTGCTTTGCG 
GTCGCAGCGA ATACGGCGCG TTTCGTTCTT GGCGAACTCG TCGCCCATGG CCGCGTGCGC 
CGCGCTTATC TCGGCGTCGG CGCCAGCACG ATCGTCCTGC CGCGCCGCAT CGCGCTCCGG 
CTCGGCCTCG AGCAGACCAC GGGCGCGGTG ATCAGCCAGG TCGAAAAGGA TGGCCCCGCC 
GATCACGCGG GCCTGCTTAC GGGCGATATC GTCCTTGCCG TCGATGGCGC GCCAGTCGCC 
AGCGCTGGCG ATCTTCTGCG CTTGCTTGGC GCCGACAAGA TCAACCAGGT CGCGCCGCTC 
GATATTCTGC GGCGCTCCGA CCGGCGCCGG TTCTGGGCCG CGCTGCGCGA GCGCGTTTGA

Protein sequence

MDYFTSFVLD ESEPAPQDDA AALTRDFPAD DGALLDAYSK SVTRIVEEVG PSVVRLDVKR 
GDGRSGGSGS GVIVSPDGLI LTNSHVVGGA RRATVTTLDG RNLSGRVLGD DPDTDLALVR 
VDENVTLPAA RLGDSKRLKP GEIAVAIGNP LGFDSTVTAG VISALGRSLR SNNGRMIDDV 
IQTDAALNPG NSGGPLVASN GAVIGVNTAI IAGAQGICFA VAANTARFVL GELVAHGRVR 
RAYLGVGAST IVLPRRIALR LGLEQTTGAV ISQVEKDGPA DHAGLLTGDI VLAVDGAPVA 
SAGDLLRLLG ADKINQVAPL DILRRSDRRR FWAALRERV