Gene Msil_2142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2142
Symbol
ID	7093363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2316104
End bp	2317096
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	62%
IMG OID	643465467
Product	putative sulfite oxidase subunit YedY
Protein accession	YP_002362443
Protein GI	217978296
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTATC ATCGCCGCAA AGGCTGGGAG ATTCCGGAGC GCGAGGCGAC GCCCGAAGCG 
CTCTTTTTCG CGCGCCGCTC TCTCCTCAAG GCCGGCGTCG CCGCGGCGGC GCTGGCGGCG 
GCTCCTTCCG CGCAGGCGTT CTCTTTGTTC GGCGGCGGCG ACAAGCCCGC CGCGCCGGAG 
GCGCCCGATC AGACGCAAGG CCGTTATCCC GCAGGGCGCA ATGATCTGTT CAAGCTCGAC 
CGCGATGTGA CGCCGGAGGA GATCAATTCC CACTACAATA ATTTTTACGA ATTCGGCTCG 
GGCAAAGATA TTTTTGAGGC GGCGCAGGCG CTCAAGACTC GGCCCTGGAC CCTAAAAATC 
GACGGTCTTG TCGAAGCCCC GAAGGAAATG GGGATCGACG ATCTCATTGC CTCCGCCCCG 
CTCGAAGAGC GTCTTTACCG GCACCGTTGC GTCGAGGCCT GGGCGATGGC GATTCCCTGG 
ACCGGCTTCC CGCTGAAACA CCTTGTCGAT CTGGCAAAGC CCCAGTCGGG CGCGAAATTT 
GTGCGCTTCG AGACCTTTTT GGATCGCTCG ATGGCGCCGG GGCAGCGCCA GGTCTGGTAT 
CCGTGGCCCT ATGGCGAGGG GCTGACCATG GCCGAGGCGT CAAACGATCT CGCCTTTCTC 
GTCACCGGCG CCTATGGCAA GCCGCTCGGA AAGCAGTTCG GCGCGCCGCT GCGGCTGGCG 
GTCCCGTGGA AATATGGGTT CAAGTCGATC AAATCGATCA CCAAAATTTC CTTCGTCGCC 
GAGCGGCCGA AAACCTTCTG GGAGCAGCTG CAGGCGTCCG AATATGGCTT TTGGGCCAAT 
GTGAACCCCG ACGTGCCGCA TCCGCGCTGG AGCCAGGCGA GCGAAGAGGT GCTGGGGACG 
CATGAGCGCC GCAAGACGCA GATCTTCAAT GGCTACGGCG AATTCGTCGG CGGCCTCTAT 
GTCGGGCTGG AGAAGGAGCG GCTTTACGTT TGA

Protein sequence

MFYHRRKGWE IPEREATPEA LFFARRSLLK AGVAAAALAA APSAQAFSLF GGGDKPAAPE 
APDQTQGRYP AGRNDLFKLD RDVTPEEINS HYNNFYEFGS GKDIFEAAQA LKTRPWTLKI 
DGLVEAPKEM GIDDLIASAP LEERLYRHRC VEAWAMAIPW TGFPLKHLVD LAKPQSGAKF 
VRFETFLDRS MAPGQRQVWY PWPYGEGLTM AEASNDLAFL VTGAYGKPLG KQFGAPLRLA 
VPWKYGFKSI KSITKISFVA ERPKTFWEQL QASEYGFWAN VNPDVPHPRW SQASEEVLGT 
HERRKTQIFN GYGEFVGGLY VGLEKERLYV