Gene Msil_0488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0488
Symbol
ID	7091220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	539463
End bp	541787
Gene Length	2325 bp
Protein Length	774 aa
Translation table	11
GC content	68%
IMG OID	643463817
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_002360822
Protein GI	217976675
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACGC CTGAGCCTGC CGCCGCGGCC GCGGCGCTGA CGCCGCTTCC GGCTTCGCCG 
GCGTCTCAAT GGGGCGGCGC GGCGCCCTCC GTACCCGATC CGGCGACGAT CGCGGCGCTC 
GCCAACGCGC TGTTCAAGGC GTTTCCCGGA GATCCCGCCC CTTCCACGGG CGCCGCCGGC 
TCGGGCGCGC CGGAGGCGGG CTTTCCGCCT GCTCCGCCGC AGCCCGATCC GCTGCTCGCC 
TCGGTCGGGC CCTCGCATGT TGCGGCGCAG GCCGGATCGC CACCCTACGC TCCGGTCTCG 
CCCGCTTTCG CATCCTCGCC CGGATTTCCG TCCGGAGGCC AGCCGGCGTC AGCCCCCAAC 
GTCGGGCTGC CAACAGCTGC GTCAACGGTC TTCGCTTTTG CCCCCGCGGC CTATTCGCAG 
CCCCTATCGC CGGCCGCTGC TCCCGTCACG ACGCCGTCAG GATATGGCGG CCAATCGGAA 
GCCGTCCCAA GCGAGGCGGA GCTCGCCGCC CTGCCCGGCG CGTTGACGGA CTCGACGGCC 
CTGACCCATC CGGCGCTCGG CGGCGCCGGC TATTCCGCGG GCGATAAGGC TCTGCCCGGC 
GAGTCGCTCT ATTTCCTCGA TGGCCGCGAT AGCCACGCCG GCGCGACGCG GCAGGGCGTT 
CCGCATGCTG GCGCCAAGCC GTCCGACGCT CCGGCGCTTC CGGAAACGGG ATCGCTGCGC 
CCAGGCGCCG CGCCGGACGC CCCGCTTCCC ACCGCCGGGG CGACCGCGGC TCCCGCCGTG 
AATTCCCCAG CCGCAACCCC CGCCACCCGG CCGGCGGTCT TCGGAGCGAC GCCCGGGGGA 
CTCATCACGC CCGCCGGTTT TCCGAACGCG CCCGCCTTCA AGATTCCGGG CTTCGAGCCG 
CGCGAGGCGG CTTCGCTCTT TTCTTCAAAT CCCCCGCTTC CGGGCGACCT CTTCACTCTC 
CCCGCCGAAA GCGCCGCGCC GGCTCCGCCC GCCTCGCCGC TGCCGGAAGC AACGCCATCC 
GGCGTCCATA CGATATACCC CGTCGCTCAT GAGGTGAGGC CTGAACTCGG CCCGACCATT 
GGCGTCGGCG CGCGTCCCTT CGACGCCGCC TCGATCCGCC GCGACTTCCC CATCCTGCGT 
CAATATGTGC ATGGCAAGCC GTTGATCTGG CTGGATAACG CCGCAACGAC GCAGAAGCCC 
CAGGCGGTCA TCGACCGGAT CTCGTCCTTC TACGAGAACG AAAACTCAAA CATTCACCGC 
GCCGCCCATA CGCTCGCGGC GCGGGCGACG GACGCCTATG AAGCCGCACG TGAAAAGACG 
CGCCGCTTCA TCAATGCCCC CTCAACGAAT GACATTATTT TCGTGCGCGG CACGACCGAA 
GCGATCAATC TGATCGCGCA GAGCTACGGC CGCCGCAACG TCAAGAAAGG CGATGAGATC 
CTCATCACCT GGCTTGAGCA TCACGCCAAT ATCGTGCCCT GGCAGATGCT CTGCGCCGAG 
ACCGGCGCGA TCCTCAAGGT CGCCCCGGTC GACGACAAGG GTCAGGTCCG GCTCGACGAA 
TATGAAAAGC TGCTGTCGCG CCGCACGCGC ATCGTCTCCT TCACCATGGT CGCCAACGCC 
ATCGGGACGG TCACGCCGGC CAAGGACATG ATCGACATGG CGCATCGCCT CGGCTCCTGC 
GTCATCGCCG ACGCCGCCCA GGCCGTCTCG CATATGCCCG TCGACGTGCA GGCGCTGGAT 
TGCGATTTTC TGGTGTTCTC CGGCCATAAG GTGTTCGGGC CGACCGGCAT CGGCGTCGTC 
TATGGCAAAC AGCAGGTGCT TGAGGCGATG CCGCCGTGGC AGGGCGGCGG CAATATGATC 
GCCGACGTCA CCTTCGAAAA GACGATTTAC CAGCCGCCGC CGGGCCGTTT CGAGGCGGGC 
ACCGGCAATA TCGCCGATGC GGTCGGGCTT GGAGCCGCCT TCGACTATCT CGACACGATC 
GGCATGGCCA ATATCGCCGC CTATGAGCAT GAGCTTTTGA TCTATGCGAC CGAAGGTCTC 
AAGAGCGTTC CGGGACTGCG CATCATCGGC TGCGCGGATG AGAAGGCCGG CGTGTTCTCG 
CTGGTGCTCG ACGGCTGCCG CAGCGAGGAC GTCGGCGCGG CGCTCGATCG CGAAGGCATC 
GCCGTGCGCT CCGGCCACCA TTGCGCCCAG CCGATTCTGC GCCGCTTTGG CCTCGAGACG 
ACGGTCCGGC CGTCCCTCGC CCTCTACAAC ACCTTTGACG ACATCGACGC GCTCGTCGCG 
GCCCTACGGC GCATCTCCGT CAGCCAGCGA TTTCGCGCGC GTTAA

Protein sequence

MSTPEPAAAA AALTPLPASP ASQWGGAAPS VPDPATIAAL ANALFKAFPG DPAPSTGAAG 
SGAPEAGFPP APPQPDPLLA SVGPSHVAAQ AGSPPYAPVS PAFASSPGFP SGGQPASAPN 
VGLPTAASTV FAFAPAAYSQ PLSPAAAPVT TPSGYGGQSE AVPSEAELAA LPGALTDSTA 
LTHPALGGAG YSAGDKALPG ESLYFLDGRD SHAGATRQGV PHAGAKPSDA PALPETGSLR 
PGAAPDAPLP TAGATAAPAV NSPAATPATR PAVFGATPGG LITPAGFPNA PAFKIPGFEP 
REAASLFSSN PPLPGDLFTL PAESAAPAPP ASPLPEATPS GVHTIYPVAH EVRPELGPTI 
GVGARPFDAA SIRRDFPILR QYVHGKPLIW LDNAATTQKP QAVIDRISSF YENENSNIHR 
AAHTLAARAT DAYEAAREKT RRFINAPSTN DIIFVRGTTE AINLIAQSYG RRNVKKGDEI 
LITWLEHHAN IVPWQMLCAE TGAILKVAPV DDKGQVRLDE YEKLLSRRTR IVSFTMVANA 
IGTVTPAKDM IDMAHRLGSC VIADAAQAVS HMPVDVQALD CDFLVFSGHK VFGPTGIGVV 
YGKQQVLEAM PPWQGGGNMI ADVTFEKTIY QPPPGRFEAG TGNIADAVGL GAAFDYLDTI 
GMANIAAYEH ELLIYATEGL KSVPGLRIIG CADEKAGVFS LVLDGCRSED VGAALDREGI 
AVRSGHHCAQ PILRRFGLET TVRPSLALYN TFDDIDALVA ALRRISVSQR FRAR