Gene Msil_0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0421
Symbol
ID	7093580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	463042
End bp	464031
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	61%
IMG OID	643463751
Product	Glutathione S-transferase domain protein
Protein accession	YP_002360757
Protein GI	217976610
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0435] Predicted glutathione S-transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.865646
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTGC TCGTCGACGG CGTCTGGCGC GATCAATGGT ATGACACGCA AAGCCATGGC 
GGACGGTTTG AGCGCGACGC CGCGAAATTC CGCAACTGGA TCACCCCGGA CGGCGCCCCG 
GGCCCATCGG GGCGCGGCGG CTTCAAGGCC GAGCCCGGCC GCTATCATCT CTACGCCGCC 
TATTTCTGTC CCTGGGCGCA TCGCACGCTG ATCTTTCGCG AGCTCAAGGG CCTCGCGCCG 
CTGATCGACG TCTCGATCGT CAATTGGCTG ATGCGCGAGA ACGGCATCAC CTTCGCGCCG 
GCCGACGGCG TGATTGGCGA TCCGCTCTTT GGCGCGCGCA ATCTCTATGA GATCTATCAA 
GCCGCCGATC CCGCCTATAG CGGCCGGGTG ACCGTGCCGA CGCTGTGGGA CAAAGAGACG 
AAGACGATCG TCTCGACCGA ATCCTCCGAA ATCATCCGCA TGTTCAATTC AGCCTTCGAC 
GGCGTCGGGG CGGCGGCGGG GGATTATTAT CCCCCGGAAT TGCGCGACGA AATCGACGCG 
CTCAACGCGC GGATTTATCC GACGGTGAAC AACGGCGTCT ATCGCGCCGG CTTTGCGACG 
ACGCAGGCGG CCTATGAGGA GGCGATCGGC CCGCTGTTCG AGACGCTGGA TTATCTTGAG 
GCGTTGCTGG CCGAGCGCCG CTATCTCTGC GGCGAGCAGA TGACAGAGGC GGACATAAGG 
CTCCTCACGA CTCTTTTGCG CTTCGACATC GTCTATGTCG GCCATTTCAA ATGCAATGTG 
CGGCGGATCG CTGATTATCC AAATCTTTGG GCCTATGTGC GCGACCTCTA CCAGACCGGA 
ACGATCGCAA ACACCTTTCG GCCAGACCAC ATCAAGGGCC ACTATTATCA GAGCCATCTG 
CAGATCAATC CGACCGGAAT CGTCTCTGTC GGGCCAAGCA TCGATTTCTC CGCCCCGCAC 
GACCGCGCGC GGCTTGGCGG GAGTGGTTAA

Protein sequence

MGLLVDGVWR DQWYDTQSHG GRFERDAAKF RNWITPDGAP GPSGRGGFKA EPGRYHLYAA 
YFCPWAHRTL IFRELKGLAP LIDVSIVNWL MRENGITFAP ADGVIGDPLF GARNLYEIYQ 
AADPAYSGRV TVPTLWDKET KTIVSTESSE IIRMFNSAFD GVGAAAGDYY PPELRDEIDA 
LNARIYPTVN NGVYRAGFAT TQAAYEEAIG PLFETLDYLE ALLAERRYLC GEQMTEADIR 
LLTTLLRFDI VYVGHFKCNV RRIADYPNLW AYVRDLYQTG TIANTFRPDH IKGHYYQSHL 
QINPTGIVSV GPSIDFSAPH DRARLGGSG