Gene Msil_3330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3330
Symbol
ID	7090826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3662933
End bp	3663979
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	643466637
Product	selenide, water dikinase
Protein accession	YP_002363598
Protein GI	217979451
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0709] Selenophosphate synthase
TIGRFAM ID	[TIGR00476] selenium donor protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.456858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGATG CTCCCGTGCG CCTCACCGAT CTCGCCCATG GCGGCGGCTG CGGCTGTAAA 
CTGGCGCCCT CCGTTCTGCA GCAGCTCCTC GCCAATCAAC CTCAGGCTGC GCCTTATGCG 
CAGCTTCTGG TCGGCACGGA GACCGGCGAC GACGCGGCAG TCTGGCAGAT CGACGAGGAG 
CGCTGCGTCA TCGCCACGAC CGACTTCTTC ATGCCGATGG TCGACGATCC GCGGGATTTC 
GGCCGCATCG CGGCGGCCAA TGCGCTGTCG GATATTTACG CCATGGGCGG AACGCCGATC 
ATGGCGCTGG CCATTCTCGG AATGCCGCTC GGAAAGCTGC CGATTGAAAC CGTGCGCGCG 
ATCCTTGCGG GCGGCGCCTC GATCTGCGCC GAGGCCAGCA TTCCTGTCGC GGGGGGCCAT 
TCGATCGACT CGCCGGAGCC GATCTACGGA CTTGCGGTCG TCGGGCTTTG CGCCGTCAGC 
GATATCCGCC GCAATTCGGG CGCGCGCCCC GGCGACGCGC TGATCCTGAC CAAGGGCATC 
GGCGTCGGCG TCTATTCGGC GGCGTTCAAG AAGCAGGCGC TGAGTAATGC GGCCTATGAA 
GAGATGATGG CCTCGACGAC GCTGTTGAAC CGCGTCGGCC ACAAGCTGGC GAAGGACGAC 
GACGTCCACG CCATGACGGA TGTGACCGGC TTCGGCCTGC TTGGCCATGG CGTCGAGCTC 
GCGCGCGGCG GAGGCGTCGC GCTCGACATC GATTTCGCCC GCATCCCTTT CCTGAAGGAG 
GCTCAGGAGC TGGCCGAGGC CGGCCTAATT ACCGGAGCCT CCGGACGCAA CTGGGCGAGC 
TATGGCGACG CCGTTGTGCT GCCGGCTGAA ACGCCGGACT GGCGGCGCGC GCTGCTGACC 
GATCCGCAGA CCTCCGGCGG GCTCCTCATC GCCTGCGCTC CGGAGCGCGC CGAAGCGATC 
CGCGGGACCA TCGAGGCTGC GGGCTTTCCT CGCGCGACGA TCATCGGCGC CGTCGCCGCG 
GGCGAGCCAG CCGTCCGGAT CGGCTGA

Protein sequence

MLDAPVRLTD LAHGGGCGCK LAPSVLQQLL ANQPQAAPYA QLLVGTETGD DAAVWQIDEE 
RCVIATTDFF MPMVDDPRDF GRIAAANALS DIYAMGGTPI MALAILGMPL GKLPIETVRA 
ILAGGASICA EASIPVAGGH SIDSPEPIYG LAVVGLCAVS DIRRNSGARP GDALILTKGI 
GVGVYSAAFK KQALSNAAYE EMMASTTLLN RVGHKLAKDD DVHAMTDVTG FGLLGHGVEL 
ARGGGVALDI DFARIPFLKE AQELAEAGLI TGASGRNWAS YGDAVVLPAE TPDWRRALLT 
DPQTSGGLLI ACAPERAEAI RGTIEAAGFP RATIIGAVAA GEPAVRIG