Gene Msil_2246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2246
Symbol
ID	7091368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2432175
End bp	2433224
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	64%
IMG OID	643465567
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_002362542
Protein GI	217978395
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCGGG CCAATCCCCT TCGCCTCGCC GCTATCGGCG TCCTGGTCGC CCTCGCGGCG 
CCCGCCGCTC ATTTCCTTGG CGGTTCTTCC TTCGTGCAGC CGGCGCAGGC CGCGCAGGAA 
CTTCTGAACG TCTCCTATGA TCCGACCCGC GAGCTTTACA GGGCGATCAA CGAAGCCTTC 
GCCGCCGATT GGAAGGCGAA GACCGGCGAG GCGATCGAAG TGCGCTCGTC CCATGCCGGC 
TCCGGCGCGC AGGCGCGCGC GGTGATCGAC GGCCTGCCCG CCGATGTGGT CACACTGGCG 
CTCGCCGCCG ATATTGACGC CATCGCCGCC AAGAGCGGCA AGCTGCCCGC CGATTGGCAA 
AAGCGCCTGC CGCATAATTC CACGCCCTAC ACCTCGACGA TCGTGCTCTT GGTCCGGAAG 
GGCAATCCGA AACAGATCAA GGATTGGGAC GATCTGGTGA AGCCGGGCAT CTCGGTCATT 
ACGCCCAACC CGAAGACGTC GGGCGGCGCG CGCTGGAATT TCCTCGCCGC GTGGGGCTAC 
GCGAATAAGA AATTCGGCGG CGACGAAGCC AAGGTCCGCG ATTTCATCCG CGCGCTCTAC 
AAAAATACGC CGGTGCTCGA TACCGGCGCG CGCGGCTCGA CGATCAGCTT CGCCCAGCGC 
GGCCAGGGCG ACGTGCTGAT CTCGTGGGAG AATGACGCCT TCCTCGCCTC GGAAGAATTC 
GGCAAGGACC AGTTCGACAT CATCGTCCCC TCGATTTCGA TCCTGGCGGA GCCTCCGGTC 
GCCCTGGTCG ACGGCAATGT GGACGCCAAG AAGACCCGCA AGGTCGCCGA GGCCTATCTC 
GACTTCCTCT ATACGCCGAA GGCGCAGGCG CTGATCGCCA AGAACTATTA TCATCCCGTG 
TCGCCCGAGG CGGCCGATCC CAAGGATCTG GCGCGCCTCG CCAAAATTCC GCTGGTCACG 
ATCGACGGTG ATTTTGGCGG CTGGAAGGCG GCTCAGGCGC GCTTCTTCGC CGACGGCGGC 
GTGTTTGATC AGATCTACGC CGGGCAATAA

Protein sequence

MSRANPLRLA AIGVLVALAA PAAHFLGGSS FVQPAQAAQE LLNVSYDPTR ELYRAINEAF 
AADWKAKTGE AIEVRSSHAG SGAQARAVID GLPADVVTLA LAADIDAIAA KSGKLPADWQ 
KRLPHNSTPY TSTIVLLVRK GNPKQIKDWD DLVKPGISVI TPNPKTSGGA RWNFLAAWGY 
ANKKFGGDEA KVRDFIRALY KNTPVLDTGA RGSTISFAQR GQGDVLISWE NDAFLASEEF 
GKDQFDIIVP SISILAEPPV ALVDGNVDAK KTRKVAEAYL DFLYTPKAQA LIAKNYYHPV 
SPEAADPKDL ARLAKIPLVT IDGDFGGWKA AQARFFADGG VFDQIYAGQ