Gene Msil_1162 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1162
Symbol
ID	7093925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1249125
End bp	1250159
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	60%
IMG OID	643464503
Product	NMT1/THI5 like domain protein
Protein accession	YP_002361493
Protein GI	217977346
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.139454
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCAC CGCTCGCAAC ACGGCGCCGA TCGCGGGCCT CAGGCGCCCT TGTCGCCGCC 
CTGTTCATCT TCGCCTTTTT CGGCGCGCCC GCCCTCGCCC TCGACAAAGT GACTTTCGCC 
ACCAACTGGC TTGCCGAAGG CGAGCATGGC GGATTCTATC AGGCCAAGGC CGACGGCACC 
TATCAGCGCT ATGGCCTCGA CGTTTCGATT TTGCACGGGG GGCCGCAGGC CAACAACAGG 
CTGTTGCTGG CGGCCGGCAA AATCGAGTTT AATTTGGCCG CCAATCTGAT CCAGTCCTTC 
GACGCCGCCT CGCAAAACAT TCCGCTCGTC GCGGTCGCCG CGCTGTTCCA GAAAGACCCC 
TTCATTCTGA TGTCCCACCC CGACGCGGGG TTCGACAAGA TCGAGGATTT GCCGCGGGCG 
ACCGCCTTCA TCGGCAAGGA CGCCTTCGTC TCGGTCTATC AATGGCTGAA GAGCGCCTAT 
GGATTTCGCG AGGACAAGGT CCAGCCCTAT AATTTCAACG CCGCCCCCTT CATCCGCGAT 
AAAAATTCGA TCCAGCAGGG CTATGCGACG TCGGAGCCTT TCGCCATCGA GCGCGAGGGC 
GGCTTTCGGC CCAATGCGTT CCTCATCGCC GACTATGGCT ATGATTCCTA CTCAACCCTG 
ATCGAGACGC GGGCCGACCT CATCGCCAAA AACCCCGACC TCGTGCAGCG CTTCGTCGAC 
GCCTCGATCA TCGGCTGGCT GCATTATCTG TATGGCGACA GCGGCAAGGC GGATGCGCTG 
ATCCTTGCCG ACAATCCCGA CATGACGAAA GAGCTGCTCG CCTATTCGCG CGACAAGATG 
AAGGAGCTCG GCATCGTCGT TTCCGGCGAG GCAAGGACGC TTGGCGTCGG CGCCATGACA 
GAGCCTCGCG TCAAAAGCTT TTTCGGCAAG ATGGCGGCGG CCGGATTGTT CAAGCCCAAT 
CTCGATTATC GCAGCGCCTA CACGCTGCAA TTCATCAACA AGGGCGTCGG CCTTGATCTC 
ATTCCGCGCC CGTAA

Protein sequence

MTAPLATRRR SRASGALVAA LFIFAFFGAP ALALDKVTFA TNWLAEGEHG GFYQAKADGT 
YQRYGLDVSI LHGGPQANNR LLLAAGKIEF NLAANLIQSF DAASQNIPLV AVAALFQKDP 
FILMSHPDAG FDKIEDLPRA TAFIGKDAFV SVYQWLKSAY GFREDKVQPY NFNAAPFIRD 
KNSIQQGYAT SEPFAIEREG GFRPNAFLIA DYGYDSYSTL IETRADLIAK NPDLVQRFVD 
ASIIGWLHYL YGDSGKADAL ILADNPDMTK ELLAYSRDKM KELGIVVSGE ARTLGVGAMT 
EPRVKSFFGK MAAAGLFKPN LDYRSAYTLQ FINKGVGLDL IPRP