Gene Msil_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1041
Symbol
ID	7091869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1124066
End bp	1125283
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	66%
IMG OID	643464380
Product	protein of unknown function DUF900 hydrolase family protein
Protein accession	YP_002361372
Protein GI	217977225
COG category	[S] Function unknown
COG ID	[COG4782] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0813673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATTG CGTTCGTTGC GCTGCTTTGC GTCGCGCTTG CCGCCTGCGG CCGTCCGCAG 
GGCGTCATGG AGCCGATCGG GGTCAGCGTC CCGAATGCGT CCCTTGTCGA TCTCCTCGTC 
GCGACGACCC GGGCGCCGGC CAAGAATCCG GCGATTTTGT TTACCGGAGA GCGCGAGAGC 
AAGGTCGCTC TTGCCGATAT CACCGTCTCC ATTCCGCCGG CCGATCGGCG CCAGATTGGA 
CAGGTGCAAT GGCCGTCGAG CCTGCCGCCC AATCCGCTGA CCGATTTCGC CACGGTGCGC 
GTCACGCCGC TTGCCGGCGT CGGTGAGGCG CGCGGCTGGC TGAAGCAGAA TTTGCCGCGC 
GACCGGCGCG TGCTCGTCTT CGTGCATGGC TTCAATGTGC GCTTCGAGGA AGCCGTCTTC 
TCCCTCGCGC AGATCGTGCA TGATTCGGGC GCCGAGGCCG CGCCCGTGTT GTTCACCTGG 
CCCTCGCGCG GCAATCTGTT TCAATATATC TACGACCGGG AAAGCACCAA CGCCTCGCGC 
GATGCGCTGG AGGAAACGCT GCGCCGCATC GCGACGGACC CCTCGGTCGG CGAGGTCACG 
GTCATGGCCC ATTCGATGGG CTCCTGGCTG GTGATGGAAT CGCTGCGCCA GATGTCGATC 
CGCGACGGCC GCGTGTTGCC GAAGATCCGC AATGTGATCC TCGCATCGCC CGATCTTGAC 
ATCGACGTCT TCGCCGCGCA ATGGGCGGAG ATCAGCAAAC CGCGTCCGCG GCTGACGGTG 
TTCAGCTCGC GGGACGATGC GGCTCTGCGG GCCTCGCGCC GCCTCGCCGG CGACGTCGAC 
CGGCTGGGAT TGATCGATCC GCTGGCCGAG CCGTTCCGGT CGGAGCTTGA ACGCGCGGGC 
GTCGACGTGA TCGACCTCAC CGATCTCTCG CGTCCGGGCT CGCTCAACCA TTCGAAATTC 
GCCGAGAATC CGGAGATCGT GCAGCTTCTC GGCAAGCGGC TGATCGCCGG CCAGAGCCTT 
GGCGGCGAGA CGAGCCTTGG CGAGCGCGTC GGCGGCTTCG CCATGGGCGT CGGCCAGACG 
GTTGGCGGCG TCGCGGGCGT CGCCGTCAGC GCGCCGCTGG CGATCGTCGA TCCGAACTCG 
CGGCGGACGT TTGACGATCA GCTGAAGCAT CTTGGCGACG TGGCCAATGA CACGGTCGAT 
TCGGCGCGTC CGAATTAG

Protein sequence

MRIAFVALLC VALAACGRPQ GVMEPIGVSV PNASLVDLLV ATTRAPAKNP AILFTGERES 
KVALADITVS IPPADRRQIG QVQWPSSLPP NPLTDFATVR VTPLAGVGEA RGWLKQNLPR 
DRRVLVFVHG FNVRFEEAVF SLAQIVHDSG AEAAPVLFTW PSRGNLFQYI YDRESTNASR 
DALEETLRRI ATDPSVGEVT VMAHSMGSWL VMESLRQMSI RDGRVLPKIR NVILASPDLD 
IDVFAAQWAE ISKPRPRLTV FSSRDDAALR ASRRLAGDVD RLGLIDPLAE PFRSELERAG 
VDVIDLTDLS RPGSLNHSKF AENPEIVQLL GKRLIAGQSL GGETSLGERV GGFAMGVGQT 
VGGVAGVAVS APLAIVDPNS RRTFDDQLKH LGDVANDTVD SARPN