Gene Msil_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2000
Symbol
ID	7094198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2170217
End bp	2171473
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	59%
IMG OID	643465326
Product	hypothetical protein
Protein accession	YP_002362304
Protein GI	217978157
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGACC GTTCAGTATC GGGTAAGACG CGGCGCCCGA ACGCGTCCAC GGCAGGCGCC 
CTCGCGCTTT GCGTCGCGCT CGGGTTCAGC GCCATAGATC TTACGAAGGC GGAGGCGGGA 
GAGACCATCG ATCTCGGCGA CGGCAGATCG TTCACGATCG GCGCCGGCCT CAGGACGAGC 
TTCGGCTCGG TTTCATCCTT TGCGCCTGGC GGCTACGGCA ACGGAACGAC GGCGCAATAT 
AATCTCGACA GCTTCCGAAT TTACACCGGC GCGACGCTGA ATGAATATAT CAAGGCGACG 
TTCAATACGG AACGCTCCTA TGGCAACGGG CCGATCGGAG TGCTCGACGC CTATGTGCAG 
TTCGAGCCGA TGAACGAAGT CAACGTCTGG GTCGGCCAGA TGCTGCCGCC AAGCGATCGA 
GCCAATCTCG ACGGCCCCTA TTATCTAAGC GAGTGGTATT ACCCGGGCGT CGTATCGCAA 
TATCCCTCGC GCTTCTATGG GCGCGATCTC GGCGGAACCG TGTGGGGCAA ACTGTTCGAC 
AAAAAGCTGG TCTATTCCGT TGGCGTCTTC GCGGGCCATA ATCTTGCAAC CTACAATGGC 
GTGCCAGGCC CCGGCGTCGA TCCCACGACC TTCGGCTTCT TTGGTCCATC GAATCAGGCG 
CATAATCCGC TTTTCGCCGG CCGCGTCGTG TATAATTTCT GGGACCCGGA ACCCGACCCC 
GCCTATTACG AAGCCAGCAC CTACTATGGC AAGGTCGACG TCCTCTCGAT CGGCGTCGCC 
GGCATGTTCC AGCAGGATGG GGTCGGGACC AGCTTCAACT CCGCAAATTA TGGAGCCTGG 
AACGTCGACG GCCTGATGGA GAAGAAGCTT GGCGACTATG GCGTGATCAC GCTGGAAGGC 
GCCTATTATA ATTACAACAC TGGCGGCATC GTTGACGTTC CGCCTAACTA CAATAACGCC 
GGCCTCACCG CGAATATCGG CGGTGTCACG CAGGGCAACG GCTATCTCGC GAGCGCCGCC 
TACCTTATTC CCTATACGTT CGGCTATGGG ATCGTTCAGG GACAGTTTCA GCCCTACGCC 
CGTTACCAGC ACTTTGACGC CACCGTTCTC GAGACATGGC AGTCGCAGAT CGATTTCGGC 
GTAAACTATG TGATCAAGCC GCATGATCTG GTCGTTACGC TGGATTGCGC GCTGAATTCG 
GCGAGCAACA CGCATAGCGG CACGCGGGTG ACGCTCGGCC TGCAGGTGCA GCTCTAA

Protein sequence

MKDRSVSGKT RRPNASTAGA LALCVALGFS AIDLTKAEAG ETIDLGDGRS FTIGAGLRTS 
FGSVSSFAPG GYGNGTTAQY NLDSFRIYTG ATLNEYIKAT FNTERSYGNG PIGVLDAYVQ 
FEPMNEVNVW VGQMLPPSDR ANLDGPYYLS EWYYPGVVSQ YPSRFYGRDL GGTVWGKLFD 
KKLVYSVGVF AGHNLATYNG VPGPGVDPTT FGFFGPSNQA HNPLFAGRVV YNFWDPEPDP 
AYYEASTYYG KVDVLSIGVA GMFQQDGVGT SFNSANYGAW NVDGLMEKKL GDYGVITLEG 
AYYNYNTGGI VDVPPNYNNA GLTANIGGVT QGNGYLASAA YLIPYTFGYG IVQGQFQPYA 
RYQHFDATVL ETWQSQIDFG VNYVIKPHDL VVTLDCALNS ASNTHSGTRV TLGLQVQL