Gene Msil_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0235
Symbol
ID	7090552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	262125
End bp	263255
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	64%
IMG OID	643463569
Product	hypothetical protein
Protein accession	YP_002360578
Protein GI	217976431
COG category	[S] Function unknown
COG ID	[COG1289] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.635295
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGA TCGGCGCCGC CATCCGGGCC GAGGGCGAGG CCTTAGGTTC GATCTTCAGC 
GAGCTCGCCG CCGATCTCAG AGAGGCGAGC CTCTTTGGCC CGCGGGCGCG GTTTTGCGCC 
GCTTCCGCTC TCTCCGTCGG ATTGGCGACA GTCGTCGCGC TCGCCATGCA CGTCGACGAC 
GTATGGTGGG CGGCGATCAG CGCCTTCATG TGCAGTCAGG CGACCCTGCC GGCGTCCCTG 
ACAAAAGGGG TCTTGCGTAT GATCGGCACC ATCGCAGGCG CCATCGCCGC CCTCATGCTC 
GCGTCCTGGC TCTCCTATGA CTGGGTGGCC TGTTGTCTTT TTCTGTTTAT GTCGACCTTC 
ATCGGCACGC TCGGCTTTCA GCTCAGCCCG CATGCCTACG CCTGGCTGCT TGGCTCGATC 
ACGTTTAATT TCATTATCCT GTTGGCGCTG TCCTCGCCGC AGGACACATT CTATTTTTCG 
ATCTATCGCA TCATGGAAGT CGCCATCGGC GTGGCGTCGG CGCTGCTGAT TGCGGTCCTC 
CTTGCGCCCA AGGAGGGCGG AGCGATGCTT CCCGCCGCCG GATGGGGCAG CTTTCTCGAC 
GACGCTCAAA CCATGGCGCG GCTGCATGCG CTTCGCGCGG CGTTCACCGT CATGCTCATT 
CCGATCGTTT GGAGCTACGC CGAACTGCCA AGCCTCGCGC AGATGGCAAT TACGATCAGC 
GCCGTGATGG CCGTGCCGGC GCCGACGGCC GCGACGCCTG ACCCCGGCCT CATGATGGTC 
CGTCGTGCGC TTCACCGACT GCTCGGCTGC TTTATGGGTG GGATCATTGC GCTTGTCTGC 
CTCGCCGCGC CGCTGACCAA TTTCCTCGTC TGGCTCGCAA CGCTGATGGG CGGCGTCTGG 
ATCGGCTGCC ACCTTCAGGC CACCCCGCGC AAGATTGGCT ATGTCGGCAC CCAGGGAGCC 
ATCGTCTTCA TCATGACGCT GGTGCAGGGA TTTGGGCCGC CGACCAGCAT CTGGCCGGCC 
GTCGAACGCC TCGGCGGCGT CAGTTTCGGC CTGCTGATCC TGCTTCTAGT GTCGATCGTC 
TTCGAGATCC TGGTTCCCGA GACGACGCCC GCGCGCCTCG CCGTCGATTA G

Protein sequence

MSGIGAAIRA EGEALGSIFS ELAADLREAS LFGPRARFCA ASALSVGLAT VVALAMHVDD 
VWWAAISAFM CSQATLPASL TKGVLRMIGT IAGAIAALML ASWLSYDWVA CCLFLFMSTF 
IGTLGFQLSP HAYAWLLGSI TFNFIILLAL SSPQDTFYFS IYRIMEVAIG VASALLIAVL 
LAPKEGGAML PAAGWGSFLD DAQTMARLHA LRAAFTVMLI PIVWSYAELP SLAQMAITIS 
AVMAVPAPTA ATPDPGLMMV RRALHRLLGC FMGGIIALVC LAAPLTNFLV WLATLMGGVW 
IGCHLQATPR KIGYVGTQGA IVFIMTLVQG FGPPTSIWPA VERLGGVSFG LLILLLVSIV 
FEILVPETTP ARLAVD