Gene Msil_0279 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0279
Symbol
ID	7090598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	321380
End bp	322537
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	66%
IMG OID	643463612
Product	protein of unknown function DUF195
Protein accession	YP_002360620
Protein GI	217976473
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0843742
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCC TTGTCGCATG GCTCAATGGC GCGCCGCTCA CAGCTCCGCA GCTCATGCTC 
GCCGGGGTCG GCGCCGCGCT TGTGCTGCTC TTTATCTTTG CCATCAGCCT GGCGCGGTCG 
TCGCGCCGCA ACAGCGTCGC GGCGATGGCC GCCGCCGGGC GCCAATATGA GATAGAGCAG 
GCGCTCGGCG CGATCGCGCG GCAGAACGCT GAGCTTTCGG GCCGCATGCG CGCCGTGGCC 
GATTCGTTCG GATCGCGCCA GAGCGACCTC GCGCGCTTCG TCGCGGCGCG GCTCGACGCC 
GTCGGCGAGC GGGTCGGCGC CGATGTCGAG GCCTCCGGCC GCAACGCCGG CGAGCAGCTC 
GCAAGGTTGA ACGAGCGCCT GGCCGTGATC GACGCCGCGC AGGCGCGCCT GACGGGTTTG 
TCGCAGGACA TGGTCGGGCT CAAGGACATT CTCGCCAATA AGCAGGCGCG CGGCGCTTTC 
GGACAAGGCC GCATGGAAGC GATCATCAGC GACGCCCTGC CTTCCTCCGC TTATGCTTTT 
CAGCACACGC TCTCGAACAG GATGCGCCCG GACTGCGTCA TTCGGATGCC GGGCGATCCG 
CGGCTGATGG TGATCGACGC CAAATTTCCG CTCGAAGCGT TCACGGCTCA TAAGGCGGCC 
CAGAGTTTCG AGGCGAAAAA ACACGCCGCG GCGCGGGCGC GCGCGGATCT TGGCAAGCAT 
ATCCGGGACA TCGCCGAGCG CTATTTTCTG CCCGAGGAAA CGCAGGATAT CGCGCTGATG 
TTCGTGCCTT CCGAATCGCT TTACGCCGAC ATCAACGAAC ATTTCGACGA TATCGTGCAA 
AAAGCCCATC GCAGCCGGAT CATCATTGTT TCGCCGTCGC TGCTGATGAT GGCGATGCAG 
CTGACGCAGG CGCTGGTGCG CGACGCGCGG GTGCGCGAGC AGACCCATGT CATCCAGGCC 
GAGGTGCGCC GCCTCGTCGA GGACGTCGCG CGGCTGCGGG CGCGCGCCCT GAAACTCGAC 
GCTCATTTCC AGAACGCGCA GCAGGATGTC GGACAGCTCA TCGCCTCAGC CGACCGGATC 
GCCCGGACCG GCGAGCGCAT CGACGAAATG GACTTTTCGG ATGCGCCTGG CGGCGACAAG 
CTGAAGGCGG CCGAATAA

Protein sequence

MDRLVAWLNG APLTAPQLML AGVGAALVLL FIFAISLARS SRRNSVAAMA AAGRQYEIEQ 
ALGAIARQNA ELSGRMRAVA DSFGSRQSDL ARFVAARLDA VGERVGADVE ASGRNAGEQL 
ARLNERLAVI DAAQARLTGL SQDMVGLKDI LANKQARGAF GQGRMEAIIS DALPSSAYAF 
QHTLSNRMRP DCVIRMPGDP RLMVIDAKFP LEAFTAHKAA QSFEAKKHAA ARARADLGKH 
IRDIAERYFL PEETQDIALM FVPSESLYAD INEHFDDIVQ KAHRSRIIIV SPSLLMMAMQ 
LTQALVRDAR VREQTHVIQA EVRRLVEDVA RLRARALKLD AHFQNAQQDV GQLIASADRI 
ARTGERIDEM DFSDAPGGDK LKAAE