Gene Msil_2339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2339
Symbol
ID	7090323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	2541314
End bp	2542465
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	61%
IMG OID	643465661
Product	domain of unknown function DUF1745
Protein accession	YP_002362631
Protein GI	217978484
COG category	[S] Function unknown
COG ID	[COG3287] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.25177
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGC GCGGGGCGAT ACGACGCGGA TTTTCGACGG CGCCCGATCC TGTCACGGCG 
GTGCGCGAAT TTCACGACGC CATCGCCCAG CCCGATATTG GCCTGGTCGT GTTCTTCTGC 
TCCTACAGCT TCGACCTCAA TGTGCTGGAG CCGGAGCTGC GGCGCATGTT CGCCGGCGTT 
CAGGTAATCG GCTGCACCAC GGCCGGAGAA ATCACCCCGA TCGGCTATCT TGACGGGTCG 
ATCACCGGCT TCAGCATCGC GGCCTCCCAT TGCGTCGCGG CCACCGCCCT GATGCAGAAT 
CTGTCCAATT TCCAGATGTC CGACGGGCAC GCCGCGACGC AAAAAGTCGT CTCGGCCATG 
GGCGAGAAAG GTTATACGCT CGACCCGCGG GACTCTTTCG CGCTCCTTCT CATCGACGGC 
ATGTCCCGCA ATGAGGAGGT CGTGCTCGCC TCGATGCATC TTCTAATGGA TATGACGCCG 
CTCGTCGGCG GCTCCGCGGC GGATAATCTC TGCCTCAACG GCGCCTTCGT CTATTGCGAC 
GGCGCCTTCC ACAGCGACGC GGCCTTGCTC GCGGCGATCC GCATCAAAGC GCCGTTCCGA 
ATCCTGAAAT GCCAGCATCT CGTCGGCTCC GACGAACGAA TGGTGGTGAC GCGCGCCGAT 
CCGCACAGCC GCAAAGTGTT CGAGCTCAAC GGCGAACCGG CGGCGCGAGA ATATGCGCGA 
CTGCTCAATC TGCCCGAGCG CGCCCTGACC CCTTCGACCT TCTCCACTTA TCCGCTGATG 
GTCAAGATCG GCGCCGATTT TCATGTCCGC TCGATTCAGG CCGCCCATTT CGACGACAGC 
CTCACCTTCT TCTGCGCGAT CGACGAAGGC GTCGTATTGC GGCTCGCCAA AAGCGAAGCG 
GTGCTGCCCA ATCTCACCGC CTTTTTCGAA GGCGTGAACG AAAGCTTCGG ACAACCCGAG 
CTCGTGATCG GCTTCGACTG CATCTATCGC AGCCTCGCGC TGGAAAAGGC CCAGACGAAA 
CGCCTTGCCG GCGCATTGCT CGCCGCCAAT CATGTGATCG GCTTCAGCAC TTATGGCGAG 
CAGTTCGCCG GCATGCATTT GAACCAGACC TTTACCGCAA TCGCCATCGG CAAGCCTTAT 
GACGATCTCT GA

Protein sequence

MSGRGAIRRG FSTAPDPVTA VREFHDAIAQ PDIGLVVFFC SYSFDLNVLE PELRRMFAGV 
QVIGCTTAGE ITPIGYLDGS ITGFSIAASH CVAATALMQN LSNFQMSDGH AATQKVVSAM 
GEKGYTLDPR DSFALLLIDG MSRNEEVVLA SMHLLMDMTP LVGGSAADNL CLNGAFVYCD 
GAFHSDAALL AAIRIKAPFR ILKCQHLVGS DERMVVTRAD PHSRKVFELN GEPAAREYAR 
LLNLPERALT PSTFSTYPLM VKIGADFHVR SIQAAHFDDS LTFFCAIDEG VVLRLAKSEA 
VLPNLTAFFE GVNESFGQPE LVIGFDCIYR SLALEKAQTK RLAGALLAAN HVIGFSTYGE 
QFAGMHLNQT FTAIAIGKPY DDL