Gene Msil_3849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3849
Symbol
ID	7092545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	4216121
End bp	4217440
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	67%
IMG OID	643467134
Product	dihydroorotase, multifunctional complex type
Protein accession	YP_002364093
Protein GI	217979946
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.058395
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTC CCGTCTCTCC GTCGGTCGCG CATCAGCCGC TGGCGCTGGT CAACGGCCGT 
CTTGTCGATG GGCAGACCTA TGATTGCGTG CGCGGCGGAA TTCTCATCCT CGACGGGAAA 
ATTCTCGATC TCGGCCCCGA AGTCGCGCCG AAAAACCTGC CCGTTCATTC GCGCGTGATC 
GACTGCGGCG GCGATTTCAT CGCGCCGGGC CTCATCGACA TGCGCGCCTT TGTCGGCGAG 
CCGGGCGGCG AGCATCGTGA AACGATCGCC ACCGCGACGG CCGCGGCGGC AGCGGGCGGC 
GTCACAACGA TTCTGGCGCG GCCCGACACC AATCCGCCGG TCGATGAGCC CGCCGTCGTC 
GATTTTCTGC TGCGCCGCGC CCGCGACACC GGCCGCGTGC GGCTCATTCC CTGCGCGGCG 
ATGACGCAAG GGCTGCGCGG CGAGGAGATC GCCGAGATCG GGCTGTTGCA GCAGGCGGGC 
GCGCTCGCTT TTTCGGACGG CGCCCATTCC ATCGCAAACT CCCGCGTGCT GCGCCGCGTG 
CTCTCCTATG CGCGCGATTT CGACGCGCTT ATCATTCATT ATGCCGAGGA TCGCGACCTC 
GCCGCCGAGG GCGTCATGAA TGAGGGCGAA TTCGCCACAA GGCTCGGCCT CTCTGGCATC 
CCGCGCGAGG CGGAGGCGAT CGCGCTCGAC CGCGACATCC GCCTCGTCAA CCTCACCGGC 
GCGCGCTATC ACGCCGCGCT GGTGACGACG ACGCTGTCGC TCGACATTAT CGAACGCGCC 
AAGGCGGCCG GACTGCCGGT CACCGCTGGA ACCTCGATCA ATCATCTGAC GCTGAACGAA 
AGCGATATCG GCGATTACCG CACCTTTCTA AAGCTTGCGC CGCCGCTGCG GCGCGAGGAC 
GAGCGGCGCG CGCTCGTGGA GGCGCTGTCG TCCGGCCTGA TCGACGTCAT CGTGTCCGAC 
CACAATCCGC AGGACGTCGA GACCAAGCGC CTGCCTTTCG CCGAAGCCGA GAATGGCGCG 
ATCGGGCTCG AGACCATGCT GGCGGCGGGG TTGCGGCTTG TCGCCTCCGG CGAAGTCTCG 
CTGCAACGGC TGATCGGCGC CATGACGCTG CGTCCCGCCG AAATTTTGGG CCTGCCGCAG 
GGCCGGCTGC GGGTTGGCGC CCCGGCCGAC GTCATCCGCT TCGATGCGGA GGCCGCCTAT 
GTGGTCGATC CCTCAAAACT GCGCTCGCGC TCCAAGAACA CGCCCTTCGA CGAGGCGACC 
ATGGAAGGCC GCGTGAAGCT GACGCTGGTC GAGGGGCGGA TTGTGTTCGA GGAGGAGTGA

Protein sequence

MNIPVSPSVA HQPLALVNGR LVDGQTYDCV RGGILILDGK ILDLGPEVAP KNLPVHSRVI 
DCGGDFIAPG LIDMRAFVGE PGGEHRETIA TATAAAAAGG VTTILARPDT NPPVDEPAVV 
DFLLRRARDT GRVRLIPCAA MTQGLRGEEI AEIGLLQQAG ALAFSDGAHS IANSRVLRRV 
LSYARDFDAL IIHYAEDRDL AAEGVMNEGE FATRLGLSGI PREAEAIALD RDIRLVNLTG 
ARYHAALVTT TLSLDIIERA KAAGLPVTAG TSINHLTLNE SDIGDYRTFL KLAPPLRRED 
ERRALVEALS SGLIDVIVSD HNPQDVETKR LPFAEAENGA IGLETMLAAG LRLVASGEVS 
LQRLIGAMTL RPAEILGLPQ GRLRVGAPAD VIRFDAEAAY VVDPSKLRSR SKNTPFDEAT 
MEGRVKLTLV EGRIVFEEE