Gene Msil_2988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2988
Symbol
ID	7093482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3299535
End bp	3300548
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	64%
IMG OID	643466298
Product	dihydroorotate dehydrogenase
Protein accession	YP_002363261
Protein GI	217979114
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.101094
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTCC GCACCCGCTA TCTCGGCCTT TCTCTGCGCA CCCCGCTGAT CGCGTCGGCG 
TCGCCGCTCT CGGGCGATGT CGGACTCATT CGACAAATGG AAGATTCGGG CGCAGGCGCC 
GTAGTGCTGC CATCGCTGTT CCAGGAGCAG ATCGAGGAGG AGGCGCGAGC AGCCGATGAG 
CTCGCAAGAA TCGGCGCCGA CAGCTCTCCG GAAGCAAGCT CCTATTTTCC GGCGGTCGTT 
ACGTATAATT CGGGACCGCA CGGCTACCTC GATCTCGTCG CCCGAGCGCG CGCCGCCGTC 
GACATCCCCG TTATTGCAAG TCTCAATGGA ACAACCGTTG CCGGCTGGGT CGATTATGCA 
AGGCTGATCG AACAGGCCGG AGCGACAGCC CTCGAACTCA ACATCTATCG GATCGCGTCC 
GGGCCCGGCG TGACGGGCGG GCAGGCCGAG GCCGATTGCG TGGCGCTGCT CGAAGCCGTC 
CGCAGCCGGG TCAAACTTCC CGTGGCCGTC AAGCTGCATC CCTACTTCTC GGCGTTCGGC 
GATTTCGCCC AGCAGCTCGA TCACGCAGGC GCCGACGGGC TGGTTCTCTT CAATCGCCTC 
TACCAGCCCG ATATCGACCT CCTTCGCCTG GCCTGGAAAA ATGACGCGAC GCTGAGCGGC 
GCGGGCGAGA TCCGGCTTGG CCTGCTCTGG CTCTCCGTTC TCTCGGGCCG GTTGCCGCAT 
GCCTCGCTTG CCGCGGGCAC GGGCGTCGAT ACCGCCGAGG AGGTGATTAA ATACATTCTT 
GCGGGCGCGA ATGCCGTGAT GACGGCCTCG TCGCTACTGC GGCATGGACC CGGGCATCTG 
CGCACGCTTG TCTCGGGTTT GGAGACGTGG CTGAGCACAA GAGGCTTTGC TTCGGTCAGC 
GCGATCACGG GATTGATGCG GCCTTCTCAT CCGGACTCAG AGGCCGAGGC GGACGAGCGC 
GGCAGCTACA TCGAGAGTTT GTCGAGCTAT CAGGGTCCGT ATGTTCGCCA TTGA

Protein sequence

MDLRTRYLGL SLRTPLIASA SPLSGDVGLI RQMEDSGAGA VVLPSLFQEQ IEEEARAADE 
LARIGADSSP EASSYFPAVV TYNSGPHGYL DLVARARAAV DIPVIASLNG TTVAGWVDYA 
RLIEQAGATA LELNIYRIAS GPGVTGGQAE ADCVALLEAV RSRVKLPVAV KLHPYFSAFG 
DFAQQLDHAG ADGLVLFNRL YQPDIDLLRL AWKNDATLSG AGEIRLGLLW LSVLSGRLPH 
ASLAAGTGVD TAEEVIKYIL AGANAVMTAS SLLRHGPGHL RTLVSGLETW LSTRGFASVS 
AITGLMRPSH PDSEAEADER GSYIESLSSY QGPYVRH