Gene Msil_3807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3807
Symbol
ID	7090735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	4169671
End bp	4170795
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	69%
IMG OID	643467092
Product	dihydroorotate dehydrogenase
Protein accession	YP_002364051
Protein GI	217979904
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0649715
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCCCG CGCTCAACCG ACTGGTCGCC TGGATCGGCG CGGCGGCGAC GCCGCTCCTG 
CGGCAATTGG ATGCCGAGAC CGCGCATCGG CTGACGATCC GGGCGCTGGC GCTCTATCCC 
GCAACAGGCG CAGCGCCGGA CGATCCGCGC CTCGCCGTCA CGGCGTTCGG CCTCCATTTT 
CCCAATCCGG TCGGCCTTGC CGCTGGCTTT GATAAAAACG CCGAGGCGGT CGATGCGATC 
CTCGCGCTTG GCTTCGGCTT TGCCGAAGTC GGCACGATCA CCCCGCTGCC GCAGCCGGGG 
AATGCGCGGC CGCGCCTGTT CCGGCTGACG GCGGATGAAG CGGTGATCAA CCGCTTCGGC 
TTCAACAGCG AAGGCGCCGC GGCCGTACGG GCGCGCCTGG CCAAGCGTGG CGTCCGCCGG 
GCGGGGGTGC TCGGCGTCAA CGTCGGCGCC AACAAGGATT CAGCGGACCG CACGGCGGAT 
TATGTGCGGG CGATTGCGCA GCTGGCGGCG CCCGCGGATT ATCTCACCGT CAATATTTCG 
TCGCCGAATA CGCCGGGCCT GCGCGATCTC CAGCACGCCG CCGCGCTCGA CGATCTGCTG 
GCGCGGATTC TTGACGCGCG CGATGAATTG ATCTCGGCCT GCGGCCGCAA GCCGGTGCTT 
CTCAAAATCG CGCCCGACCT GACGCTCGAC GAACTCGACG CGATCATAGT TTGCGCCAGA 
CGCCGCGCCA TCGACGGGCT GATCGTGTCC AACACGACGC TGTCGCGTCC CTCCGGCCTG 
CGCGAGGCCG CTCTGGCGCG AGAGCAGGGC GGCCTGTCCG GTCGGCCGCT GTTCGATCTG 
TCGACGCGGA TGCTGGCGGC GGCCTTCTTG CGCGCCGAGG GGGCGTTTCC GTTGGTTGGC 
GCAGGAGGCG TCGACAGCGC CGAGCGCGCC TTCGCCAAGA TCGAAGCGGG CGCGAGCCTC 
GTGCAGCTCT ATTCGGCGCT GGTTTTCAAG GGGCCGGGGC TTGCCGACGC CATCAAGCGC 
GGCCTCGTCG CAACGCTGGA GCGCCGCGGC CTGCCCGCTA TTTCGGAGGC AATCGGGCGG 
AGGGCGAAGG ATTTTGCCGC GGGAACGGCG GGGCCCGTTC CCTGA

Protein sequence

MAPALNRLVA WIGAAATPLL RQLDAETAHR LTIRALALYP ATGAAPDDPR LAVTAFGLHF 
PNPVGLAAGF DKNAEAVDAI LALGFGFAEV GTITPLPQPG NARPRLFRLT ADEAVINRFG 
FNSEGAAAVR ARLAKRGVRR AGVLGVNVGA NKDSADRTAD YVRAIAQLAA PADYLTVNIS 
SPNTPGLRDL QHAAALDDLL ARILDARDEL ISACGRKPVL LKIAPDLTLD ELDAIIVCAR 
RRAIDGLIVS NTTLSRPSGL REAALAREQG GLSGRPLFDL STRMLAAAFL RAEGAFPLVG 
AGGVDSAERA FAKIEAGASL VQLYSALVFK GPGLADAIKR GLVATLERRG LPAISEAIGR 
RAKDFAAGTA GPVP