Gene Mpal_1734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1734
Symbol
ID	7271298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1805027
End bp	1806295
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	63%
IMG OID	643570348
Product	dihydroorotase, multifunctional complex type
Protein accession	YP_002466764
Protein GI	219852332
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.409452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAGATC TCCTCCTATT AAACCTGACC CTTCCGGACG GAAGGGTTGT CGACCTGCAG 
GTCCGGGACG GGATCGTCGT GCATGCAGGT GCCGGAGCTC CGGCTCATCA GACGCTCGAT 
TGCAGGGGAC TGCTCGTCCT CCCGGCCGCG ATCGATATGC ATGTTCATAT GCGGGGCGGC 
ACTCAGTCCG TCAAGGAGGA CTGGACCACC GGTTCGCAGA GCGCACTGGC CGGCGGGGTG 
ACGGTGGTGG TCGACCAGCC GAACACTGTC CCGCCGATCA CCAACCGGGA ACATTTCAAA 
GTCAGGGTCG CCGATGCCAC CGCCCATTCG TACTGCGGGT TCGGGGTGAA CGGGGCCGTG 
ACCCGGGATG CGAGAATTGC GGACCTCTGG CAGGGCGGGG CGCTGGCGTT CGGCGAAGTC 
TTCATCGCTC CGTCCAGTTA CGGGGAGGCC CTGACACTGG AGGTGCAGCA GCGCACCTTT 
GCTGAGATCC ATCGGCTGGG GGGGCTCGTC ACCGTTCATG CTGAGGAGGT CTCCGGTACC 
GCGCCGGTCG GGCTCCGCCA GCACAGTCTG CAGCGATCGC CGGCAGGGGA AGAGCGAGCT 
GTACAGGCCC TGCGGGCATC GTGCGCACCC GGTCAGCGGG TCCACTGCTG CCACATGAGC 
ACGGCAGGAT CGTTGGATGC AGCTCATCGG GCAGGGATGA CGGCCGAGGT GACTCCCCAT 
CACCTCCTTC TCTCCATCGA ACGGTTCGCC GATACCGACA CTCACGGGCG TGTGAACCCA 
CCGCTCAGGT CGGAACGTCT CCAGAGAGAA CTCTTTCTGG CCTGGGATCG GATCGACCTG 
ATCGCTTCGG ACCATGCGCC GCACACATTG AACGAGAAGG CGCAGGCCTT TACGAATGCC 
CCTTCCGGGC TGCCGGGCGT CGAGACGATG GTTCCGCTGT TGATGGCGCA TGTCCTCACC 
AGCGAACTCT CTCTCGCTTC TGTCGTGCAG AAGACCGCTG TTGCACCGGC GAAAGTTCTG 
GGAATCCCAC CGGCCGGGTT CTCACCCGGC GATCGTGCCG ACTTTGCGCT CTATCCCCGT 
GAGGCGGTCC CTGTTGAGGC CGCCGACCTG CACAGCAGGT GTACCTGGAC ACCGTATCAA 
GGGATGTTGG CGGTCTTTCC TGAACGGGTA ATCATGCGGG GAACGGTCGT CTATGACCAT 
GGGGACTTCA CAAGGATCGA CCCCTGCTGG TACAGGGGGA GGGGTTATAT GGAGAGACCA 
CAGATATGA

Protein sequence

MLDLLLLNLT LPDGRVVDLQ VRDGIVVHAG AGAPAHQTLD CRGLLVLPAA IDMHVHMRGG 
TQSVKEDWTT GSQSALAGGV TVVVDQPNTV PPITNREHFK VRVADATAHS YCGFGVNGAV 
TRDARIADLW QGGALAFGEV FIAPSSYGEA LTLEVQQRTF AEIHRLGGLV TVHAEEVSGT 
APVGLRQHSL QRSPAGEERA VQALRASCAP GQRVHCCHMS TAGSLDAAHR AGMTAEVTPH 
HLLLSIERFA DTDTHGRVNP PLRSERLQRE LFLAWDRIDL IASDHAPHTL NEKAQAFTNA 
PSGLPGVETM VPLLMAHVLT SELSLASVVQ KTAVAPAKVL GIPPAGFSPG DRADFALYPR 
EAVPVEAADL HSRCTWTPYQ GMLAVFPERV IMRGTVVYDH GDFTRIDPCW YRGRGYMERP 
QI