Gene Mthe_1113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1113
Symbol
ID	4463388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1200479
End bp	1201777
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	58%
IMG OID	639700130
Product	dihydroorotase
Protein accession	YP_843536
Protein GI	116754418
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGACC TTCTGGTAAA AGACGGCAGG GTTTACACTG GTGGCAGGCT GCTGAACACG 
GACATATGGA TCAAAAACGG AAGGATCGCA GCACTCGGTG GATACAACAC AGCCGCAGAG 
AGAATCGACG CCAGCGGCAT GATCATCATA CCTGGGGTTA TCGACATGCA CGTCCACTTC 
AGGGATCCTG GGTACACGCA CAAGGAGGAC TGGGAGAGCG GCTCGATATC CGCGGCTGCT 
GGCGGTGTGA CGACAGTGGT CGACCAGCCC AACACAGATC CTCCGGTCAT GGACGCGGAG 
TCGTATAAAG AGAAGCTGAA TCTGGCGAAG CGAAGGTCGA TCGTGGACTT CTGCCTCAAC 
GGCGGTCCGG GCGATATCGA ATCACTCCTC AGAGAGGGGG CGGCTGCGAT CGGCGAGATC 
TTCATGTACG AGATGAGCGA GGAACGTCTA GCCAGAATTT TAAAGGAGGT CGAGCGGCTC 
GACGTGCTCG CGACTGTGCA CGCAGAGGAT GGGGAGGTGA TACGGAGATA CTCGGAGCCG 
CTTGGAGGGA TCTGCGATCC CGATGTCCAT TCAAGAGCGA GACCGCCGAT AGCTGAGGTC 
TCTGCGATCG ACCGGGCTCT GAGCGTATCC AGATGCAGGA TTCATATCTG TCACATCTCG 
ACGGCTGATG GACTGGAGCT CGTAAAGAGG AGAAGGAACA GGAAGGTGAG CTGCGAGGTC 
GCTCCGCACC ACCTTTTCCT GAGCAGGAGG GATTACAGGA GGCTCGGCAC ATTCCTCAAG 
ACGAACCCGC CTCTGCGCAA CACAGCTGAC TGCGATGCCC TCTGGGACGG CCTGAGGCGG 
AGGGATATAG ATGTCATCGC ATCAGACCAC GCACCCCATC TCCCTGAGGA GAAGAGGGAT 
GATATCTGGC ATGCGCCCCC CGGCGTCCCG GGCGTGGAGA CGATGCTCCC CCTCATGCTA 
TACGCTGTGA AGAGCAACAT GATAACCCTG GAGAGGGTTG TTGACGCGCT CTCAGCAAGG 
CCAGCATCCA TACTTGGATT GAGATCCAAG GGGGAGATAG CCATCGGAAA AGATGCGGAT 
CTGGTTATCT TCGATCCGAA AAGGCAGGAA CGAATCGATG TTCAGCGGCT CCACAGCAGG 
GCGGACTGGA CACCGTATGA AAGGAAGAAG GCGATCTTTC CGGTGATGAC CCTTGTGAGG 
GGCAGCGTCG TGTTCGATGG CGATATCGAG GTGAGCCCCG GCTACGGCAG GAATATCGAG 
ATGCGCCAGG AGACGCGCAC GGAGGCGATC TCTGATTAG

Protein sequence

MMDLLVKDGR VYTGGRLLNT DIWIKNGRIA ALGGYNTAAE RIDASGMIII PGVIDMHVHF 
RDPGYTHKED WESGSISAAA GGVTTVVDQP NTDPPVMDAE SYKEKLNLAK RRSIVDFCLN 
GGPGDIESLL REGAAAIGEI FMYEMSEERL ARILKEVERL DVLATVHAED GEVIRRYSEP 
LGGICDPDVH SRARPPIAEV SAIDRALSVS RCRIHICHIS TADGLELVKR RRNRKVSCEV 
APHHLFLSRR DYRRLGTFLK TNPPLRNTAD CDALWDGLRR RDIDVIASDH APHLPEEKRD 
DIWHAPPGVP GVETMLPLML YAVKSNMITL ERVVDALSAR PASILGLRSK GEIAIGKDAD 
LVIFDPKRQE RIDVQRLHSR ADWTPYERKK AIFPVMTLVR GSVVFDGDIE VSPGYGRNIE 
MRQETRTEAI SD