Gene Mlab_0363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_0363
Symbol
ID	4794914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	341803
End bp	343068
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	52%
IMG OID	640099013
Product	hypothetical protein
Protein accession	YP_001029806
Protein GI	124485190
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAC TGGTTCTTTC AAATGCCCGG CTGCCTGACG GAAGGATCGC AGACATCTCC 
ATAGATCAGG GAATCATCAC CCACATCGGG AGTTCCGGAC ATGGAGAAAG AGTAATTAAC 
TGCAGAAACC GGCTCTGCAT ACCGGCTGCT ACCGACATGC ATGTCCATAT GCGGGATGGT 
AGTCAGGCAG CAAAAGAGAC TTGGAAAACC GGGACTCAGG CGGCGGCGGC AGGAGGAGTG 
GCTACGGTCG TCGACCAGCC AAACACCATT CCTCCAATGG ATACCGTTGA AAACTTTCTG 
GAGAGAGCCG CTCTCGCCTC GAAGGAATCC TTCTGTCACT TCGGCATCAA CGGATCGGTT 
ACCGAACATG CGGATATTGC AGGCCTCGCA AAAGCTGGAG TTCTTGCATT TGGCGAGATG 
TTTGCAGCTC CATCGAGTTA CGGCAGCGCC CTCCCTGCAG AGGTGATCAG GGATTCTCTA 
AAAACCATCG CAAATCAAAA CATGCTGGTC ACCGTACATG CGGAAGAAGT TATTCTCGGG 
GAGATTCATT CCCTTGCCGA GCATTCCCGT TCACGTCCGA TATCCGGAGA GATAGAAACC 
ATCCGGCTTG TGCAGAATCT CGCACCGACG CATGCACAAC TGCACATCTG TCATGTCAGC 
GGCGCCGAAG CATTCGAAAC GATCAAAGGA AGTTTCGAAG TCGCCCCCCA TCATCTTTTT 
TTGTCCTATG AAGATACTGA TCCGGAAAAT ACTTTTTGGA AAATGAATCC CCCGCTCCGT 
TCAAAAAAGG AGCGGCTGCA TCTCATTCAA AACTTCGCAA AAATCCCCGT GATTGCCTCG 
GACCATGCCC CCCATACAAT TCAGGAAAAG TCACAGCCGT TCTCCGCTTC TGCACCGTCC 
GGAGTTCCCG GCGTGGAAAC GATGCTCCCT CTCCTGATGA ATGCCGTGAC ACAGCGAACG 
ATCACCCTGA ACGATGTAAT TGAAAAAACG GTAACAAATC CATGCAGAAT ACTTGGCATA 
TCTGCCCCAT CGCTTAGTCC GGGCAGCCGG GCCGATCTTG CCGTATATGT CGACATCCCG 
ACAAAGATAA CCGGCGAAGC TCTGCACAGT AAATGCGGGT GGACCCCCTA TGAAGGAATG 
TCCGGGCTTT TTCCCGCAAC AACGGTGATA GGCGGTATCC CTGCATGGCA TGACGGGGAA 
TTTACCCACG GCGGCGGACA GATGTGGAAA AATACCCAAA AGGCACAACT TCGCCGAAAA 
GAGTAA

Protein sequence

MSELVLSNAR LPDGRIADIS IDQGIITHIG SSGHGERVIN CRNRLCIPAA TDMHVHMRDG 
SQAAKETWKT GTQAAAAGGV ATVVDQPNTI PPMDTVENFL ERAALASKES FCHFGINGSV 
TEHADIAGLA KAGVLAFGEM FAAPSSYGSA LPAEVIRDSL KTIANQNMLV TVHAEEVILG 
EIHSLAEHSR SRPISGEIET IRLVQNLAPT HAQLHICHVS GAEAFETIKG SFEVAPHHLF 
LSYEDTDPEN TFWKMNPPLR SKKERLHLIQ NFAKIPVIAS DHAPHTIQEK SQPFSASAPS 
GVPGVETMLP LLMNAVTQRT ITLNDVIEKT VTNPCRILGI SAPSLSPGSR ADLAVYVDIP 
TKITGEALHS KCGWTPYEGM SGLFPATTVI GGIPAWHDGE FTHGGGQMWK NTQKAQLRRK 
E