Gene Mboo_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1040
Symbol
ID	5412255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	-
Start bp	1023148
End bp	1024404
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	58%
IMG OID	640868266
Product	hypothetical protein
Protein accession	YP_001404201
Protein GI	154150583
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.582207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.497226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGCG CACAGATTTA CCGGGAGAAG CTTGCCCGGC TTGAGACCGT TATTGCGGGT 
AAAGAGCCGG ACCGGGTGCC GGTCACCGCG ATGGTGGATC TCTTCCACGG GCGGTACGCG 
GGGTACACGG CGCAGGAGAT ATTCTTCGAT TACGGGAAGA ACCACGATGC AGCGATGAAG 
ACTGCCAAAG ACTTTGACTT TGATTCGCTG CTGGTCTTAA ACGGCCTTGA GGGGATGAAC 
ATGGTACTCA CGTTCATGAA GAACAACCCG CCGCTTGCAT CAGGGGCGCG GTTCATGACC 
GGCCCGTTCC ACCAGATCTT AAAAGACGTG TACACGAAAT GGCCCGGTGT GGAACTCGAC 
GCTTCCTCCC ACCCGCAGTT CGTGGGAAAG GAGATCATGA AACCGGAGGA GTATGGCCAG 
CTCATCGCCG ACCCGTCCGG CTTTTTGAAC CGGGTTGCGC TGCCGCGGAT GTGCCCGGCA 
CTTGCTGATT TGGGATCTCC TGAGGCAAAC GCTGCGATGC TTGCCTACGG CGCGGAACTC 
TCAAAATCCG GGGCGGCGCA GATGGCGGTT ATCGGGCAGC TCGGACAGAT GGGCATCCCG 
ACGTTCCCGA CCTCGTGGAG TTATGCCCCG CTCGACTTCG TGAGCGACTT TTTGCGGGAC 
ATAAAAAATG TCGTGCTCGA CATCTACCGC AAGCCCGATC TCGTGAAGCA GTCCGCGGAT 
GCGCTCGTGG AGCCCTTGAT CGAATCGGCC CGGCTGAGCG GTGCCGTCCC GCCCGAGGTC 
AAAAAGGCCC TTGGGACAAA CGTGGTCGAG TGCTTCTTCC CGCTGCACTT AACCGAGTAC 
CTCAATCCGA AGCAGTACAA CGAGTTCTAC TGGCCGTCGT TAAAGAAGGT GCTTCTCGAA 
GTGATCAACA TGGGCCAGAC GCCGTACATC CTCTTTGAGG GCCGGCACGA TGCGCACCTG 
GAAACCCTCC TCGATCTCCC GAAAGGAAAG ATCGTTGCGG TCTTTGACAA GACCGACCCG 
AGGAAAGTCC GGGAGGTGCT CGATGACCAT GTGGTTCTCG TATCTGGCCC GCCTAACTCG 
CTTCTCATCG GAGGCACACC ACAGAAGGTG GACGATTACA TGAAGTCAAT GCTTGACGAC 
TGCAAGCAGG GCGGCATGAT GATCTACCCG GGTGCGGACG GTGGCATATC TGGTGAAGCC 
CGGCCGGAGA ATGTCAGGGC TGTGTTAGAG GCCGTGAAGA AATACGGGAC GTATTAG

Protein sequence

MDGAQIYREK LARLETVIAG KEPDRVPVTA MVDLFHGRYA GYTAQEIFFD YGKNHDAAMK 
TAKDFDFDSL LVLNGLEGMN MVLTFMKNNP PLASGARFMT GPFHQILKDV YTKWPGVELD 
ASSHPQFVGK EIMKPEEYGQ LIADPSGFLN RVALPRMCPA LADLGSPEAN AAMLAYGAEL 
SKSGAAQMAV IGQLGQMGIP TFPTSWSYAP LDFVSDFLRD IKNVVLDIYR KPDLVKQSAD 
ALVEPLIESA RLSGAVPPEV KKALGTNVVE CFFPLHLTEY LNPKQYNEFY WPSLKKVLLE 
VINMGQTPYI LFEGRHDAHL ETLLDLPKGK IVAVFDKTDP RKVREVLDDH VVLVSGPPNS 
LLIGGTPQKV DDYMKSMLDD CKQGGMMIYP GADGGISGEA RPENVRAVLE AVKKYGTY