Gene Mboo_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_2035
Symbol
ID	5411162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	2110660
End bp	2111634
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	62%
IMG OID	640869277
Product	putative agmatinase
Protein accession	YP_001405192
Protein GI	154151574
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.108559
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.06349
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAACG ACCTGGAGAA GATGGCGGCG CAGTGCAGGA CTTTTACCAA AGAGATGGTG 
GACAACCCGT ACCGGGGGCT TGCCACGTTC TTTGGCCTGC CGTACACCGA ATCGCTCGAC 
AACCTCGACA TTGCGCTCAT CGGGGTTCCC ATAGATCTGG GAGTCACCGA CCGGAGCGGA 
ACCCGGATGG GCCCGAGGGC ATTGCGCAAC GAGTCCCGGG GCGTCGGAGC CTACAACCAC 
TGCACCCGTT CGACCCCCTG CACGGCACAC CGGATCGCTG ATGTCGGAGA CGTGCCCTTC 
CGTTCGGTGT ACCGGATCGA AGAAGCGCTG GACGATATCT CCGCGTACTA CCGCGGGATT 
GCGGCAGCCG GAGTCACCCC CGTGACCGCG GGAGGGGATC ACTCGATCAC CTTCCCGATC 
TTACAGGGCC TTGCCCCAAA AGAGAAGGTC TGCCTGGTCC ACTTCGATTC CCACTGCGAC 
ACCGCCCCAC CGATCCATGG CTGCGGGTAC ACCCACGGTT CCCCGATGAA AAACACGGTG 
GAGGCAGGGC TTGTGGACGC TGAACACTCC CTCCAGATCG GGATACGGGG CTCAAGCGAA 
CCACTCTGGG AATTCTCCTC TGCAAGCGGT ATGCGGGTGA TCCACATCGA GGAGTTCTAC 
GAGATGGGCT GGAAAGGCGC AGTAAAAGAG ATCCACGACC TTGTCGGTGA CAGCCCGGTG 
TACCTCTCTT TTGATATCGA CTGCCTTGAC CCGGCCTTTG CCCCGGGCAC TGGGACACCG 
GTCGCCGGCG GCATGTCCAC GTTTGAAGCG CTCCAGATGG TGAGGGGAAT GCAGGGCCTG 
GATGTCATCG GCGGCGACCT CGTGGAGGTC TCCCCACCCT ACGATCATGC GGGTATCACC 
GCCCTTGCCG GGGCGACCCT CCTCTTTGAG ATTCTCTGCC GTGCGGCCGA GGCACGGGAA 
CGCCGGGGGG CCTGA

Protein sequence

MDNDLEKMAA QCRTFTKEMV DNPYRGLATF FGLPYTESLD NLDIALIGVP IDLGVTDRSG 
TRMGPRALRN ESRGVGAYNH CTRSTPCTAH RIADVGDVPF RSVYRIEEAL DDISAYYRGI 
AAAGVTPVTA GGDHSITFPI LQGLAPKEKV CLVHFDSHCD TAPPIHGCGY THGSPMKNTV 
EAGLVDAEHS LQIGIRGSSE PLWEFSSASG MRVIHIEEFY EMGWKGAVKE IHDLVGDSPV 
YLSFDIDCLD PAFAPGTGTP VAGGMSTFEA LQMVRGMQGL DVIGGDLVEV SPPYDHAGIT 
ALAGATLLFE ILCRAAEARE RRGA