Gene Amuc_0117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0117
Symbol
ID	6274920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	144848
End bp	145903
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	60%
IMG OID	642612162
Product	Agmatine deiminase
Protein accession	YP_001876743
Protein GI	187734631
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2957] Peptidylarginine deiminase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGG AACCCGATGT ACGCTGGCCC GCTGAATGGG AGCCTCAGGA TGCTGTCTGG 
CTGTCCTGGC CCCACCGCAG GGATTTATGG CAAGGGGGGC TGGACGAGTT GCAGCAGACT 
TATGGGAGCG TGGCCGCTGC CATTGCTCCG CATGCCCTTG TATGCGTGAA TGCCGCAGCT 
CCCCTTCATC CCGGCGTCAG GCAGGCGATG CTGGCCTCCG GAATGAGTGA GGAGCAATTC 
CGCCTGTTCA ACCACCCGAC CAACGACGTA TGGTGCCGGG ACCACGGCCC CGTTTTCGTC 
CAGGATGTGA AGGACGGTTC CCTGATGCTG GCGGATTGGC AATTTAATGC GTGGGGCGGC 
AAATTTGCCC CGTGGGACCT GGACAACGGC GTTCCCGCCC TGATTGGGGC GGCGCTGGGG 
CTTCCCGTGC GCAGTTCTTC CCTGATTCTG GAAGGGGGGG CGATTGAGGG CAATGGGGAC 
GGCTTGCTGG TGACGACGGA GTCCGTGCTG CTGAATCCCA ACCGCAATCC GGATTGGAGC 
CGGGCCATGA TTGAGGAGGA ATTGAAGCGC ATGCTGGGCG TCAGAGCCGT TTTCTGGCTC 
GGTTCCGGCA TTGAAGGGGA TGATACGGAC GGCCATATTG ACGACATGGT GCGTTTTGTG 
TGCCGGGATG CCGTAGTCTC CATCGTGGAA ACGGATTCTT CCTCTCCCCA TTACCGCGCT 
CTGGCGGAGA ATAATGAACG CCTTCAGGAT TTGAGATGCG TGGACGGTTC CGGGGTGGAG 
GTGATTCCCC TGCCGATGCC GGATCCCCTC CATGCGGAGG ACTGGCGCCT GGATCAGCTC 
CCTGCCAGTT ACGCCAATTT CCTCATTGTT AATGAGGCCG TCATTGTTCC CGTATTCAAC 
CAGCCCCGGA ATGACGATCG CGCCCTGGGC ATTTTGCGTG AATGTTTCAG CGGAAAACAG 
GTAATAGGGG TGGATGCCCG CAAGCTGGTG CTGGAAGGCG GCGCCATCCA CTGCATCACC 
CAGCAGCAGC CTCGGCCGGG GAAGGAGGGA CTGTGA

Protein sequence

MNKEPDVRWP AEWEPQDAVW LSWPHRRDLW QGGLDELQQT YGSVAAAIAP HALVCVNAAA 
PLHPGVRQAM LASGMSEEQF RLFNHPTNDV WCRDHGPVFV QDVKDGSLML ADWQFNAWGG 
KFAPWDLDNG VPALIGAALG LPVRSSSLIL EGGAIEGNGD GLLVTTESVL LNPNRNPDWS 
RAMIEEELKR MLGVRAVFWL GSGIEGDDTD GHIDDMVRFV CRDAVVSIVE TDSSSPHYRA 
LAENNERLQD LRCVDGSGVE VIPLPMPDPL HAEDWRLDQL PASYANFLIV NEAVIVPVFN 
QPRNDDRALG ILRECFSGKQ VIGVDARKLV LEGGAIHCIT QQQPRPGKEG L