Gene Amuc_0465 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0465
Symbol
ID	6274714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	551989
End bp	553032
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	58%
IMG OID	642612515
Product	Peptidase M23
Protein accession	YP_001877084
Protein GI	187734972
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.817942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGCA AATCCTTTCC TCTCCTGACC GGCATCCTCC TGTTTCTTTG GGGCATGCCA 
TTACTGATGG CGGATATTGT AGTGCGCTTC CCCACGGAAA ATACAGCCCT GCTGGACAAC 
CGCCCGCAGG ACTTTTACAT GTATGTAGAC CGCAATTTTG AAGGGAAGAA ATCCCAGCCG 
TGGGAAGCTG GAGCCTACGG CTTTACCCGG ACCCTCGTCA GAACCCAGGC AGGCCCCGTG 
GCCGTCAAAT TTCATGAGGG TATCGACATT AAACCTCTCA GGAGGGATGC TTCCGGCACG 
CCGCTGGACG ACGTGCACCC CGTAGCCGGA GGCACGGTAG TCCATGCCTC CGCCAACCCA 
ACCCATAGCA ATTACGGCCG CTATGTGGTC ATTGAGCACC AGCTGAAGGA CGGCCCGCTT 
TACAGCCTGT ATGCCCATCT GGCCTCCGTC TCCTGCAGGA AAGGCGACCG GGTAGGAACC 
GGAAACGTTA TTGGAAAGCT GGGATACTCC GGGGTGGGTT TGAACAAAAC GCGTGCTCAT 
GTGCATCTGG AACTCTGCCT CAAGCTACAA GATGACTTTG AAAACTGGTA TTCCAGTCTG 
AAACTGGGCA CTCCCAACCG CCACGGTTCC TATAACGGAC TCAATTTGGC CGGCTTTGAC 
CCGGCACCCG TCCTCCTGCA ATGCAAGGAC GGGGCGGAAT TTTCCCTCTC TCGCCATATC 
TCCTCCCTGC CGGTCCAATA CGTCGTGCGG GCTCCCTCTT CCGGCGAACT GCCCAGCCTT 
GTCAAACGCT ACCCCTTCCT CCTGAAGCCG GGGCCCTCCG ACCCCAAATC CTGGGAAATC 
AGTTTCACGG GAGAAGGAGT TCCCGTTTCC GTGACTCCTT CCAGCCAACC GTGCACGGAA 
CCCGTCGTCA TCCGGGCCGT TCCGCATCCT TTCTCCCAAC TGTACAGGAC CTGCAACCGC 
GTTTCCGGCT CCAGCAAGGA CCCTAAGCTT ACCGCCGCCG GCAAACGCTA CATCCGGCTC 
ATCTTCATGG GGCCTGAATC ATAA

Protein sequence

MHGKSFPLLT GILLFLWGMP LLMADIVVRF PTENTALLDN RPQDFYMYVD RNFEGKKSQP 
WEAGAYGFTR TLVRTQAGPV AVKFHEGIDI KPLRRDASGT PLDDVHPVAG GTVVHASANP 
THSNYGRYVV IEHQLKDGPL YSLYAHLASV SCRKGDRVGT GNVIGKLGYS GVGLNKTRAH 
VHLELCLKLQ DDFENWYSSL KLGTPNRHGS YNGLNLAGFD PAPVLLQCKD GAEFSLSRHI 
SSLPVQYVVR APSSGELPSL VKRYPFLLKP GPSDPKSWEI SFTGEGVPVS VTPSSQPCTE 
PVVIRAVPHP FSQLYRTCNR VSGSSKDPKL TAAGKRYIRL IFMGPES