Gene Amuc_1106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1106
Symbol
ID	6273995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1321347
End bp	1322630
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	55%
IMG OID	642613157
Product	peptidase M24
Protein accession	YP_001877713
Protein GI	187735601
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATACG AGCCGCTTCC TTCTTCCTTT TTTGCCGGCA ACCGTGAAGA ACTTGCTTCC 
CGCCTGCCTG CCGGCAGTAT GCTGATTCTG CACGCCAACG ACGTATTTCC TACGAATGCG 
GACGGCACTT TTGCCCTGCA TCAGAATGCC AACCTCTTTT ATCTTACGGG AGTTGACCAG 
GAAGAAACCG TCCTGGTCAT GACCATCCGG GAGGACGGCT GGGATGAGAT CCTGCTGTTG 
CGTGAGACAA ATGAACAGAT TGCCATCTGG GAAGGCGCCC GGCTCTCGCA GGAACAGGCG 
AGAGAGCTGA GCGGCATCCA GGACGTGCGC TGGACCGATG AATATGATGC GCTGCTGGAG 
GCCCTGGTGC CGTCCGCATC CATGGTCTTT GTGGAAGCCA ACCAGCATCC GCGATGCACA 
TGCCCGGTGG AAACGCGCAA TGCCCGCATG ACCAAGGAGC TGAAGGAAAA ATTCCCGGAC 
GCTGTTTTGA AGAATGTCTA TGAAATCTTG GCGGACATGC GGCAAATCAA AAAGCCGGAA 
GAAATCAAGG CTCTCAAAAA AGCCTGCGAC ATCACCAATG AAGGCTTCCG GGAATTGCTC 
CGGTTCATCA GGCCGGGGGT GGGCGAATGG CAGATTGAGG GATTCCTGGC CAACGAATTC 
ATCAGCCGCG GTCCGCGCAA ATTCTCCTTC CTACCCATCA TCGCTTCCGG AAAGGATACC 
TGTGTGCTGC ATTATATCCA AAACGACAAA CGGTGCGAAG ACGGCGATCT GGTGCTTATG 
GACATAGGCA CGGAATACGG GAATTACAAC TCCGACATGA CCCGCACCGT TCCCGTGAAC 
GGAAAATTCA CTCCCCGCCA GCGCGCTGTG TATGAAAGCG TGCTGAATAT GATGACCTAC 
GCCAAAAAGA TTCTGAAACC CGGAATCCTG AAATCGGAGT ACGAACGCCT GGTGCGCGTT 
TTTGCCGCCG GGGAACTCGT CAAGCTGGGG CTGATCACAC CCGCGCAGGT GGCGGAAAAA 
CCGTCCGATC CTCCCATTGT CCGGAAATAT TACATGCACG GGTGTTCCCA CTTCCTGGGG 
CTGGATGTGC ACGATGTGGG CGAAGCCAAC CCCGTTGTGT TGCCGGGCAT GGTTTTCACC 
GTGGAACCGG GCATCTATAT TGCGGAAGAA GGCATAGGCA TCCGTTTGGA AAACGACGTC 
CTGATCGGGG AAACAGAAAA CATCGACCTG TTGGGAGACG TGCCTTTGCT GCCTGATGAC 
ATTGAACGGC TCATGGCCCG GTAA

Protein sequence

MRYEPLPSSF FAGNREELAS RLPAGSMLIL HANDVFPTNA DGTFALHQNA NLFYLTGVDQ 
EETVLVMTIR EDGWDEILLL RETNEQIAIW EGARLSQEQA RELSGIQDVR WTDEYDALLE 
ALVPSASMVF VEANQHPRCT CPVETRNARM TKELKEKFPD AVLKNVYEIL ADMRQIKKPE 
EIKALKKACD ITNEGFRELL RFIRPGVGEW QIEGFLANEF ISRGPRKFSF LPIIASGKDT 
CVLHYIQNDK RCEDGDLVLM DIGTEYGNYN SDMTRTVPVN GKFTPRQRAV YESVLNMMTY 
AKKILKPGIL KSEYERLVRV FAAGELVKLG LITPAQVAEK PSDPPIVRKY YMHGCSHFLG 
LDVHDVGEAN PVVLPGMVFT VEPGIYIAEE GIGIRLENDV LIGETENIDL LGDVPLLPDD 
IERLMAR