Gene Amuc_2151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2151
Symbol
ID	6275471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2619364
End bp	2620386
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	59%
IMG OID	642614212
Product	protein of unknown function DUF185
Protein accession	YP_001878740
Protein GI	187736628
COG category	[S] Function unknown
COG ID	[COG1565] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.510759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.0912925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACGCC TTTCAGACCA CATCGCGGCC GCTGGCGGCT GGCTCTCCCT GGAAGCTTTC 
ATGCAGCTGG CCCTGCACCA CCCGCAGGAA GGGTACTACT CCTCTTCCAT TGAAAACATC 
GGTCAACGCG GGGATTTTTC CACCACCCCC ACGCTTTCCC CCATCCTCGC AAAAGCCATT 
GTCGCGCACT GGAAAGAAGC CTGCTCCCGC TGCGGCAGGC GGCTGCCTCT GCTGGAAATA 
GGCGCCGGCT CCGGTGCCCT GGCCGTTAAA ATCCTGGAGC AGCTGGGATT CTGGAACCGC 
CTGAATACGG ATTACGTGAT TGTGGAATCT TCCCCACGTC TGCGCGAATT CCAGCACCTT 
CTGCTGGGAG GCCGCGCTAA AATTTACTCC ACCATGGAAA AAGCGCTGAA ACACTGCGGA 
GGCAAGGCCT TTATTTTCTC CAACGAGCTG GTGGATGCCT TCCCGGCGCG CGTATTTGAA 
TACACGGAAC AGGACTGGAA AGAAGTGGGG CTTGTCGTGA AAAACGGAGC CGTCCGGGAA 
GAACTGCGCC CCGTCCGGCA GCAGCCGCTT TTCTCCCATA TGCTGGAATA CGGCTCCCAG 
CCGGGGCAGC GGGTGGAAAT TCACGACTCC TACGCGCGCT GGTTTACGAG CTGGCTTCCC 
CTCTGGAACA TGGGCGTCAT GACGGTCATC GACTACGGGG ATGAAATGGA GCGGCTGTAC 
TATCGCCGCC CCCGGGGTTC CCTGCGCGGG TACAAAAGCC ACCAGGTGCT GACGGGGGAG 
GAACTGTACC GTAACCCCGG CCTCACGGAT TTGACCTGTG ACGTCAATTT TACGGACCTG 
CTGGAACTAT CCCGCAACTG TCTGGGAGAC CGGGTCACTT TCATGACCCA GCGGGACTAC 
CTGCTCCCCC ATGCGGAAAA CACGCCGCAG GATGCCTTTC TAACGGATGA ATACGGTGCC 
GGAGAACACT TCCACGTACT CATTCAGGAA CGCCAGCGGC TGCAACCGGA AGGCACCCAG 
TAA

Protein sequence

MIRLSDHIAA AGGWLSLEAF MQLALHHPQE GYYSSSIENI GQRGDFSTTP TLSPILAKAI 
VAHWKEACSR CGRRLPLLEI GAGSGALAVK ILEQLGFWNR LNTDYVIVES SPRLREFQHL 
LLGGRAKIYS TMEKALKHCG GKAFIFSNEL VDAFPARVFE YTEQDWKEVG LVVKNGAVRE 
ELRPVRQQPL FSHMLEYGSQ PGQRVEIHDS YARWFTSWLP LWNMGVMTVI DYGDEMERLY 
YRRPRGSLRG YKSHQVLTGE ELYRNPGLTD LTCDVNFTDL LELSRNCLGD RVTFMTQRDY 
LLPHAENTPQ DAFLTDEYGA GEHFHVLIQE RQRLQPEGTQ