Gene Amuc_0017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0017
Symbol
ID	6275223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	21561
End bp	23006
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	59%
IMG OID	642612057
Product	oxidoreductase domain protein
Protein accession	YP_001876645
Protein GI	187734533
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAATT CATCATCACG CCGTCGTTTC CTTCAGACCC TGGGCCTGGC CACTGGCGCC 
CTGGCTGCCG GTTCCTTTGC CAACGCCCAG GAAGTAGCCC CCCTGGCTCC CAAGAAAATC 
ACCATTCCGG ACCCGAATAA CATCGGCCCC ATGACCACGT GGCCCCCGCG CAAGCCCGGC 
GCCATCTACA TGGGCGGCTT CAGGGCTCCC AAGCTGGACA AGGTGCGTGT GGCCTTTGTC 
GGCGTGGGTG AACGCGGTTC CATGCACGTG GGCCAGATGG CCGTTATAGA AGGTGCGGAA 
ATTGTCGGCA TTTGCGACCT GTATGAAGAC TGGGCCAAGC GCAGTGCGGA CGTCGTGGAA 
AAGAAGACGG GCAAGCGCCC CCCCATTTTC ACGAAAGGAC CGGAAGACTA CAAGCGCATG 
ATGAAGGAAG TCAAGCCGGA CGCCGTCATC GTCTGCCCCA GCTGGGAATG GCACTGCCGT 
GTTACCTGCG ACGTGATGAA GATGGGCGCC CACGCCTTTG TGGAAGTGCC TATGGCCGTC 
TCCATCAAGG AACTCTGGGA AATCGTGGAT ACCTCCGAAG AAACCAGGAA GCACTGCATG 
ATGATGGAAA ACGTCAACTA CGGACGTGAG GAACTCATGT ACCTGAACAT GGTGCGCCAG 
GGCGTCATTG GCGACCTGCT GTACGGAGAA GCCGCCTACA TCCATGAACT GCGCGGACAG 
ATGAAGCAGG TGGAACGCGG CACCGGTTCC TGGAGAACCT ATCACTACGC CAAGCGCAAC 
GGCAACGTGT ATCCCACGCA CGGCCTCGGC CCCATTGCCC AGTACATGAA TCTGGCCCGC 
AAGGACGACT GCTTCGGCAG GCTCGTCTCC TTCTCCAGCC CGGCCCTGGG CCGCGCCGCG 
TATGCCAAGA AAAATTTCCC GGCGGACCAC AAGTGGAACA AGCTGGACTT TGCCTGCGGC 
GATATGAATA CCTCCATCAT CAAGACCACC ATGGGCCGCA CCGTCCTGGT GGAATGGGAT 
GAAACCAGTC CGCGCCCCTA CTCCCGCCTG AATCTCATCC AGGGCACCCT GGGCACCTTG 
GCCGGCTTCC CGACCCGCGT AGCCGGGGAA AAGCTGGGCA ACGGAAATTA TCATGAATGG 
ATTGAAGGCA AAGAAAAACT GGCCCCTATT TTTGAAAAGT ACGATCACCC GCTCTGGAAG 
AGAATCGGGC CGCTGGCCCT GAAGATGGGC GGTCACGGCG GCATGGACTT CGTGATGCTC 
TTCCGCATCA TCGAATGCCT CCGCAATGGC GAACCGATGG ACCAGAACGT TTATGAAGGA 
GCTTTCTGGT CCTCCGTCTC CGAGCTTTCC GAATACTCCG TGGCCCAGGG CGGCATGCCC 
CAGGTATTCC CGGACTTCAC CCGCGGAGAC TGGAAAACGA CTGCTCCGCT GGGCATCGTC 
CAGTAA

Protein sequence

MDNSSSRRRF LQTLGLATGA LAAGSFANAQ EVAPLAPKKI TIPDPNNIGP MTTWPPRKPG 
AIYMGGFRAP KLDKVRVAFV GVGERGSMHV GQMAVIEGAE IVGICDLYED WAKRSADVVE 
KKTGKRPPIF TKGPEDYKRM MKEVKPDAVI VCPSWEWHCR VTCDVMKMGA HAFVEVPMAV 
SIKELWEIVD TSEETRKHCM MMENVNYGRE ELMYLNMVRQ GVIGDLLYGE AAYIHELRGQ 
MKQVERGTGS WRTYHYAKRN GNVYPTHGLG PIAQYMNLAR KDDCFGRLVS FSSPALGRAA 
YAKKNFPADH KWNKLDFACG DMNTSIIKTT MGRTVLVEWD ETSPRPYSRL NLIQGTLGTL 
AGFPTRVAGE KLGNGNYHEW IEGKEKLAPI FEKYDHPLWK RIGPLALKMG GHGGMDFVML 
FRIIECLRNG EPMDQNVYEG AFWSSVSELS EYSVAQGGMP QVFPDFTRGD WKTTAPLGIV 
Q