Gene Amuc_0005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0005
Symbol
ID	6275245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	5246
End bp	6817
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	57%
IMG OID	642612045
Product	hypothetical protein
Protein accession	YP_001876633
Protein GI	187734521
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.206267
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	82
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAA CACCAGACAC CCCCGCCGCG GCCGCAGAAG CCTCCCAGCC CGCCGCCCGC 
AAGGTCAAAC GCCCCTGGAT GACCTGGATC AAGCTTTTCC TGCTGTTCCT TATCGTCGTA 
TGCCTGAATT ACGTAGGCTG CCACGAGTAT TACCGCCGGG ACCTGACGGA AGACCAGCGT 
TATGAAATTT CCCGTCAGAG CATCAACATG CTCCAGTCCC CGGAAATCCA GAAGCGCAAA 
ACCCCCGTCA AAATCACGTT CGCTTTCCTG CGCACCACGC AGAACTACAC CCGCATGCGT 
TCTCTGCTTG AGGAGTACGA ACGTTATTCC AACGGCAAGG TGAAGGTGGA GTATGTGGAT 
CCCCTCCGCC AGCCGAACAA GGCCCGTGAA ATCTCCAATA TCTACGGAAT TGAATTCAAG 
AAGAACCTGG TCATCATTGA TGCCCGGGAG GATACGGAAA AAGCGCTCAA GACGTTTGAA 
GGCACCCAGG CGGACGCCGC CCACGTGCGC ATCCTGCCCG GAGACGCCTT CGTAGTATAC 
GCACCCGGGC CGGACGGCAA AAGCATGAAG GCAGTGGCGC TCCAGATTGA AGACATGATG 
ACTGCCGGCA TTTACGGAGC GGCCAACGGC GAACCTCGTA AAATTTATAT CGCGGCGGAT 
AAGAGCAACT TCAACGAGTC CCTGAGCAAC AACCAGGAAG AAAGCATTTT CACGACGCTG 
GGCAAAATCT GCCGTTCCGT CAACCTGCAG CTTGTTCCCA TCCGCATGAG CGGTCTGGAA 
GAAATTCCGG AAGACGCCGC AGGATTCATG ATTATCGGTT CCAAATATGA TCTGTCCCCG 
CAGGAGGCGG AAGTGCTCCA GTGGTACTGG GCGCGCCCGA ACGCCGCCAT TCTAATCATG 
CTGGAACCCC AGAATGACAC ACCCAAACAG CTTTACCGCT TTCTCCGCGA ACAGGGGCTA 
CGGCCCCAGA ATGACCGCGT GATGCTCCGC AACAGGGGCA ACCGTTCCGT TTTTGAAATT 
AACTCCATTT TCGCCCCCTC CCTGAATTGC ACCCGTGAAT TCTGGAATTC CAGCACCGGA 
CTGGAAGGGG AGAGCATCTC CCTCATTCTG GATTCCGACA ATGCGGCCAT GGAACAGAAG 
CGCATTACGC CATACCCCCT CCTGGTCACA ACGGAGGATT ATTACGGAGA AACCAAATAC 
AACCAGTTCC CTGCCCAGTT CGACGCAAGG GAAGACAATC CGGGCCCTCT GATGATCGGC 
GCGGCCCTCA TCCGGGGGAA TGCCGGGGAC GTGAACCAGA ACAAGACTAC CGGGCGCCTG 
GTTCTGCTTG GCAATACGGA CCTGCTCCAG CCCCGGCAAA TCAAACCGGA ACAGAGGGAT 
TTCATGCGTA CGCTGATCGG CTGGATGACG GACCGTGAAG AATTGCGTGG CCTCGGCTCC 
CGCCATGACC TGACCGTCAA GCTGAATCTG GATCGCAACG CCCTGGGCGT TTTGGAACTC 
CTGACGAATA TCGGACTCCC CCTGCTGGCG CTGCTGATCG CCCTGATTAT CTGGAACACG 
CGCCGTCATT AA

Protein sequence

MSETPDTPAA AAEASQPAAR KVKRPWMTWI KLFLLFLIVV CLNYVGCHEY YRRDLTEDQR 
YEISRQSINM LQSPEIQKRK TPVKITFAFL RTTQNYTRMR SLLEEYERYS NGKVKVEYVD 
PLRQPNKARE ISNIYGIEFK KNLVIIDARE DTEKALKTFE GTQADAAHVR ILPGDAFVVY 
APGPDGKSMK AVALQIEDMM TAGIYGAANG EPRKIYIAAD KSNFNESLSN NQEESIFTTL 
GKICRSVNLQ LVPIRMSGLE EIPEDAAGFM IIGSKYDLSP QEAEVLQWYW ARPNAAILIM 
LEPQNDTPKQ LYRFLREQGL RPQNDRVMLR NRGNRSVFEI NSIFAPSLNC TREFWNSSTG 
LEGESISLIL DSDNAAMEQK RITPYPLLVT TEDYYGETKY NQFPAQFDAR EDNPGPLMIG 
AALIRGNAGD VNQNKTTGRL VLLGNTDLLQ PRQIKPEQRD FMRTLIGWMT DREELRGLGS 
RHDLTVKLNL DRNALGVLEL LTNIGLPLLA LLIALIIWNT RRH