Gene Amuc_0418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0418
Symbol
ID	6274836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	498523
End bp	499581
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	58%
IMG OID	642612468
Product	Ankyrin
Protein accession	YP_001877037
Protein GI	187734925
COG category	[R] General function prediction only
COG ID	[COG0666] FOG: Ankyrin repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACAAA TGACAGGAAC CATGCTGCTT CTGTCCTCAG CAGTCGTTAT GGCCGCTCCC 
TGGGCGCATG CGGAGGAAAA GACAATCCAG CTCACGGAAG CGGAACAACA GGAAATCAAG 
ACGGCAAACG AAAAGCTGCT GGGCCTTACC CTCCGTTTCC TGCATGACTC ATGGCCGCTG 
GAAATCATGT TTCCCGGAGA AGTGCAGGAG GAATTCCACT CCATTCTTCA ATGCCATCAG 
ATGCTGGAGC AATTCCGCCA AACCGGCAAC CTCCTGCTCC AGACGCCGGA CCGTACCACG 
CCTCTGCACC TCTGCATTGC CCTGGGATTA AACCGGCTGG CCGTCCGGAT GGTAGAAGCG 
GGCGCTCCCG TCAATGCTCA ATCCATTTTC ATGCATGACG GCACAAAAGA GCCGGGAGAC 
ACCCCCCTTA CCTGGGCGTG CCTCTCAGGC CTTTATATGA ATTCCACCGC GGAAGAAAGG 
CTGCCGCTGG TGCACGCCCT GCTCAAACAC GGCGCCGAGC CGGATCAGCC GGGGCCTTGG 
GGCGTCACCC CGTTCATGTA TTCCGCCGCC CTCAATGACT CCGATCCGGG TCAGGAAAAA 
ATAGCGCTGG CGCTCCTGGA CGCCGGCTCC CCGGATCTCA AGCGCAGAAT GAACGCTCAG 
GCGCGCGGAG TCGGCTTCCT CAGTCTGTCC CCCGCCATTT ACGAACGGCT CATCAAAGCC 
GGCTGCGATG TTAACGAACG CTTTTTTGAA AGCAAGCAAT CACCCCTCCA CCTGGTCTGC 
ACCAAGGAAA AACCGGCGGA ACGCCTCATT CCTCTCATTG AACTTCTCAT CAACGCGGGA 
GCGGATCCCA ACCAGCCGGA CGTGGATGGC CTGACTCCGC TGATGGCCTG CAACTCTCCG 
GAAATAGCCG TTTGCCTCAT GAATCACGGC GCCAATCCCT CTCTCCGCAA CGATGACGGC 
CAGACAGCCT ATGACTTCCA TATGAAAAAC GGGTATCCCC CCATTGCGGA AGCCATCAAG 
CACTGGCAGT CCAAGCAGAA AAAAGGGGAA ACCCGCTAA

Protein sequence

MRQMTGTMLL LSSAVVMAAP WAHAEEKTIQ LTEAEQQEIK TANEKLLGLT LRFLHDSWPL 
EIMFPGEVQE EFHSILQCHQ MLEQFRQTGN LLLQTPDRTT PLHLCIALGL NRLAVRMVEA 
GAPVNAQSIF MHDGTKEPGD TPLTWACLSG LYMNSTAEER LPLVHALLKH GAEPDQPGPW 
GVTPFMYSAA LNDSDPGQEK IALALLDAGS PDLKRRMNAQ ARGVGFLSLS PAIYERLIKA 
GCDVNERFFE SKQSPLHLVC TKEKPAERLI PLIELLINAG ADPNQPDVDG LTPLMACNSP 
EIAVCLMNHG ANPSLRNDDG QTAYDFHMKN GYPPIAEAIK HWQSKQKKGE TR