Gene Amuc_1858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1858
Symbol
ID	6275469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2259751
End bp	2261733
Gene Length	1983 bp
Protein Length	660 aa
Translation table	11
GC content	37%
IMG OID	642613919
Product	hypothetical protein
Protein accession	YP_001878453
Protein GI	187736341
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.153141
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.576375
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACAAA GGTCTTATTA TTTCAATGAC CTACAGTCTT TTTGTACCCA AACTCTAGAA 
GAAATTTTAG GGCAGATTGC TCTTCATACC CCATTTTCTT TAGATCAAAA TTCACGTAAT 
TCTTTTGTTC ACGAAATTAG ATTACTCCAA AGTGTTCTTA AAAGTATTCC CTCTGGATCC 
ATAGCCCTTG AATACACTAT TCCTCGCATC GGAGAGCGAA TAGATGTCGT AATCGCTTGT 
GCTGGTATTC TCTATATTCT TGAATTTAAA GTAGGAGAAT CATCTTATCC AAGACATGCT 
ATTGATCAAG TGGTAGATTA TGCACTAGCA TTAAAATATT TCCATCAAGA AAGTTATCAA 
AAGAAAATTG TTCCTCTGGT AGTCTGCACT CATGCTCCTT CTAAAGAGTT TCAACTTATA 
ATGAACCCAG ATGGGGTTTA TCTTCCTATC CTTTGCAATG ATAATACCTT AGGTCCTAAT 
TTAACAAAAC TTACTAACAA TCTGTGTGAT GACGAATTCC ATTTTAAACA ATGGTTAATT 
TCGCCATACA TGCCTACTCC CACGATCATT GAAGCAGCTC AAGCACTCTA CCGTGGACAT 
GGAGTCAAAG AAATTTCACG GAGTAGTGCC GGAGCCTACA ATCTTAGTCT CACAACAAAG 
GTACTAAATC GTATTATTGA ACAAAGTAAA CAGTATCATC AAAAATCTAT TTGTTTTGTT 
ACTGGCGTAC CTGGTGCCGG AAAAACGCTA GTAGGCCTCA ATATTGCAAA TGAGCGACAT 
CAATATGATA AACAAGAACA TGCAGTTTTT CTTTCCGGTA ATGGTCCCTT GGTTGCTGTC 
CTGCGAGAAG CTCTAGTACG AGATGAAATT AAACGCTGTA AAGGCAAAAT AACAAAAATA 
ACATCTAAAA GAAAAGTTGC TGCCTTTATT CAAAATATCC ATCATTTTCG TGATACTTAT 
CTACCTCCTT CCGAACAAGT TCCTGCGGAA AAAGTAACTA TTTTTGACGA AGCACAACGT 
GCTTGGACAA AAGAGCAAAC GGCTAAATTT ATGTTAAAAC GCCATGTTCC CTCCTGGAAC 
ATGTCTGAAC CAGAATTCCT CATTAGTGTA ATGGATCGCC ATCAAGATTG GGCTGTAATC 
ATTTGTCTAA TTGGAGGTGG TCAAGAAATA CATACTGGAG AAGCTGGCCT TTTAGCTTGG 
TTTGATGCAC TAAGAAACCA TTTCCCTCAT TGGAATGTTT ATGTGTCCCC CCAAATCTCT 
GATGTAGAAT ATACGCAAGG AAAAACACTT GAATCTCTCT TTATGGGATT ACATCTTTAT 
CAGGAAAAAA AACTTCATCT TTCTGTCTCA CTTCGTTCTT TTCGGAATGA AAAAGTTTCA 
GCATTTGTAA AATCTCTATT GGATGAAAAC TTACCAATAG CTCAACAACT CTATTCAGAA 
CTCTCACTTA ATTATCCTAT TGTCATTACA CGTAGCCTAG AAAAAGCTAA ACAATGGGTA 
CAAAATCAAT CCCGAGGTAC AGAACGTTAT GGACTCATTT CTAGTTCAGG AGCCAAACGT 
CTACGCCAAT TTGGTATTTG GGTACAGAAC GATATTCAGG CAGAAAATTG GTTTTTAAAC 
GATAAAGAGG ATGTACGCTC TTCCTATTTT CTAGAAGAAA CAGCAACTGA ATTTGATATT 
CAGGGTCTTG AAATTGATTG GGCAATCGTT GCATGGGATG CAGACTTTCG TATAGAAAAA 
GGACATTTTA AAGCTTATAA TTTTAAGGGG TCTAGTTGGA AAATAGTTCG TAAGAAAGAT 
GCACAACTCT ATCTCAAAAA TACTTACCGT GTTTTATTAA CACGAGCACG CCAAGGGTTC 
GTTATTTTTA TTCCAAAAGG ATGTGACGAG GATTTGACTC GTCACTCCTC CTTCTATGAT 
GGTATTTATT ATTACCTAAA AGAAATAGGT ATCAAGGAGC TATGCCTTTC TGAAGAACAA 
TAG

Protein sequence

MIQRSYYFND LQSFCTQTLE EILGQIALHT PFSLDQNSRN SFVHEIRLLQ SVLKSIPSGS 
IALEYTIPRI GERIDVVIAC AGILYILEFK VGESSYPRHA IDQVVDYALA LKYFHQESYQ 
KKIVPLVVCT HAPSKEFQLI MNPDGVYLPI LCNDNTLGPN LTKLTNNLCD DEFHFKQWLI 
SPYMPTPTII EAAQALYRGH GVKEISRSSA GAYNLSLTTK VLNRIIEQSK QYHQKSICFV 
TGVPGAGKTL VGLNIANERH QYDKQEHAVF LSGNGPLVAV LREALVRDEI KRCKGKITKI 
TSKRKVAAFI QNIHHFRDTY LPPSEQVPAE KVTIFDEAQR AWTKEQTAKF MLKRHVPSWN 
MSEPEFLISV MDRHQDWAVI ICLIGGGQEI HTGEAGLLAW FDALRNHFPH WNVYVSPQIS 
DVEYTQGKTL ESLFMGLHLY QEKKLHLSVS LRSFRNEKVS AFVKSLLDEN LPIAQQLYSE 
LSLNYPIVIT RSLEKAKQWV QNQSRGTERY GLISSSGAKR LRQFGIWVQN DIQAENWFLN 
DKEDVRSSYF LEETATEFDI QGLEIDWAIV AWDADFRIEK GHFKAYNFKG SSWKIVRKKD 
AQLYLKNTYR VLLTRARQGF VIFIPKGCDE DLTRHSSFYD GIYYYLKEIG IKELCLSEEQ