Gene Amuc_1586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1586
Symbol
ID	6273640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1907415
End bp	1909055
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	58%
IMG OID	642613646
Product	type II secretion system protein E
Protein accession	YP_001878187
Protein GI	187736075
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.562805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACTCCA ACGAATCATA TCTCATCGAA CTTCTTACGC AGGCCGGATA TCTGAATGAA 
GAAATTCTTC AGTACGCGCG CAGTCAAAAA TCTCCCACCC AGGACCTGGT CGATTTTCTG 
ATTCAGGCCG ATTATCTTAC GGAAGACGTC ATCGCTCAGG TGGCGGCGTC AAACTCCCTG 
CTCCCCGTCG TGGACCTGGG CTCCATGCAC ATCCCCCAGG AGGTGCGCGA ACTCATTACG 
CCGGAACTTG CCAGGCGCTT CCGGGCCATC CCCATTTCCG ACGACGGTTT TTCCATCAAC 
ATTGCTATTG ACGACCCCCT GAATCTGGAA ACCATGGACA GCCTGCCCCA GCTGATGGGG 
CGGGATGTGA TTTTCAGCGT CGCCACCCAC AGCGCGGTAG AAAGCCGGTT GAATGAATTT 
TACCGGGATC TGAGCGTTCC GGAAGAAACC GACGGGCTGG AAGGGGAGGA TGCTCCCATT 
ATCCGGCTGG TGCAGCAGAT GCTGACGGAC GCTTTCAAAA TGAGGGCTTC CGACATCCAC 
ATTGAGCCCA TGGAAAACAG GCTCCGCATC CGCTACCGCG TGGACGGCAA GCTGGTGGAA 
GTGGCCACGC ATCCCAAAAA ACTGCTCAGC CCCATCATCG CTCGCCTCAA GGTAATGAGT 
ACCACCATGA GCATTGCGGA AAAACGCATG CCCCAGGACG GGCGAATCCA GATGAGCATC 
GGCGGCAAGC AAATCGACCT CCGTGTTTCA TCCGTCCCCA GCAACCACGG GGAAAGCATC 
GTCATGCGTA TCCTGGACAA ATCCGCCCTG GTGCTGGGCC TTCCCCAGCT CGGATTTTTC 
TCGGATGATG AAGCTGTGTT CGACCGCCTC ATCACGCTGC CGGACGGCAT TATCCTGGTG 
ACGGGTCCTA CCGGTTCCGG TAAAACCACG ACCCTTTACG CGTGCCTGAA CCACATCAAC 
CGCCCGGATA AAAAAATCAT CACGGTGGAA GACCCTGTGG AATACGAACT CTCCGGCATC 
AACCAGGTAA TGGTAAAGGC GGATATCGGC ATGACCTTCG CCGCCGCCCT GCGCGCCATG 
CTCCGCCAGG CTCCCAACAT CATCATGATC GGGGAAATTC GAGACATGGA AACAGCCAGC 
ATCGCCATCA ACGCCTCCCT GACGGGGCAC CTCGTATTCT CCACCCTTCA CACCAATGAC 
GCTCCCAGCG CCGTGGCCCG TCTGGCGGAC ATCGGCATCA AACGCTTCCT GATCGCCTCC 
TCCGTCCGCG CCATCATGGC CCAGCGTCTT GTCCGCAAGC TGTGCGACCG CTGCAAGGTG 
GACGGCACTC TGACGGAAAA GCAGGCGCAT ACGCTGAACA TTGACATGTC CCGCCTTGCC 
CAGGGCCAAA TCAAGGCGCC CCACGGCTGC GACTTTTGCC GCGGCGGCGG ATTCAAGGGC 
CGGATGGGGC TGTTTGAGAT TTTCGAAATC GACGACGAGG TGCGCCGCAT GATTAACGAA 
AATCTGACTT CCCCCCAGCT GCGCCAGCGC GCCCGGGAAC TGGGCATGAG AACCTTGAGG 
GAAGACGGCG TACGCAAAGT GCTGGCCGGC CTTACTTCTC CGGAAGAAGT GCTGAACGTC 
ACCATGGGAG ACGCCAACTG A

Protein sequence

MYSNESYLIE LLTQAGYLNE EILQYARSQK SPTQDLVDFL IQADYLTEDV IAQVAASNSL 
LPVVDLGSMH IPQEVRELIT PELARRFRAI PISDDGFSIN IAIDDPLNLE TMDSLPQLMG 
RDVIFSVATH SAVESRLNEF YRDLSVPEET DGLEGEDAPI IRLVQQMLTD AFKMRASDIH 
IEPMENRLRI RYRVDGKLVE VATHPKKLLS PIIARLKVMS TTMSIAEKRM PQDGRIQMSI 
GGKQIDLRVS SVPSNHGESI VMRILDKSAL VLGLPQLGFF SDDEAVFDRL ITLPDGIILV 
TGPTGSGKTT TLYACLNHIN RPDKKIITVE DPVEYELSGI NQVMVKADIG MTFAAALRAM 
LRQAPNIIMI GEIRDMETAS IAINASLTGH LVFSTLHTND APSAVARLAD IGIKRFLIAS 
SVRAIMAQRL VRKLCDRCKV DGTLTEKQAH TLNIDMSRLA QGQIKAPHGC DFCRGGGFKG 
RMGLFEIFEI DDEVRRMINE NLTSPQLRQR ARELGMRTLR EDGVRKVLAG LTSPEEVLNV 
TMGDAN