Gene Amuc_1585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1585
Symbol
ID	6273643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1905728
End bp	1907386
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	57%
IMG OID	642613645
Product	type II secretion system protein E
Protein accession	YP_001878186
Protein GI	187736074
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02533] general secretory pathway protein E

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.834386
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACCA ACCTCACACT GGAACTTTTC ATCGGCCGGG GAATGATTGA CAAATCCCTG 
GCAAAGGACA TCAAGGAGGA AATGATCGCC TCCGGCAAGG AGCTGCCGGA AGTGCTTGCA 
GACTTCGGCA TCATCGGCAG CAAGGATGAT ATCTGGCAGA TGATTGCCAG CGACCTGGGT 
ACGGAATTCA TTACACTGGA CAACTTCCAG CCGGATCCGA ACGTGCAGAA CATGATGCCG 
GCCACGCTCG TGCGCCTGCA CGGGGCGCTC CCTGTGCGGC ATGGTCCGGA AGGCCTGTAC 
GTCTGCCTGG TGGATCCCCT GAATCCCCAG ACGGTGGAAG ACCTGCGCTT CGCCCTCGGC 
CAGGACATCC ATGTTCTGGT AGCGCCGGAT TACCAGATTT CCGAACGCAT CAATGAGCTT 
TATGGAGGCG AATCCGCCGC CATGTCCGAC CTGATGCAGG AGCTGAACAA CATGCAGGTC 
AACAATGAGA CGGAGGACTC CGCCGCCGCT CCCGTCATCC GCTTTGTGGA CCTCGTCATT 
ACGCAGGCCA TCAAGGAAAA GGCCTCCGAC ATTCACTTCG AACCTTTTGA GAAGGAATTC 
AAAATCCGCT ACCGTGTGGA CGGCGCCCTG TATGAAATGC AGCCTCCCCC CGTCCACCTG 
TCCGTGCCGG TCATTTCCCG CGTCAAAGTC ATGGCGAACA TGAACATCGC GGAACGCCGC 
ATTCCGCAGG ACGGACGCAT CGTCAAGCAG ATAGGAAACC GTTCCGTGGA CATGCGCGTT 
TCCTCCCTTC CCACTCAGTA CGGAGAATCC GTGGTGCTCC GCGTTCTGGA CCGCTCTTCC 
GTCAACTTGA ACATGGACAA CCTGGGGCTT CCCGCGCATA TCCACGAATA TATTCTGGAT 
ACGGTCCACA AGCCCAACGG CATTTTCATC GTTACCGGCC CCACCGGCGC CGGCAAGACA 
ACTACGCTGT ATGCCGCCCT GCGTGAAATC AATACCATTG ATTCCAAGGT GCTGACGGCG 
GAAGACCCTG TTGAATACGA TATTGACGGC ATCATCCAGA TTCCTATCAA TGAAGCCATC 
GGCCTGGACT TCCCAATGGT GCTCCGCGCC TTCCTGCGAC AGGACCCGGA CCGTATTCTG 
GTGGGGGAAA TGCGAGACAT GGCAACAGCG CAGATCGCCA TCCAGGCATC CCTGACGGGT 
CACCTGGTTC TCTCCACCCT GCACACGAAC GACTCCGCCG GAGCCATTAC GCGACTGGTG 
GACATGGGAT GCGAACCTTT CCTGGTGGCG GCTTCCCTGG AAGGGGTGCT TGCACAGCGC 
CTGGTGCGCA CCATCTGTCC GGACTGCCGC ACGCCGTATG AACCCTCATC CACCATCCTC 
TCCCAGCTTG GCGTCTCTCC CTATGAACTG GGAGACAAGC ACTTTTTCAC GGGCCGAGGC 
TGTGATAAAT GCTCCAATTC CGGCTACAGG GGCCGCAAGG GGATTTATGA GCTCCTGGAT 
ATTAACGATA CCCTGCGCGA CATGATTACG GATCGCGCTC CTTCCGTGGT GCTGAAGCAG 
AAAGCCATTG AAATGGGCAT GTCCACGCTG CGGGAAGACG GGCTGAGAAA TATTTATGAC 
GGCAACACCA CCATTGAAGA AGTGCTGAAA TATACTTAA

Protein sequence

MDTNLTLELF IGRGMIDKSL AKDIKEEMIA SGKELPEVLA DFGIIGSKDD IWQMIASDLG 
TEFITLDNFQ PDPNVQNMMP ATLVRLHGAL PVRHGPEGLY VCLVDPLNPQ TVEDLRFALG 
QDIHVLVAPD YQISERINEL YGGESAAMSD LMQELNNMQV NNETEDSAAA PVIRFVDLVI 
TQAIKEKASD IHFEPFEKEF KIRYRVDGAL YEMQPPPVHL SVPVISRVKV MANMNIAERR 
IPQDGRIVKQ IGNRSVDMRV SSLPTQYGES VVLRVLDRSS VNLNMDNLGL PAHIHEYILD 
TVHKPNGIFI VTGPTGAGKT TTLYAALREI NTIDSKVLTA EDPVEYDIDG IIQIPINEAI 
GLDFPMVLRA FLRQDPDRIL VGEMRDMATA QIAIQASLTG HLVLSTLHTN DSAGAITRLV 
DMGCEPFLVA ASLEGVLAQR LVRTICPDCR TPYEPSSTIL SQLGVSPYEL GDKHFFTGRG 
CDKCSNSGYR GRKGIYELLD INDTLRDMIT DRAPSVVLKQ KAIEMGMSTL REDGLRNIYD 
GNTTIEEVLK YT