Gene Amuc_1584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1584
Symbol
ID	6273650
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1904390
End bp	1905658
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	57%
IMG OID	642613644
Product	type II secretion system protein
Protein accession	YP_001878185
Protein GI	187736073
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID	[TIGR02120] general secretion pathway protein F

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.738971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAAAT ATCAATACAC AGCACTTGAC CATAAAGGCG ACCAGAAAAC AGGTACCCTG 
GAGGCCAATT CCGAAGCGGA GGCCATGGAA TCCATCCGGG CGCATGGCCT GTACCCCACC 
CAGATCGTAG AAGCGGGCAA GGGCAAGATT CAGCAGACGC CTGCCGCCAA GAAAAAGGCC 
AAGGGAGCCA AGAAGCAAAA AGGCAAGCTG GGAGGCAAAA TCAAGGCCAA GGCTCTGATG 
ATTTTCACCC GCCAGCTTGC TACGCTGATT GACGCGGGGC TTCCCCTGCT CCAGAGTTTG 
AACGTGCTGG CCAAACAGGA GGCAAACCCC AACCTGCGCG TAACCATTGA GGCTCTTGGA 
GATTCCGTTC AGGGCGGCTC CACCTTCTCG GAAGCCCTGG CCCAACACCC CAGAATTTTT 
GACCGCCTGT TTGTCAACAT GGTAAAGGCC GGGGAACTGG GCGGTGTGCT GGAAGTCGTG 
CTGAACCGTC TGGCGGAATA CCAGGAAAAG GCCCAAAAGC TGAAAAGCAA GGTGATCTCC 
GCCATGGTGT ATCCCTCCAT CGTCCTGTTT ATCGCCGTAG GCATCGTGAT CTTCCTGATG 
CTGGTCATCG TGCCCAAATT CAAGGCGATG TTCGCAGAAC AGAACCAGGA ACTTCCCGGT 
ATTTCCGAGT TTGTGTTCGG CATCAGCGAC TGGTTCATGG CCGCCCCCTT CTTTGTGCCC 
AATGCCGTCA TTCTGGCCGC GGTAGTCGCC ATCCTGTACG CTGTTTTCAC GGCCATGAGC 
AAGACGCCCA ACGGACGCCG CAAGATTGAC TCCGCTCTGC TGACCATGCC GGTCATCGGC 
AATGTGCAGA GCAAAAGCGC CATCGCCCGC TTCGCCCGAA CCTTCGGTAC GCTGGTGACT 
TCCGGCGTCC CCATCCTCCA GGCGCTTACC ATCACGAAGG ATACCGCCGG CAACATGATC 
GTGGGAGACG CCATCGGCCT CATCCATGAC TCCGTCAAGG AAGGCGAATC CGTAGTTACG 
CCCATGTCCT CCTCCAAGCT TTTCCCGCCC ATGGTAATCT CCATGGTGGA CGTGGGGGAA 
GAAACCGGCC AGTTGCCGGA CATGCTCCTG AAAATCGCGG ACGTGTATGA TGATGAAGTG 
GACAATGCCG TGGGAGCTAT GACCTCCATG CTGGAACCCA TCATGATCGT ATTCCTGGCC 
GTGGTCGTGG GCGGCATCGT GTTCGCCATG TTCCTTCCCC TCCTGCAGGT TATTGAAAAG 
ATGGGATAA

Protein sequence

MPKYQYTALD HKGDQKTGTL EANSEAEAME SIRAHGLYPT QIVEAGKGKI QQTPAAKKKA 
KGAKKQKGKL GGKIKAKALM IFTRQLATLI DAGLPLLQSL NVLAKQEANP NLRVTIEALG 
DSVQGGSTFS EALAQHPRIF DRLFVNMVKA GELGGVLEVV LNRLAEYQEK AQKLKSKVIS 
AMVYPSIVLF IAVGIVIFLM LVIVPKFKAM FAEQNQELPG ISEFVFGISD WFMAAPFFVP 
NAVILAAVVA ILYAVFTAMS KTPNGRRKID SALLTMPVIG NVQSKSAIAR FARTFGTLVT 
SGVPILQALT ITKDTAGNMI VGDAIGLIHD SVKEGESVVT PMSSSKLFPP MVISMVDVGE 
ETGQLPDMLL KIADVYDDEV DNAVGAMTSM LEPIMIVFLA VVVGGIVFAM FLPLLQVIEK 
MG