Gene Amuc_1482 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1482
Symbol
ID	6275775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1772177
End bp	1773292
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	55%
IMG OID	642613542
Product	protein of unknown function DUF805
Protein accession	YP_001878085
Protein GI	187735973
COG category	[S] Function unknown
COG ID	[COG3152] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.118245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.324958
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGAAT CTCCTGCTTC TCCTGCTTCT CCTGCTGTTT CCTCCGTTCC TCCAACCTCC 
ACGCAGGCAT CTTCCCTCCT TTCCCCCCTC TCCTGCTGGA AAAAAGGTTT TCTTCATTAT 
GCGGACTTTC GGGGCTGCGC TTCCCGTGCG GAATTCTGGT GGTTCATGGC TCTTCCCCTC 
CTGGCGCTGA TTCCAGCCCT GGCAGGGTAT ATCCTGACGG ACTGGCTGCA CATCCCTGAT 
ACAAGACTGA GCATCTACGG AGACGCCTTA ACCATCCTCC TGTGGGCGGT GTTATTCATC 
CCAAGCATAT CAGCCGCGTT CAGACGCCTG CATGATACAG GCAGGAGCGG CCTCTGGCTT 
TTTTCCCTTT TCATTCCCTT CGGGCTGGGG CATCTGATCT TTTTTTATCT GACGCTAGGA 
GAAAGCAAGG CGGACGGCAA CAAATACAGC CGCCGTCCGG AGCCCCAACC GGCTGATCCC 
CCTGCCGGAA AACTGAAAGA GCAGCCATTG ACTCCGTTTT ACCTTTACTG GCTCATCAGC 
CTGCGGAAAT TGAATACGGT GGCAGGCCGC GCGTCCCGGA CGGAATTCTG GTCCTTTTTC 
CTCCTTTCCG TCCTCCTGTT CCTTCCGCTG GGCTACAGCA TGATAGACGT TGACAGCCAG 
CCGGCGGGTT TTTATGTCTC TCCTTCCCTC CAAATCCTGT TATATGCCGC CCATCCGCAA 
GATGCTCTGA TCCTGCTGGC TCACTCCTGC TTCAATCCCA CCTTTTACTT TTTCTACCAA 
TCCGGAGAGC TGAGCATGCT TTCCCTGGAG CTTCTGGCAG CCGTGGCGGG GCTCAATATC 
CTCTTCAATC TGCCGGTCGC CGTGCGCCGC CTGCATGACA GCAATCTGAG CGGAAAATTC 
ATCCTGATTC CCATTCTTAT TTTCATCGTC ACTTTCCTGC TGATTTTCCT GCTGCGCCTG 
GTCCCGGAGG ACATGGCCCC CTATCTGGAC TACCTGGGAA TGGTGTCCAG CCTGATGGAT 
CTGCTTTCCA TCCTCTTCCT GTCCATGATG CTTCTTAAAA GCTCGCCAGG CCCCAATGAA 
TACGGCGTGC TTCCGCAAAA AATAACCGTA TCCTGA

Protein sequence

MPESPASPAS PAVSSVPPTS TQASSLLSPL SCWKKGFLHY ADFRGCASRA EFWWFMALPL 
LALIPALAGY ILTDWLHIPD TRLSIYGDAL TILLWAVLFI PSISAAFRRL HDTGRSGLWL 
FSLFIPFGLG HLIFFYLTLG ESKADGNKYS RRPEPQPADP PAGKLKEQPL TPFYLYWLIS 
LRKLNTVAGR ASRTEFWSFF LLSVLLFLPL GYSMIDVDSQ PAGFYVSPSL QILLYAAHPQ 
DALILLAHSC FNPTFYFFYQ SGELSMLSLE LLAAVAGLNI LFNLPVAVRR LHDSNLSGKF 
ILIPILIFIV TFLLIFLLRL VPEDMAPYLD YLGMVSSLMD LLSILFLSMM LLKSSPGPNE 
YGVLPQKITV S