Gene Amuc_0225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0225
Symbol
ID	6275305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	281234
End bp	282277
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	60%
IMG OID	642612270
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_001876849
Protein GI	187734737
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAATGG CCATGATGAA AAAAGTTGTC TCTTTATGTG CGGCTTCCTC CGCCTTCTTT 
TTTTTGTGCG GATGTGACCG CGCCCCTTCT TCCGGGGAAA AGCGGGCTGC TTCTTCTGCG 
GAACGGGAAA AGCCGTCTGC GGTGCGGAAA GAGGCGGAGA CATGGAGGGA GCGTCTGGAC 
GCTGCTGTTG CCGGCTCCGT CCGCGAGAAG GAAAATGGTA GCGAGCATGT GAAAGCCCTC 
AATGATGTGG CTGCCCTGTA TGCGGAGGGA TTGCAGAATG GCTGGGTTCA TCCGCTGGAT 
GTGCGGGCCT GGTGTGATTC CGTGGCGGAG GCCGGTTCCG GGTATTCCGG GGAAACGGTC 
ATCGGCGCCA TGTTCCTGTA TGGGACGGGA ATCAAGCGTG ATGCCGTAGC GGCCAGGGAG 
TGGTTTGAGT ACGGGCTTGC CCGCCCGGGG ACCCAGCGGG GAAACGCTCT GTACATGTTG 
GGAATGATGT ATTTCAAGGG GGATGGCGCG GATCAGGACC TGAATAAGGC GCTGGGGCTG 
TGGCACAAGG CAGCGGATGA GGAACATCCG GCAGCCATGG GGCTGCTGGG CCGGGCTTAC 
ATGGAGGGGA AGATGGGGGT TGAGAAGGAT GCCGCTTCCG GCCTGGCGCT GCTGGAGAAG 
GCCGCCAACG GGGGGAATAC GCCTTCGTCC GTCTATCTGG GGAACATTTA TGCAAAGGGG 
CAGGGGGTGG AGCGGGATAT GGAGCGTGCC ATGAAGTGGT ATGAACAGGC GGCTTCAGCC 
GGAGACGCCC ATTCCCAGTA TATTGTGGGA CTGGCCTGTC TGGAAGGTTC CGGCGTGCCT 
GTGGATGAGG GCAAGGCGTT CAGCTGGCTC CGGCTGGCCG CCGGGCAGGA CCACGTCAAC 
GCCATGCTGA TGCTTTCCGT CTGCTACAGC ACAGGAAAAG GGACCCCTCA GAATGCGGAT 
ATGGCGGAAG TCTGGAAAAA GAAGGCGCTT CAACTGAATG CGGAACGCGA GGGAAGTTCT 
GCGCCGCAAA CGCAAAAACG TTAA

Protein sequence

MVMAMMKKVV SLCAASSAFF FLCGCDRAPS SGEKRAASSA EREKPSAVRK EAETWRERLD 
AAVAGSVREK ENGSEHVKAL NDVAALYAEG LQNGWVHPLD VRAWCDSVAE AGSGYSGETV 
IGAMFLYGTG IKRDAVAARE WFEYGLARPG TQRGNALYML GMMYFKGDGA DQDLNKALGL 
WHKAADEEHP AAMGLLGRAY MEGKMGVEKD AASGLALLEK AANGGNTPSS VYLGNIYAKG 
QGVERDMERA MKWYEQAASA GDAHSQYIVG LACLEGSGVP VDEGKAFSWL RLAAGQDHVN 
AMLMLSVCYS TGKGTPQNAD MAEVWKKKAL QLNAEREGSS APQTQKR