Gene Amuc_1165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1165
Symbol
ID	6273804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1398694
End bp	1400421
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	61%
IMG OID	642613216
Product	hypothetical protein
Protein accession	YP_001877771
Protein GI	187735659
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.684145
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCCCC ACTTCACCAA CACGACCGCG TTCTGGGCGC TTCTGGCCAT CCCCCTCATC 
ACCGCCATCC ATTTCCTCCA GCACAAAACA AAAACACAGG CCACGGCCAC GCTCTTCCTG 
TTGGAAGCTC TGGCTCCGGA GGCCCATGAG GGTAATGCCT GGGACAGGTT ACGCATATCA 
CGCTCCTTCT GGATGCAAAT TCTGGCCGTC CTCCTGCTTA CCTGGGTTCT GGCCGCTCCT 
GTCTGGCCCG GCAAAGGCTC CGGCCAGACC GTAGTCTTCA TTCTGGATGA TTCCGCAAAT 
ATGGCCCCCT TTCGTCAAGA AGCCGTGAAT GCCGTCTCCG AAGACATGGA CACCATCCTC 
CGGTGCGGAA TCCCGGTCAC ATGGGTTCTC ATGGGCAGCA GGGCTTCCGG ACAGCCGCTC 
TACCGGGGGC CGTCCGTCCG CCAGGCCCTG CGCGCCCTGG ATCTCTGGCA GCCGCGCGAA 
GGAACACATG ACCTGGCCCC TGCCCTGCGC ACCGCCACAG CCGTTGCCGG GCCAACGGGA 
ATCACGCGCC TGATTACATC CACTGCCCGG AGGGTTCCCG CCGGCCAATC CGCACGGGGT 
GTAGGGAAAC CTCTGGAAAA TGCGGGTTTT GCGGGAATAA CCCCGGTGGA GGCCGCCGGC 
CCCGGCCATT GGAGGATTGC CGTTAAAAAC AATAGCCCAT CCCCTCTTCG GAGCGAAATC 
TCCATCCATA CGGAAAGCGG GCGTCCTCCT GCCCGGCGTT CCCTGTTCCT GAATCCAGGA 
ACTGTCACGG AATTTGAATA CAGCCTCCCT CCTGAAAGCG GAAAGGCCGT GCTCCGGCTC 
CCGACGGACG CCTTCCCGGC GGACAATGAG CTCCTGCTGG TCCGCTCCGC TCCCGCCCCC 
GTCGCCGTCA GCATGGAAAT TCCAGAAAAA TCCGGAAAAA TCTTCCGCAA TATCATCAAT 
AGCCTGCCGG GATTCTCCCC CGTCCCGGAC GGCTCAGATC CCGACCTCCT CCTGCTGGAG 
GGAAAAACGG AAAATGCCAG TCCCCCCGGA AAAGCGGCCA TCATATTTGC AGCCAGCGGC 
AAACCATCTT ACGGCGCTGT CACGGCGGAA CGGCATCCGC TGACTGACGG GCTGAACTGG 
AGCGGCCTGC TCATCCCCTC CATCGGTTCC ATGAAGCCGG GGGAAAAAGC CGGAGTCCTG 
CTCTGGCAGG GGGAATCCCC CCTGGCCTGG GTGGACGGGA AACGCCTTTT CCTCAACTGG 
CCCTGGGAAA AATCCAATGC GGACCGCGTT CCGGCGCCCT TGCTCATGAC CCGCAGATTC 
ATGCAATCCG TACAGGAGAA TCTGCCCGGA ACACATTACG GCAACCTTCC CGGAGGAACT 
CTCTTATCCA TGCCCGCAGG CGGAAAACTC ATTCAAACCA TGCCCGGGGG AGAACGCCGT 
GAAACTGTCT TTAACGGCAG GCTCCCGGAA GAAACCGGAT ATGTGGAAAT CTTCCCCCCC 
GGAGAAGGGA AAACACCCCT GTTCCAAGGC TCCGTCTGGT TCTCCGACGC CCGGATGGGA 
GATTTTTCCC ACTGCTCCAC GTTTGACACA GGACTTCCCC AGCCCCATGA AGAGGCGCTC 
CGGCACATGA AACGTGACCC TCTGGCCCCC CTCTGGCTGG CGCTGGCGTT CCTGGCCCTG 
ATTCTTTCCT GGCTTCCTCC CGTCCCAGAC ATCTCCCTGC GCCCATGA

Protein sequence

MLPHFTNTTA FWALLAIPLI TAIHFLQHKT KTQATATLFL LEALAPEAHE GNAWDRLRIS 
RSFWMQILAV LLLTWVLAAP VWPGKGSGQT VVFILDDSAN MAPFRQEAVN AVSEDMDTIL 
RCGIPVTWVL MGSRASGQPL YRGPSVRQAL RALDLWQPRE GTHDLAPALR TATAVAGPTG 
ITRLITSTAR RVPAGQSARG VGKPLENAGF AGITPVEAAG PGHWRIAVKN NSPSPLRSEI 
SIHTESGRPP ARRSLFLNPG TVTEFEYSLP PESGKAVLRL PTDAFPADNE LLLVRSAPAP 
VAVSMEIPEK SGKIFRNIIN SLPGFSPVPD GSDPDLLLLE GKTENASPPG KAAIIFAASG 
KPSYGAVTAE RHPLTDGLNW SGLLIPSIGS MKPGEKAGVL LWQGESPLAW VDGKRLFLNW 
PWEKSNADRV PAPLLMTRRF MQSVQENLPG THYGNLPGGT LLSMPAGGKL IQTMPGGERR 
ETVFNGRLPE ETGYVEIFPP GEGKTPLFQG SVWFSDARMG DFSHCSTFDT GLPQPHEEAL 
RHMKRDPLAP LWLALAFLAL ILSWLPPVPD ISLRP