Gene Amuc_0241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0241
Symbol
ID	6275276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	298195
End bp	299637
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	56%
IMG OID	642612289
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_001876865
Protein GI	187734753
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.381439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTGTT CCGGTATGAA GAAACATTGC AGATGGTGGC TTTTTGCCGG ATTGTGGGGA 
CTGTCCCTCG TTCAGCATCC ACTTCTTGCT TCTCAGAATA TTTCCTCTCC GGAGCCTGCC 
GGGGAGGGAA ATTTTGAGGC TTACTTGTCC GGTCTCCGCG AAAGAGCTCT GAATGGGGAT 
CCAGCTGCCG CCCGGGAGCT GTCTGTGCAT TATGACGTGG AGGGTAATGC TGCGGAAACG 
TCCAAATGGA TGTCCGAGTA TGTTTCCTTG GCAGAGAAAA GGGCCAATAA CGGAGATGTG 
GATTCCATGC TGGATTTGGG CAAGCTGTTT TATACAGGCA GCCGCCTGTA CCCAAAGAAC 
CTGGAAAGGG CCCGGTACTG GTTTACCCGG GCTGCTGACA GCGGTAATGC CGCGGCACAG 
TACCAGGTGG CTGTAATGGC TTCCCAGGGA GCAGGAGGAC CGAAGGATGA AGCAACGGCA 
GCCCTTTATT ATAAAAAATC TCTCCAGACG TGGAAGAAAG AGGCGGATGA CGGTGATTCC 
AAGGCGGCGT TATGGGCTGC CCTTGTTTAT GAACGAAAGC TGGTTCCGGA CAGTTCTCCG 
GAAAAGTCAG TCCCATATCT TCTTCAGGCA GCGGAAAGCG GCAACCTGAC AGCACAAGGC 
CTTCTGGCAT TTAAGTACCG GGATGGGCTG GGAGTGCCGC AGGATGCGGC CAAGGCCGTA 
GAATGGTTTG AGAAAGCGGC CTCCCGTAAA GATTTGGGAG CCGTGATGGA ACTGGGCATA 
ATGTTCCGGG ACGGCAAGTA TTTGCCCCCT GACCGGGAAA AGGCCTTCCA TTGGTTTGAA 
AAAGGGGCGG AATGGAAGGA TCCGTACAGC ATGGCTGCCC TGGCGGATAT GCTGCTGGAG 
GGAACTCCTT CCGCAGAACA GGCGGCCCGG GCCCTGGCTC TGTATCGTGA GGCTGCCGCC 
GCCGGTTATT TCCCTGCGGC ACTAAAGGCC GCGGAGCTGC TCCAGAACGG GAAGGGCGGG 
GAACTGGATG CGGATGAGGC CTACAGGCTG CTGCGGCGTG TGGCGGATGC TACAGGGGAT 
CCCAAGGCCA TGTACATGCT GGCCCAGGTA TATTATACAC GGGGTGATGA GGCTCAGGGA 
GATTCCCTGA TGAAAGCATC CGCCCAGGCT GCCTATTTGC CGGCCATGAA CCGCATGGCG 
CGTCTCCATC TTCTGCCGGA CAGTTCACTG CCCTGGAATC CGGTTTTATC CTATTATTAT 
TGGAACCAGG CTGGAGAAAT GGGGGATGAA AAGGCGGCTT CCGCCGCTTT TTGGCTGTTG 
TGGGGCGGCT CAGGCATCTT TTTGCTGGCA ATATTTATTA TTGTCTGGCG TTTTCAGCGT 
TTTGCCGCCA GAAGGCTTGC GGAACAGCAG AAACAGGAAC GGGAGGCCTC TGATGACGCA 
TGA

Protein sequence

MTCSGMKKHC RWWLFAGLWG LSLVQHPLLA SQNISSPEPA GEGNFEAYLS GLRERALNGD 
PAAARELSVH YDVEGNAAET SKWMSEYVSL AEKRANNGDV DSMLDLGKLF YTGSRLYPKN 
LERARYWFTR AADSGNAAAQ YQVAVMASQG AGGPKDEATA ALYYKKSLQT WKKEADDGDS 
KAALWAALVY ERKLVPDSSP EKSVPYLLQA AESGNLTAQG LLAFKYRDGL GVPQDAAKAV 
EWFEKAASRK DLGAVMELGI MFRDGKYLPP DREKAFHWFE KGAEWKDPYS MAALADMLLE 
GTPSAEQAAR ALALYREAAA AGYFPAALKA AELLQNGKGG ELDADEAYRL LRRVADATGD 
PKAMYMLAQV YYTRGDEAQG DSLMKASAQA AYLPAMNRMA RLHLLPDSSL PWNPVLSYYY 
WNQAGEMGDE KAASAAFWLL WGGSGIFLLA IFIIVWRFQR FAARRLAEQQ KQEREASDDA