Gene Amuc_1450 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1450
Symbol
ID	6275688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1740871
End bp	1742013
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	58%
IMG OID	642613510
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_001878053
Protein GI	187735941
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGACG CTTCCCACAA CCACGGCGAG CAGGAAAACA CCGTCTCCAC CTATTCCGTC 
GACGTAGAAA CCCTTCAGCA AATAGCTCTG AAAGGAGACG CCCAGGCGCT GTTCCAGCTG 
GCAATCAACT ACGAACAGGG ACGCGGGGTG GCGGAAAACC AGCAGGAAGC CTTCTACTGC 
TACCAGCAGG CGGCGGAACT GGGCCACGTT ACAGCCCAGC TCAACCTGGG ATGGGCTTAT 
TCCAACGGCA TCGGCGCCCC TCAGGACAAC GACAAGGCCT TTTACTGGTA CCGGAAAGCC 
GCCGAACAGG GGCACCCCAC CGCGCAATTT GACCTTGGGT TCTGCTATGT CAATGGCCTG 
GGAGTGGAAA AAGACGAACA CCAGGCCATC GGCTGGTACA AAAAAGCGGC GGAACAGGGC 
CACGCGGTAG CCCAGCTCAA CCTCGGCTGG ATTTATGCCA ACAGCCCCAG CCGGAAAAAC 
TGGGAACAGG CCGTATACTG GTACAAGCAG GCTGCAGAAC AGGGAGACCC CCGCGCCCAG 
TATAACCTGG CCTGGTGCTA TGGCAACGGA AGCGGAACCC CCAAAAACCC GCGGAAAGCC 
GCTTACTGGT ACGAAGAAGC CGCCATGCAG AACCACGCTA CGGCCCAGTA CAATCTGGGA 
TGGTGCTATG AAAACGGTTT CGGCGTGGAG CCGGATCTGG ACAAAGCGCT GGTATGGTAT 
CACAAATCAG CCCTTCAGGG CCAGATTACG GCCCAATACA CGCTGGGATG GTGCTACGGC 
AACGGCCGGG GCATGGAAGT GGACATGGCC AAAGCCGTCC ACTGGTACAC CAAAGCCGCA 
GAACAGGGGC ATACAACAGC CCAGCTCAAC CTGGGGTGGT GCCATCTGAA CGGAAAAGGA 
ACGCCCGTCA ACCGGGAAAA AGCCCTGAAA TGGTACCTTA AGGCGGCGGA ACAGGGCAAC 
GCCACAGCCA TGTTCAATGT GGGCAACTGC TACGCCCACG GCTACGGCAT TGAGCAGGAC 
GATAAACAGG CGGAAGAATG GTATCAGAAA GCCGTCCGGC ACGGCAACAA AAAGGCCGCC 
AGCGCCCTGC GCCATCTGGC CTCCAAACAG GAAAAAGAGA AACAAACGGA CTCGGAGGCC 
TGA

Protein sequence

MNDASHNHGE QENTVSTYSV DVETLQQIAL KGDAQALFQL AINYEQGRGV AENQQEAFYC 
YQQAAELGHV TAQLNLGWAY SNGIGAPQDN DKAFYWYRKA AEQGHPTAQF DLGFCYVNGL 
GVEKDEHQAI GWYKKAAEQG HAVAQLNLGW IYANSPSRKN WEQAVYWYKQ AAEQGDPRAQ 
YNLAWCYGNG SGTPKNPRKA AYWYEEAAMQ NHATAQYNLG WCYENGFGVE PDLDKALVWY 
HKSALQGQIT AQYTLGWCYG NGRGMEVDMA KAVHWYTKAA EQGHTTAQLN LGWCHLNGKG 
TPVNREKALK WYLKAAEQGN ATAMFNVGNC YAHGYGIEQD DKQAEEWYQK AVRHGNKKAA 
SALRHLASKQ EKEKQTDSEA