Gene Amuc_1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1547
Symbol
ID	6273661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1858942
End bp	1860729
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	56%
IMG OID	642613606
Product	hypothetical protein
Protein accession	YP_001878149
Protein GI	187736037
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.180047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAACC TGTTGTTTGC ATTGTTGACC GGTTCCTTTT GTTGCTGTTA TGCCCAACAG 
AAGGCCGCAC CCGTTCCGGA ACCTGAAGTT GTCGCCACTC CGCCGGCTGA TGCGGGGCGC 
GGCCTTATCC GTGTGGACTC CCGTGAAATA CGCCATTATT CCGGTACCCG CAAGGAACCG 
GATTACCTGG TCAGCAGGGA TAACGGAAAA ACATGGGAAA TGAAGGCCGC TCCGGCTGGC 
TACCCTCCCA ACTACGGTGG CATTCCCAAA GAATCTCCAG CTATTGTGCG CAACCCTCTG 
ACCAGGGAAT TCATTCGTGT GCAGCCTATC GGGGGCTTTG TATTTCTTTC CAGGGGTGGG 
CTGGACGGCA AGTGGCTTGC CGTCACGAAT GACGGCAAAC TGGAAGAAGA CTGGAAAGAC 
CCGGAAAAGA GGAAAAACCT GAAAAAACTG GGCGGCATCA TGCGAACCCC CGTTTTTGTG 
AACAAGGGCC GCAGGGTGAT CGTGCCGTTC CACAACATGG GCGGCGGCAC CAAGTTCCAT 
ATTTCCGATG ACGGGGGGCT GACCTGGCAT GTATCCAGGA ACGGTGTTAC TTCCCCCAGA 
CATGAAGCCA GGCCCCCCCA CCAGGGCGTC AGATGGTTCA ACAATGCCGT GGAAGCCACG 
GTTTTGGAAA TGAAAGACGG TACGTTGTGG GCGCTTGCCC GCACCTCCCA GGACCAGGCG 
TGGCAGGCTT TTTCCAAGGA TTACGGGGAA ACGTGGAGCA AACCGGAGCC TTCCCGCTTT 
TTCGGCACCC TGACCATGAA CACGTTGGGA CGCCTGGATG ACGGAACTAT CGTTTCCCTG 
TGGACGAATA CAATGGCTCT GCCTGAAAAC GCCACAGCTG GCAACGGAAC GTGGGAGGAT 
GTATTCACCA ACCGTGATTC CCACCACATT GCTATGTCCG GGGACGAGGG CAAAACCTGG 
TACGGGTTCC GGGAGATTAT CCTGGACGAA CACCGCAACC ATCCCGGCTA TGCTACGCTG 
GATGGTCCGG AAGACCGCGG CAAACATCAG AGCGAAATGG TGCAGCTGGA CAAAAACCGC 
ATCCTTATTT CCCTGGGGCA GCATAAAAAC CACCGCCGCC TGGTTATTGT GGACCGCCGC 
TGGGTAGGGG CCAAGACGCG TGCCACGCAG ACGGGGAAAG ATTTGGATTC CCAGTGGACC 
ATTCACACTT ATATCCCCCA GAAAAAAGGC CATTGCAGTT ATAACCGCAA GCCTTCCGCC 
GAGTTGGTTC AGGATCCGTC CGGGGGCACG AAGAAGGTGT TGCAAATCAA GCGTCTGGAT 
GATCCCGAAC TGGTCAATGA AAAATCCAAT GTGGATTACC GGAACGGCGG AGCTACCTGG 
AACTTTCCGA ACGGGACCAC GGGGCTGGTC AAATTCCGCT TCCGTGTAGT GGACGGGGAG 
CAGGCGGATG ATTCCGGCCT TCAGGTCTCT CTGACGGACC GGCTGTTTAA TGCCTGTGAT 
TCCACTACGA AGGATTATGC CCTGTTTACC TTCCCGATCA GGCTGAAACC TGCGCCCCAT 
CTGTTGCTGG GGATGAAAAA AGTGCCTTTC ACGCCCGGCG CGTGGCATGA AATTTCCCTT 
CTTTGGCAGG GTGGGCAGGC CGTGGTGTCT CTGGACGGAA AGAAGGCCGG AACGTTGAAA 
ATGGCTAATA AGTCCCCCAA TGGAGCCAGT TATATCCATT TCATCAGCAC CGGGTCCCAA 
CCGGATGCCG GCATTCTGCT GGATACGGTG AATGCCCGGG TGAAGTAA

Protein sequence

MKNLLFALLT GSFCCCYAQQ KAAPVPEPEV VATPPADAGR GLIRVDSREI RHYSGTRKEP 
DYLVSRDNGK TWEMKAAPAG YPPNYGGIPK ESPAIVRNPL TREFIRVQPI GGFVFLSRGG 
LDGKWLAVTN DGKLEEDWKD PEKRKNLKKL GGIMRTPVFV NKGRRVIVPF HNMGGGTKFH 
ISDDGGLTWH VSRNGVTSPR HEARPPHQGV RWFNNAVEAT VLEMKDGTLW ALARTSQDQA 
WQAFSKDYGE TWSKPEPSRF FGTLTMNTLG RLDDGTIVSL WTNTMALPEN ATAGNGTWED 
VFTNRDSHHI AMSGDEGKTW YGFREIILDE HRNHPGYATL DGPEDRGKHQ SEMVQLDKNR 
ILISLGQHKN HRRLVIVDRR WVGAKTRATQ TGKDLDSQWT IHTYIPQKKG HCSYNRKPSA 
ELVQDPSGGT KKVLQIKRLD DPELVNEKSN VDYRNGGATW NFPNGTTGLV KFRFRVVDGE 
QADDSGLQVS LTDRLFNACD STTKDYALFT FPIRLKPAPH LLLGMKKVPF TPGAWHEISL 
LWQGGQAVVS LDGKKAGTLK MANKSPNGAS YIHFISTGSQ PDAGILLDTV NARVK