Gene Amuc_0561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0561
Symbol
ID	6275519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	660401
End bp	661639
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	60%
IMG OID	642612610
Product	sun protein
Protein accession	YP_001877179
Protein GI	187735067
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.494153
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAACA ATCCCCCCTC CCCCCGCCAG ACAGCACTAA ATTGCCTGAG GAGCTGGCAT 
GCAGGCCGCT CCTTCGCGGA AACCCTCGTG GACCGGGAAT GTTCACGAAC CGCGCTTCCA 
TCGGCAGACA GGCACCTGGT GCAGGCTTTG GTCTTCAGCG TATTGCGCAA CCAGACCTGG 
CTGGACCACG TCATCGGAAC CCTCCGGAAA GGCAGGCTGG ACGTGGAAGC GCGTCTTATT 
CTCCAACTGG GGTTGAGCCA GCTTTTTCTG CTGGGCATGG CGGACCACGC CGCTGTGTAT 
GAAACCGTGA ATCTCGCGTC CGTACGCCTG AGAGGACTGG TAAACGCTAT CCTGCGCAAC 
GCTTTGCGGC GGGAGAAAAC CATTCTGGAG GAACGGGAAA AACTTCCGCT TTCCATTCAT 
TATTCCACCC CCGCGTGGCT GGTACGGAGA TGGACGGAAC AAATGGGGCC GCAAATGGCC 
CGCGACCTGC TCCGCTGGAA CAATACCACG CCGCGCCTGT ATGTGCGCGC CAATCCTCTG 
ATGCCCATGA AAAATATTCC GGCCTCCCTC GCCCCGCTGG ACCGCGCGCC CGGCTGGTTC 
TCCGTGGAAG GCCTTCTGCC GCTGGAGGAA ATTAAAACAG GCTCCCTTTA CGTAGCGGAT 
CCTTCCACCC GTTATTCCAT TGATTTGCTG GCCCCACAGC CCGGAGAGGA AATTCTGGAC 
GCCTGCGCCG CCCCCGGCGG CAAATCCGCC GCCATCATCG CCGCTACCGG AGGCAAAGCC 
CACCTGACCG CCACGGATCT CCACGAACAC CGGCTGCCCA CCCTGAAGGA AAACCTGGAC 
AGGCAGGGTT CTTCCTTCGT CAGGACGGCG CAGGCGGACT GGTCCCTTCC CTGCCGCACG 
GAATGGAAGG GCCGCTTTGA CGCCGTGCTT CTGGACGTTC CCTGTTCCAA CACCGGAGTC 
ATCCAACGCC GCGTGGACGT GCGCTGGCGC CTGACTCCGG AGGAAATCCG TCGCCTGACC 
GCACTCCAGA AGACCATCCT GGAAAATGCC TCCCGCGCCG TCAAACCGGG CGGCAGACTG 
GTTTATTCCA CCTGTTCCAT TGACGCGGAG GAAGACGGAC TGCTGATCAG GGACTTTTTG 
CAGAACCATC CGGAATGGAC GCTGAAAGAA GAAAAACTTA TCCTTCCCCA CGAGGAAAAA 
TCGGACGGCG CGTATGCGGC CCTTTTGATC TGTGCTTGA

Protein sequence

MKNNPPSPRQ TALNCLRSWH AGRSFAETLV DRECSRTALP SADRHLVQAL VFSVLRNQTW 
LDHVIGTLRK GRLDVEARLI LQLGLSQLFL LGMADHAAVY ETVNLASVRL RGLVNAILRN 
ALRREKTILE EREKLPLSIH YSTPAWLVRR WTEQMGPQMA RDLLRWNNTT PRLYVRANPL 
MPMKNIPASL APLDRAPGWF SVEGLLPLEE IKTGSLYVAD PSTRYSIDLL APQPGEEILD 
ACAAPGGKSA AIIAATGGKA HLTATDLHEH RLPTLKENLD RQGSSFVRTA QADWSLPCRT 
EWKGRFDAVL LDVPCSNTGV IQRRVDVRWR LTPEEIRRLT ALQKTILENA SRAVKPGGRL 
VYSTCSIDAE EDGLLIRDFL QNHPEWTLKE EKLILPHEEK SDGAYAALLI CA