Gene Amuc_0573 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0573
Symbol
ID	6274572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	670610
End bp	671668
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	58%
IMG OID	642612623
Product	3'-5' exonuclease
Protein accession	YP_001877191
Protein GI	187735079
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0349] Ribonuclease D
TIGRFAM ID	[TIGR01388] ribonuclease D

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAGCG AGAAAGAGGA ATTACTGGAA TGGCGCAAAC GCGCCGCCGC ACAGCCCGCG 
GGACGGGTAG TCCTGGATCT GGAGGCAGAC AGCCTGCACC GCTATCAGGA AAAAATCTGC 
CTGATCCAAT ATGCGGACGA AACGGGTTCC TGCCTGATTG ACCCTCTCTC TATCGAAGAT 
ATGGGGCCTT TCTACAACTG GCTGAAAGAA ACGGAAGTCT GGATGCACGG AGCGGACTAC 
GATATGAGCC TCTTTCAAAA CGCCTGGGAA ACGCTGCCCG CCATGATCTG GGATACGCAG 
ACGGCGGCGC GCCTGCTGGG CTTCCGCCAG TTCGGGCTGG CAGCCCTGGT GGAACACTTC 
CACGGCATCA CCCTGAGCAA ATCTTCCCAA AAGGCGGACT GGGCGCGGCG CCCCCTTTCC 
CCAACCATGG TCACTTACGC CCTGAACGAC GTAAATTACA TGCTGGACAT GGCGGACAAA 
CTGACGGCCG CCCTCCGGAA AAAAGGACGC ATGGGCTGGT TTGAAGAAAT TTGCAGACAT 
TCCATGGAAC GCGCCCGGGA ACGCCATCTG GCAGGCCATC AGGACCCCTG GCGCATCCAG 
GGCTGCGGCA AATTGAACAG GAAGGGGCTG GCCGCCCTCC GGGAAATGTG GACCTGGCGT 
GATGCGGAAG CCAAAACGTG GGACAAACCC GCGTTCATGG TTTGCTCCAA TGCTGACCTC 
ATCCAGTGGA GCGTGGCTCT CCAGGAACAG CGCACCGTGG CGCCCCCGCC CCGTTTTCAT 
GCCCACAGGC GCAGCCGGTT CATGAATGCG CTCCAGAAAT TCTACCTGCT GGATGAAGAA 
GACTACCCAT GCCGGCCCCG CATTCAGCGC CGGCAACATT CCGACCAATT TGAGGACAAT 
CTGGCCCGCC TGTGCAAACT CAGGGATGAA AAAGCTGAAG AACTGGGCAT GGAAGGCTCC 
TTCCTGATTA CCCGGGCCTC TCTGGAAGCT ATTGCGGAAG ACAGGGAAAA AGGCGTTTCC 
ACCCTGTTGA ACTGGCAGAA GGAAGCCCTG GGTTTTTAA

Protein sequence

MISEKEELLE WRKRAAAQPA GRVVLDLEAD SLHRYQEKIC LIQYADETGS CLIDPLSIED 
MGPFYNWLKE TEVWMHGADY DMSLFQNAWE TLPAMIWDTQ TAARLLGFRQ FGLAALVEHF 
HGITLSKSSQ KADWARRPLS PTMVTYALND VNYMLDMADK LTAALRKKGR MGWFEEICRH 
SMERARERHL AGHQDPWRIQ GCGKLNRKGL AALREMWTWR DAEAKTWDKP AFMVCSNADL 
IQWSVALQEQ RTVAPPPRFH AHRRSRFMNA LQKFYLLDEE DYPCRPRIQR RQHSDQFEDN 
LARLCKLRDE KAEELGMEGS FLITRASLEA IAEDREKGVS TLLNWQKEAL GF