Gene Amuc_0176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0176
Symbol
ID	6275379
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	221610
End bp	222614
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	60%
IMG OID	642612222
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_001876801
Protein GI	187734689
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.610666
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.201691
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGTT TTTGTTGCTT GGTCGTTGGG GGGCTTGTGT CCCTGCTGTC AGGGGGGGCG 
AGCCTTGCGG GGAATGTTTC TTCCATGGCG GATTTGCAGA AACATGTGCA TGAGGTGGCC 
TCCAGGGTTA CGGCTGCTAC GGTGGCTCTG GTTTCCGACG GGGGAGAGAC GGGCAGCGGC 
GTCATTGTCT CTCCGCGGGG CCTGATTTTG ACGGCGGCCC ACGTCGTGGG CGGCGATGAA 
ATCATGCGTG TGGTCTTTGC CGACGGGCGC GTGGTAAAGG GACGGGTGCT GGGCGCCAAC 
TTCACGCGGG ATGCCGCCAT GGTGCAAATC ATGGACGGAG GAAACTATCC TCATGTGGAA 
CTGGGGGAAT CCGACGGTCT TCATGTGGGG GATTTTGTGG TGGCTCTGGG CCATTCCAAG 
GGATTTGACC CGGAACGCCG CGCGCCCATC CGCATGGGAA GATTGTGCAC GGACGGAAAG 
CAGCGCTTCC TTATTTCGGA ATGTACGCTG ATTGGCGGAG ATTCCGGCGG TCCCCTCTTT 
GACCTGTCCG GCAAGTTGGT TGGCATCCAT TCCTCCATTG GCCCTATGTT GAAAATCAAC 
AACCATGTCC CTGTTTCCGT TTTCAGGAGA GACTGGGACA AACTGCTCTC CGGCAGGCAT 
TGGGGCCAGC TGGGCCTTCA TCCCATGGCG GACCCCGAAT CTCCTGTGCT CGGGTTTGCC 
ATGATGGATG TGCTGGGCGT GGACGGCGTG GTGGTGGAAG ACGTTGTGGT GAATTCTCCG 
GCGGATACCG CCGGCATCCA GCCGGGGGAC GTCATTACCC ATATGGACAG CCGGAGCCTG 
CGTTCCGTGC GGGATATGCT CCGTGAACTG GGCAGGCACC GTCCGGGGGA AACCGTTCCA 
TTGGTGGTGG TGAGGAAAGG TACGGCTTAC AAGGCGGATC TTACATTCGG CAGGCGCGGC 
GACCTGATGT CCGGCCTGAA ATACCAGGAA CAAACTCAAG GATGA

Protein sequence

MTSFCCLVVG GLVSLLSGGA SLAGNVSSMA DLQKHVHEVA SRVTAATVAL VSDGGETGSG 
VIVSPRGLIL TAAHVVGGDE IMRVVFADGR VVKGRVLGAN FTRDAAMVQI MDGGNYPHVE 
LGESDGLHVG DFVVALGHSK GFDPERRAPI RMGRLCTDGK QRFLISECTL IGGDSGGPLF 
DLSGKLVGIH SSIGPMLKIN NHVPVSVFRR DWDKLLSGRH WGQLGLHPMA DPESPVLGFA 
MMDVLGVDGV VVEDVVVNSP ADTAGIQPGD VITHMDSRSL RSVRDMLREL GRHRPGETVP 
LVVVRKGTAY KADLTFGRRG DLMSGLKYQE QTQG