Gene Amuc_1050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1050
Symbol
ID	6274060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1252607
End bp	1253977
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	57%
IMG OID	642613101
Product	ATP-dependent Clp protease, ATP-binding subunit ClpX
Protein accession	YP_001877657
Protein GI	187735545
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0052122
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGTT CCACCCCTCA TCTTCCTGCC TGTTCCTGCT GCGGCAAGCC CGGGAACAAG 
GTGGACAAAC TCATCCAGAT TGCGGAAGAC TTTTACATCT GCAACAATTG CGTTGAAATT 
TGCGTCAACA TGATTGTGAA GGACACAGGC CTTCCGATGG CGACCCGCTT CATCCGCGGC 
ATCCTGAACA TGGAACCCTC CGCTTACGCC ATGTGCCAGG CGGAGGCCCG CAAAGCGGCA 
GCCGCGGACA TGCTCAGGGA AACGGCGGCC GGCCCGGCCT CCTATGAAGG CCCGCTGCCC 
ACACCGGAAG AAATGTGCGC TACGCTCAAC CAGTATGTCA TCGGTCAGGA CTACGCCAAA 
AAAGTGCTTT CCGTAGCCGT GTACAACCAC TACATGCGCC TGCGCCAAAG TGCTGTCATG 
CTGGACGACA AGTCCCTGGA CGATGTGGAA ATTGAAAAAT CCAACATCCT GCTGGCCGGC 
CCCACCGGCT CAGGAAAAAC CCTGCTGGCG AAAACGCTGG CGAAAATGCT CAACGTCCCA 
TTCTGCATTG TGGACGCCAC CACGCTGACG GAAGCCGGTT ACGTAGGGGA AGATGTGGAA 
AACATCATCC TGCGCCTGCT CCAGGCTGCC AACTTTGACG TAGCGAAAGC GGAACAAGGC 
ATCATCTACG TGGATGAAAT CGACAAAATC GGACGCAAAA CACAGAATGT CTCCGTCACG 
AGAGACGTCT CCGGGGAAGG CGTGCAGCAG GCTCTGCTGA AAATCATTGA AGGCACCATC 
TGCAATGTTC CTCCCACCGG AGGCCGCAAG CACCCGCAAC AGGAATACAT CCGCGTCAAT 
ACGGAAAAAA TCCTCTTCAT TGTGGGCGGC GCTTTCGTCG GGCTGGAAGA CATCATCCGC 
AAACGCCTCG GCGCCACCCA GATGGGATTC GGAGCCATCA CGGAACAACG CGACCGCAAG 
GAATACTCGG AAGAGGAAAT ACTGGCACAG GCCATGCCGG AAGACCTCTT CTCCTTCGGC 
ATGATTCCGG AATTCGTGGG ACGCCTGCCC ATCTTCTGTC CGCTCTCCAA GCTGGATGAA 
AGCCAGCTCG TCCGCCTTCT TACGGAACCC AAAAACGCCC TGGTCAAGCA ATATTCCAAA 
CTGCTCGCCA TGTACGGCGC CAAACTGGAC GTGCTGCCGG ACGCCCTGAA AGCCATGGCC 
GCCGAAGCCA TGAAACGCGG CACGGGAGCC CGCGCTCTGC GTTCCATCTT TGAAACCCTC 
ATGCTGGACG TCATGTACAA AGTGCCCAGC ATGAAAAATG CGGACACCGT TACCATTACC 
AGGGAAACGG TTACCGGCAA CAAGCCGGCC CAAATCCACC AGTCCTCCTA A

Protein sequence

MSGSTPHLPA CSCCGKPGNK VDKLIQIAED FYICNNCVEI CVNMIVKDTG LPMATRFIRG 
ILNMEPSAYA MCQAEARKAA AADMLRETAA GPASYEGPLP TPEEMCATLN QYVIGQDYAK 
KVLSVAVYNH YMRLRQSAVM LDDKSLDDVE IEKSNILLAG PTGSGKTLLA KTLAKMLNVP 
FCIVDATTLT EAGYVGEDVE NIILRLLQAA NFDVAKAEQG IIYVDEIDKI GRKTQNVSVT 
RDVSGEGVQQ ALLKIIEGTI CNVPPTGGRK HPQQEYIRVN TEKILFIVGG AFVGLEDIIR 
KRLGATQMGF GAITEQRDRK EYSEEEILAQ AMPEDLFSFG MIPEFVGRLP IFCPLSKLDE 
SQLVRLLTEP KNALVKQYSK LLAMYGAKLD VLPDALKAMA AEAMKRGTGA RALRSIFETL 
MLDVMYKVPS MKNADTVTIT RETVTGNKPA QIHQSS