Gene Amuc_0034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0034
Symbol
ID	6275179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	41923
End bp	43443
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	61%
IMG OID	642612074
Product	prolyl-tRNA synthetase
Protein accession	YP_001876662
Protein GI	187734550
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.599841
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCAGC AAACCGCAAT CACCCCTACC CGCGCCCAGG ATTTCCCCGA GTGGTACCAG 
CAAGTCATCA AGGCCGCCGA CATGGCGGAA AATTCCGAGG TCCGCGGCTG CATGGTCATC 
AAGCCATGGG GCTACGCCAT TTGGGAACTC ATTCAAAAGG ACCTGGACCA GCGCTTCAAG 
GACACCGGCC ATACGAACGC CTATTTCCCC CTCCTGATTC CTATCTCCTA TCTGGAAAAG 
GAAGCGGAGC ATGCTGAAGG CTTCGCCACG GAATGCGCCG TAGTCACCCA CCACAGGCTG 
GAAGCGCAAA AGGATGAAGC CACCGGCAAG ACACGCATGA TTCCCACCGG GGAGCTTACG 
GAACCCTTCG TCATCCGGCC CACCTCGGAA ACCGTCATCG GCGCGGCTTT CGCCCGCTGG 
ACCTCCAGTT ACCGGGACCT GCCCCTCAAA GTCAACCAGT GGTGCAACGT GATGCGCTGG 
GAAATGAGGC CCCGAATCTT CCTGCGCACG GCGGAATTCC TGTGGCAGGA AGGGCATACG 
GCCCATGAAA CCCGCGAGGA AGCCATTGAG GAAACCCTCA CCATGCACAA GGTTTATGAA 
GAATTCCAGC GGGACGTGCT CGCCATCCCC ACCATTCCAG GGGAAAAGAC GGAGGCGGAA 
CGCTTCCCCG GAGCGGAACA AACCTACACG GTGGAAGCCA TGGTGCAGGA CCGCAAGGCC 
ATCCAGGCAG GGACCTCCCA CTTCCTGGGG CAGAATTTCT CCAAGTCCCA GAACATCTGC 
TTCGCCGGAA GGGACAACAC CCAGCAATTC GCATGGACAA GCTCCTGGGG CGTTTCCACC 
CGCATGATCG GAGCGCTCAT CATGATGCAC TCCGACGACG ACGGACTCGT CTGCCCGCCC 
CGCGTCGCTC CCCAGCAAAT CGTCATCATT CCCGTCACGC CCAAGGAAGA AAGCCGCCAG 
GCCGTTCTGG ACCACTGCGA GGAACTGGCG CGCACCCTCC GCGCCAAAAC CTTCCACGGC 
CAGCCGCTGC GCGTGCTGGT GGACAGGCGC GACCTGGGCG GCGGCGCCAA GAAATGGGAA 
TGGGTGAAAA AAGGCGTGCC CGTGCGTCTG GAAATAGGCC CCCGGGACCT GGAAAAAGGC 
TCCGTCTGCC TTCAGCGGCG CGACCGGCCC GCCAATGAAA AATCCTTCGT CCCGGAAACG 
GAACTGATCG ATACCGCTGC GGATATTCTC CAAAGCATCC AGGACACCCT GCTTCAGCGG 
GCCATTGCCT TCCGGGACTC CCATATCCGC CCCGCCTCCA CTCTGCGGGA ATTGGAAGAA 
AACTTCTCCG GAGAGGGAGA TGCAGATTGG CTCCAGGTGC CGTGGGACGG GTCTCCGGAA 
GAAGAAGAAG AACTGGCTAA ACGGCTGCGC ATTTCCATCC GCTGCATCCC GCTCGGCGAG 
CTGGGCCGCG GCGAACCGGC ACCCTGCATC CTCACCGGAC GTATGACGAA ACGCCGTGTT 
CTCTGGGCCA GAAGCTACTG A

Protein sequence

MSQQTAITPT RAQDFPEWYQ QVIKAADMAE NSEVRGCMVI KPWGYAIWEL IQKDLDQRFK 
DTGHTNAYFP LLIPISYLEK EAEHAEGFAT ECAVVTHHRL EAQKDEATGK TRMIPTGELT 
EPFVIRPTSE TVIGAAFARW TSSYRDLPLK VNQWCNVMRW EMRPRIFLRT AEFLWQEGHT 
AHETREEAIE ETLTMHKVYE EFQRDVLAIP TIPGEKTEAE RFPGAEQTYT VEAMVQDRKA 
IQAGTSHFLG QNFSKSQNIC FAGRDNTQQF AWTSSWGVST RMIGALIMMH SDDDGLVCPP 
RVAPQQIVII PVTPKEESRQ AVLDHCEELA RTLRAKTFHG QPLRVLVDRR DLGGGAKKWE 
WVKKGVPVRL EIGPRDLEKG SVCLQRRDRP ANEKSFVPET ELIDTAADIL QSIQDTLLQR 
AIAFRDSHIR PASTLRELEE NFSGEGDADW LQVPWDGSPE EEEELAKRLR ISIRCIPLGE 
LGRGEPAPCI LTGRMTKRRV LWARSY