Gene Amuc_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0140
Symbol
ID	6274801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	172287
End bp	173468
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	57%
IMG OID	642612185
Product	tyrosyl-tRNA synthetase
Protein accession	YP_001876765
Protein GI	187734653
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.485656
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATAG ATGAGCAATT AGACATATTG ATGGGCGGTA CCGCCGTCGT GATCAGCCGC 
GAAGAGCTGA AGGAGCGTCT CAAGCTGGGC CGCCCCCTGC GCGTGAAGCT GGGCGTGGAC 
CCTACTGCGC CGGACATCCA CCTGGGCCAT ACCGTGGCTA TTGAGAAATT GCGCCAGTTC 
CAGGAACTTG GCCACCAGGC TGTTTTGCTC ATCGGGGATT TCACCGCCAC GATCGGCGAC 
CCTTCCGGCC GTTCCGTGAC CCGCCCCCCC CTTTCCCGTG AACAGGTGCT GGAGAATGCG 
GAGACATATA CCAAGCAGGC GTTCAAGATT CTGGACCGTG ACAAGACGGA GATCGTGTAT 
AATGGGGACT GGTTCCGCAA GATGACGTAT GAGGAGGTGC TGAAGCTTAA TTCCCGCGTG 
ACCATGCAGC AGATGCTGGC CCGGGAGGAT TTCAAGGCCC GTGTGGAGGG AGGTAAGGAG 
GTGCGCCTGC ATGAGATGCA GTATCCGATT ATGCAGGGCT GGGATTCCGT GGAAATCCGT 
GCGGACGTGG AACTGGGCGG GACGGACCAG CTTTTCAACA TCCTGGTGGG CCGCGACCTT 
CAGAAGGAGG AAGGCATGTT GCCGCAGATC GCCATGACGA TGCCTCTTCT GGAAGGTCTG 
GACGGCGTTC GGAAGATGTC CAAGTCCTAC GGGAATTACG TGGGCGTGGA TGAGTCTCCG 
GAGATGATGT TCGGCAAGAT GATGAGCGCC AGCGACGAAC TGATGGACCG TTATTACCTG 
GTGCTGCTGG GTGAGAAGCG GGACATGGGA TTGCATCCGA TGGAAGCCAA AAAGCTCCTG 
GCCTGGAAAA TCACGGCACG CTATCATGAT TCCGCCGCTG CGGATGCCGC GCGTTCTGAC 
TGGGAAACCC GTTTTTCCAA GAGGGATTTG GCTGCCGCGG ATTTGCCGGA AGTGGAGATT 
GCCTCCCTGC CTGCCGACAT GAATGCCCTG GCCCTGGTTT CCTTCCTGTT TGAGAATGTT 
TTCCAGGTGA AAAAATCCAA TGGCGTTCTC CGCAAGGAGC ATTTCACGCC CGGCGCTATC 
CAGTTGAATG ATGTGAAAAT GACAGACCCC TCCGCCGTTT TGGAACTGGC TCCGGGCAGC 
ATCCTGCGCC TGAGCAAGAA GCATGCTGTG CGTTTCAAAT AG

Protein sequence

MTIDEQLDIL MGGTAVVISR EELKERLKLG RPLRVKLGVD PTAPDIHLGH TVAIEKLRQF 
QELGHQAVLL IGDFTATIGD PSGRSVTRPP LSREQVLENA ETYTKQAFKI LDRDKTEIVY 
NGDWFRKMTY EEVLKLNSRV TMQQMLARED FKARVEGGKE VRLHEMQYPI MQGWDSVEIR 
ADVELGGTDQ LFNILVGRDL QKEEGMLPQI AMTMPLLEGL DGVRKMSKSY GNYVGVDESP 
EMMFGKMMSA SDELMDRYYL VLLGEKRDMG LHPMEAKKLL AWKITARYHD SAAADAARSD 
WETRFSKRDL AAADLPEVEI ASLPADMNAL ALVSFLFENV FQVKKSNGVL RKEHFTPGAI 
QLNDVKMTDP SAVLELAPGS ILRLSKKHAV RFK