Gene Amuc_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1031
Symbol
ID	6274084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1223090
End bp	1224505
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	59%
IMG OID	642613080
Product	cysteinyl-tRNA synthetase
Protein accession	YP_001877638
Protein GI	187735526
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0215] Cysteinyl-tRNA synthetase
TIGRFAM ID	[TIGR00435] cysteinyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTACACC TTTACGATAC CCGCACCAGA ACGGCCCAGG ACATTTCTCC CATGGATGGA 
AAAACACTGC GCTTTTACTG TTGCGGCCCC ACGGTGTACG GCCCTACCCA CATCGGCAAT 
TTCCGCACTT TCGTGATGCA GGACGTCTTC CGCCGCGTCC TGGAACTGGG GGGGGTGCCC 
ACCACGCATA TCCGCAATCT GACGGATGTG GACGACAAAA CTATCCGGGA TTCTCAAAAG 
GCTGGCGTTT CTCTGGCGGA ATTCACCGCA GGCTGGGCGG ATCTGTTCCA CCGGGACTGT 
GCCGCCCTTA ATTGCCTGCC TCCCCATGCG GAACCCTCCG CCGTGGGCCA TATTCCCGAA 
CAAATACGGA TGGTTCAAAC ACTGGTGGAA AAGGGCCATG CCTATGTATC GGAAGACGGT 
TCCGTGTATT TCAGAATTTC TTCCTTCCCG GAATACGGAA GGCTTTCCCA CCTGGACGAA 
CGTGAACTGG ATTTAGGAAA AACCGCCAAT ACCCGGTCCA ACGCAGACGA ATATGAAAAA 
GACTCCGTGG CAGACTTCGT GCTGTGGAAG AGCCGCAGGC CGGAAGACGG AAACAACTTC 
TGGCCCTCTC CCTGGGGAGA AGGCCGCCCC GGCTGGCACC TGGAATGCTC CGCCATGATC 
CATAAATACT TCGGCAATGA CTTTGATCTC CACTCCGGCG GCGTGGATCT GGTATTCCCC 
CACCATGAAA ACGAAGTGGC CCAGTCCCGC TGCGCCTGCG GCGGCGGCTT CGCGCGCCTG 
TGGTTCCACA TCACGCACCT GCTGGTGGAC GGAGGCAAGA TGTCCAAATC CCTGGGCAAC 
ATGTACACGC TGGCGGATTT GGACAAACTG GGCCACAGGC CGTCCGCGGT CCGGTACGTG 
CTGGCGGGGG GCTATTACCG CCGTCCGTTG AATTTCACCC TTTCCTCTCT GGAAGACGCT 
AAAGCCGCGC TGAACCGCCT GTCCAAATTC GATATGCAGC TCAGGAACGC CTCCGGAACG 
GATTCCGTTC CCTCCTATGA GGAATTCTGC GCGGCATTCC CGGAATTGGG AATTTTCCAG 
CCGGCATGGG ACAGCCTGAA CGATGACCTA AACACTCCGG AAGCCCTGGG CCATGTTTTC 
AGCGCCATCA GGAAGGCGGA TATCCCCTCC CTTTCACCGG AGGAGGCGGC CCGCCTGCGG 
AATGCCTTCC ACTTTATTCT GGCCGCCTTC GGCATTATTC TGCCGGAGGA GGGACAGGAG 
GAAGCCCCGG AAGAAATCCG CACCCTGGCG GATCAGCGCT GGCAGGCCAA GCAGAACCGG 
GACTGGACGG AAGCCGACCG CCTGAGGGCG GAAGTGGCAG CGCTGGGCTG GGTCATTAAA 
GACCGCAAGG ACGGATACGA CCTGGCACGC AAATAA

Protein sequence

MLHLYDTRTR TAQDISPMDG KTLRFYCCGP TVYGPTHIGN FRTFVMQDVF RRVLELGGVP 
TTHIRNLTDV DDKTIRDSQK AGVSLAEFTA GWADLFHRDC AALNCLPPHA EPSAVGHIPE 
QIRMVQTLVE KGHAYVSEDG SVYFRISSFP EYGRLSHLDE RELDLGKTAN TRSNADEYEK 
DSVADFVLWK SRRPEDGNNF WPSPWGEGRP GWHLECSAMI HKYFGNDFDL HSGGVDLVFP 
HHENEVAQSR CACGGGFARL WFHITHLLVD GGKMSKSLGN MYTLADLDKL GHRPSAVRYV 
LAGGYYRRPL NFTLSSLEDA KAALNRLSKF DMQLRNASGT DSVPSYEEFC AAFPELGIFQ 
PAWDSLNDDL NTPEALGHVF SAIRKADIPS LSPEEAARLR NAFHFILAAF GIILPEEGQE 
EAPEEIRTLA DQRWQAKQNR DWTEADRLRA EVAALGWVIK DRKDGYDLAR K