Gene Amuc_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1999
Symbol
ID	6274518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2428414
End bp	2429439
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	62%
IMG OID	642614059
Product	phenylalanyl-tRNA synthetase, alpha subunit
Protein accession	YP_001878591
Protein GI	187736479
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0016] Phenylalanyl-tRNA synthetase alpha subunit
TIGRFAM ID	[TIGR00468] phenylalanyl-tRNA synthetase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.19411
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGAAG AGATTGTACG CATCCAACGG GACGCCCTGG CACGCATCGC CCAGGCGTCT 
GACAGGCGCG GCGTGGAAGA CGCGCGCGTG GCCATCCTCG GCAAAAAAGG GGAACTGACC 
CTGGCCCAGA CGGGCATGAA GGACGTTCCC AGAGAGGAAA AGCCCGCTGT CGGCCAGTTG 
CTTAACGAGG CCCGCAAGGC CATTACGGAA GCTCTGGACG CCAAGCTGGA GGAAGTGCAG 
GCCCAGGCGG ACAAGGCCGC CGTGGCCGGT GTGGACCTGA CGCTTCCGGC CCGCTCCCTG 
CCGCCTGGCG GTCTGCACCC CCTCACCATC GTTAGGGATG AAGCCGTCCG CATTCTGCGC 
CACATGGGCT TTGCCCTGGC GGACGGCCCG GAGATTGAGG ACGAGTTCCA CTGCTTTGAC 
GCGCTGAACA CGCCGGAAGA TCACCCGGCC CGCAATGAGA AGGATACATT TTACTTTGAT 
TCCGGCAAGC TTCTGCGTAC GCACACGTCT TCCGTGCAGA TCCGCTCCAT GGAAAAGCAG 
CTGCCGCCCG TGCGTGTCAT CGCTCCCGGT TCCGCCTACC GCCGCGACGA AATTGACGCC 
ACGCACCTTT CCGCCTTCAA TCAGCTTGAA GGCCTGTATG TGGATACGGA CGTTTCCGTG 
GGCGACCTGA AAGGAACGCT GGAATATTTT CTGCGCGCCC TTTTCGGTTC CGGAACGGAG 
GTGCGCTTCC GCCCCCATTT CTTCCCGTTC ACGGAACCCA GCTTTGAAAT TGACGTCAAG 
CTGAAGGTGG ACGGCCAGGC CCCCCGCTGG GTGGAGATTG CCGGCTGCGG CATGGTGGAT 
CCCAATGTTT TTGAAGCCGT GGACCGCGAA CTGGGCCTGG ACCCCGGAGC GCAGGCCCGC 
TACACGGGGC TGACCGGCTT TGCCTTCGGC ATCGGCCTGG ACCGCCTGGC GATGATCCGC 
TGGGGCATCA GGGACATTCG CGCCCTGATT GAGAATGATG TGCGCTTCCT TGCCCAATTC 
CAATAA

Protein sequence

MKEEIVRIQR DALARIAQAS DRRGVEDARV AILGKKGELT LAQTGMKDVP REEKPAVGQL 
LNEARKAITE ALDAKLEEVQ AQADKAAVAG VDLTLPARSL PPGGLHPLTI VRDEAVRILR 
HMGFALADGP EIEDEFHCFD ALNTPEDHPA RNEKDTFYFD SGKLLRTHTS SVQIRSMEKQ 
LPPVRVIAPG SAYRRDEIDA THLSAFNQLE GLYVDTDVSV GDLKGTLEYF LRALFGSGTE 
VRFRPHFFPF TEPSFEIDVK LKVDGQAPRW VEIAGCGMVD PNVFEAVDRE LGLDPGAQAR 
YTGLTGFAFG IGLDRLAMIR WGIRDIRALI ENDVRFLAQF Q