Gene Apre_1514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1514
Symbol
ID	8398326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1649701
End bp	1650951
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	42%
IMG OID	644995878
Product	tyrosyl-tRNA synthetase
Protein accession	YP_003153256
Protein GI	257067000
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000130469
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTA CTTACGAAAA AGAATATGAC AATGTCTTCG ATGAGCTTGT AGATCGTGGC 
TACTACGAAC AAGCAACCAA CGAGGAAGAA CTTAAGAAAT TACTAAAGGA AGAATCAGTT 
AAATTCTACT GTGGCTTCGA TGCTACAGCA GATTCTCTAA CCGTGGGCCA TCTTATCCAA 
ATTATGGTAA TGATGCGTAT GCAAAACTAC GGCCACAGAC CTGTTGCCCT TCTTGGTGGA 
GGAACTACCC TAATAGGAGA CCCTTCAGGT AGGAGCGATA TGAGAAAGGT CATGACAGAA 
GAGATGATCG ATCACAATGC AGAATGCTTC TACAATCAAT TCCAAAGATT CTTAGACTTC 
TCCGAAGGCG GAGCGACTAT GCTAAACAAC AAAGACTGGC TCCTTGACCT AAACTTCGTT 
GAGTTTTTAA GAGATGTGGG AAGCGAGTTC TTGGTTAATG AAATGATCAA AAAAGACGCC 
TACAAAAACA GAATGGCTGC AGGTGGTTTA ACATTTTTCG AATTCTCCTA CATGCTACTT 
CAATCTTACG ACTTCCTTAA GATGTACAGG GAAGATGGGG TAAAGCTTGA AATGGGTGGA 
TCTGACCAAT GGTCCAACAT CATAGGCGGA GTTGACCTAA TCAAAAAGCA CGAAAACGGC 
CAAGCTTACG GCATGACCTT CTCCCTCCTT ACAACTGCAG ATGGAGTGAA AATGGGTAAA 
TCTCAAAAGG GAGCTGTTTG GCTAGATGAA AAGAAGACCA GCCCTTACGA AATGTACCAA 
TACATGAGAA ATGTGGATGA TAGGGACGTG GAGAAATTCC TCCTCCAACT TACCTTCCTT 
CCAACAGAAG AATGCAGGAA GCTAGGCTCT GCGAAAGATG CAGCTGAAAT CAACAAGGCC 
AAAGAAATTC TAGCCTACGA GGTAGTAAAA CTCGTTCATG GCAAGGAAAA GGCAGATGAG 
GCAATAGCAG CAGCCAAGGC CCTCTTTACC GGAAAAGGCG ACGAAAGCGC AATGCCAACA 
ACTCAAATTG CAAAATCAGA CCTACCAAAG GGACTTCTAA TCCTAATGAC TGAAACAGGT 
CTAACCAAAT CAAATGGTGA AGCAAGAAGA ATCATCAAGC AAGGTGGAGT TTCCATCAAT 
GATGAGAAAG TAGCCGATCC AAGTATAGAA GTTACAGAAG ACCTCTTCGA AGACGGAAGA 
ATAATAATCA AAAAAGGTAA GAAAAACTTC CACAAAGTAG AACTTATCTA G

Protein sequence

MKFTYEKEYD NVFDELVDRG YYEQATNEEE LKKLLKEESV KFYCGFDATA DSLTVGHLIQ 
IMVMMRMQNY GHRPVALLGG GTTLIGDPSG RSDMRKVMTE EMIDHNAECF YNQFQRFLDF 
SEGGATMLNN KDWLLDLNFV EFLRDVGSEF LVNEMIKKDA YKNRMAAGGL TFFEFSYMLL 
QSYDFLKMYR EDGVKLEMGG SDQWSNIIGG VDLIKKHENG QAYGMTFSLL TTADGVKMGK 
SQKGAVWLDE KKTSPYEMYQ YMRNVDDRDV EKFLLQLTFL PTEECRKLGS AKDAAEINKA 
KEILAYEVVK LVHGKEKADE AIAAAKALFT GKGDESAMPT TQIAKSDLPK GLLILMTETG 
LTKSNGEARR IIKQGGVSIN DEKVADPSIE VTEDLFEDGR IIIKKGKKNF HKVELI