Gene Apre_1363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1363
Symbol	hisS
ID	8398170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1464491
End bp	1465777
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	36%
IMG OID	644995725
Product	histidyl-tRNA synthetase
Protein accession	YP_003153107
Protein GI	257066851
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000622801
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATTG TAAAACCATC TACAATTGCT GGGGTAATGG AACTTTTACC TAAGGAGCAA 
TTAGTTTTTG ACAAGATTAA AAGCATAGTC GAAGAAACTT ACAAGAAATA TCAATTTATG 
CCAATCGATA CACCAGTTAT CGAGAAAAAT GAGATACTTT TTGCCAAGGG AGGCGGAGAA 
ACTGAAAAAC AAATCTATGA AATAGCTTCT GACTCTAAGG ATATGAGCTT AAGGTTTGAT 
CTTACAGTTC CTCTAGCACG TTACGTATCA GAGCACTTCC AAGACTTGAA TTTCCCTTTC 
AAACGCTATC ACATAGGAAG AGTCTACAGG GGTGAGAGAA ATCAAAAGGG AAGATATAGG 
GAATTCTACC AGGCTGATAT AGATATCATT GGTCACAACA GTCTTTCAAT CTACAACGAC 
GCCCTCCTTC CTAGGGTTAT CTTTGAGATT TTTGAAAAAT TAAATTTCTC TGATCTTACC 
TTCAAGATCA ATAACAGAAA GCTTTTGAAT GGATTTTTCA AATCCTTGGG TATAGAAGAT 
ACAACAGATG TCCTTAGGAC AATTGATAAG AAAGATAAGA TTGGAATTGA CAAAACTTTT 
GATGAATTAG TTAGAATCAC TGACGAGAAA AAAGCTAGGA CAATCATAGA ATTTATAGAA 
AACAAAGATT CCAATAAAGA ACTTTTATCT AAGTTATTTG ACTTTTCTAC TGATGAGCTT 
TTCCTTGAAG GAGTTGACGA GCTAAATAAG GTCTACACCT ACATGGTTGA TCTAGGTATA 
CCTGATAGAA ATATCAAAAT CGACCTTGCC ATAACAAGAG GGCTAGATTA TTATACATCT 
ACAGTCTATG AGACCTTTAT CAATGGCTAT GAGAAGATTG GTTCTGTCTG CTCTGGGGGA 
AGATATGAGG ATTTAGCAAG TAATTTCTCC AAGCAGAAAC TTCCAGGAGT TGGCATGTCA 
ATCGGTCTTA CAAGACTTTT CTACCAATTC CAAGAGCTTG GACTAATAGA TGAGAAAATC 
AAGAGCCTAA CAGATATCCT GGTTATCCCA ATGGATGAGT CAATTAATGA GTACGGCATA 
GAAATTTTAA ATAAACTAAG GGATTCTGGC GAAAGTGTCG ATATCTATCT TGAAAGCGGC 
AAGTTTAAGA AGAAGATGAA CTATGCAGAT AAGTGCGGAA TCAGGAAAGT CATCATCTTA 
GGTGAAGAAG AGATGAGCAA GAGAGAGTAT TCTATAAAGG ATATGGAAAC TGGCGAGCAA 
GTTACTAAAA AATTCGAAGA ACTTTGA

Protein sequence

MNIVKPSTIA GVMELLPKEQ LVFDKIKSIV EETYKKYQFM PIDTPVIEKN EILFAKGGGE 
TEKQIYEIAS DSKDMSLRFD LTVPLARYVS EHFQDLNFPF KRYHIGRVYR GERNQKGRYR 
EFYQADIDII GHNSLSIYND ALLPRVIFEI FEKLNFSDLT FKINNRKLLN GFFKSLGIED 
TTDVLRTIDK KDKIGIDKTF DELVRITDEK KARTIIEFIE NKDSNKELLS KLFDFSTDEL 
FLEGVDELNK VYTYMVDLGI PDRNIKIDLA ITRGLDYYTS TVYETFINGY EKIGSVCSGG 
RYEDLASNFS KQKLPGVGMS IGLTRLFYQF QELGLIDEKI KSLTDILVIP MDESINEYGI 
EILNKLRDSG ESVDIYLESG KFKKKMNYAD KCGIRKVIIL GEEEMSKREY SIKDMETGEQ 
VTKKFEEL