Gene NSE_0781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NSE_0781
Symbol	hisS
ID	3931975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Neorickettsia sennetsu str. Miyayama
Kingdom	Bacteria
Replicon accession	NC_007798
Strand	-
Start bp	693305
End bp	694546
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	40%
IMG OID	637900937
Product	histidyl-tRNA synthetase
Protein accession	YP_506656
Protein GI	88608104
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATAA AAATCAATAA TGTCAAAGGG ACTAGGGATC TGTTTGGTGA GCAGTTAGAA 
AAGATGCGTC TCATTGAGCA GGTAGCCAAG AATCTTTCGA TTCGGTATTT GTTTACTGAG 
CTTGAGACTC CGATAATTGA GCATACAGAG CTTTTTATTA GGAACCTTGG TGAAACGTCA 
GACGTAGTAA ATAAAGAGAT CTATTCGTTT CAGGACAAAA GTGGTCACAA TATTTGTCTA 
AGACCAGAAT TTACCGCTGC TGTCACTAGA GCATTCGTGG AGAATTTTCA GCATATTCAA 
TCACCTGTTC GGTTATTTTC TTTTGGTCCG CTATTCAGAT ATGAAAGACC ACAAAAAGGG 
AGATATAGGC AATTTCATCA GGTGAATTTT GAATGGATCG GAGCAAAGCA TTATCTTTGG 
GCTGTTGAAG CTATAGTTTT AGCAAAGTCG TTCCTTAAAG AAATTGGAAT AAGGTGTGAA 
ATACGTGTTA ATTCACTTGG TTGTTCTAGA ACTCGTGAAG AGTATAAACT TGCACTCATC 
AACTATTTTC AACAGTACAA AGAGCACCTT TCAGCTGATA GTTTGCTCAG ATTGAAAAAG 
AATCCGTTGA GAATATTAGA CTCGAAGGAT CCATCTGAGA AGGAAATTGT GGTGGGCGCG 
CCAAGAATTC TGGATTACCA TACTGATGAT GCTCTAAAGG AATTTGAATC AATTTGTGAT 
ATACTGAAGC TCCTCGATAT TGAGTTTTCT GTAGATCATA GGTTGGTCAG AGGATTAGAT 
TATTATTCTG GTTTAATTTT CGAATTTACT AGTCCTGATC TCGGTGCGCA GGATGCCCTC 
TTGGGAGGTG GAGCATATGA GCAACTTTCA GAGAATTTGG GCGGAAAAAA AGTACAATCA 
ATTGGGTTTG CTGCGGGGAT TGAGCGTTTA ATCGATATAA TGCCAGTTTT GGCACCTACG 
AGTGATAAGA TCGTTTCGAT TGTTCCCATC GGGGAAATTG CAGAAAGGGA GGCGCTAAAA 
CTACTGTTTT ACCTGCGCAG TGAAGGATTA TGCGCCGATA TGTGCTATGG GCTCAGTGTT 
AAGTCGAGAA TGAAACGTGC TGAAAGAAGC ACAGTTACAG TCATTCTTGG TGAGGAAGAA 
TTTTCAAGGG GTGAGTCGAC CGTAAGAATA ATGGAGACTG GTCAACAAAT GACTGTTGCG 
CACGAAAAAC TCCTATCAAC ATTGAGGGAA TTGCTCTGTT GA

Protein sequence

MSIKINNVKG TRDLFGEQLE KMRLIEQVAK NLSIRYLFTE LETPIIEHTE LFIRNLGETS 
DVVNKEIYSF QDKSGHNICL RPEFTAAVTR AFVENFQHIQ SPVRLFSFGP LFRYERPQKG 
RYRQFHQVNF EWIGAKHYLW AVEAIVLAKS FLKEIGIRCE IRVNSLGCSR TREEYKLALI 
NYFQQYKEHL SADSLLRLKK NPLRILDSKD PSEKEIVVGA PRILDYHTDD ALKEFESICD 
ILKLLDIEFS VDHRLVRGLD YYSGLIFEFT SPDLGAQDAL LGGGAYEQLS ENLGGKKVQS 
IGFAAGIERL IDIMPVLAPT SDKIVSIVPI GEIAEREALK LLFYLRSEGL CADMCYGLSV 
KSRMKRAERS TVTVILGEEE FSRGESTVRI METGQQMTVA HEKLLSTLRE LLC