Gene STER_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	STER_1950
Symbol	hisS
ID	4437461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus thermophilus LMD-9
Kingdom	Bacteria
Replicon accession	NC_008532
Strand	-
Start bp	1807719
End bp	1808999
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	40%
IMG OID	639677515
Product	histidyl-tRNA synthetase
Protein accession	YP_821256
Protein GI	116628637
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTC AAAAACCTAA GGGAACGCAG GATATTTTAC CTGGGGATAG TGCCAAATGG 
CAGTACGTGG AGAATGTTGC ACGTGAAACA TTTAAAAAAT ACAATTATGG TGAAATTCGT 
ACGCCTATGT TTGAACATTA CGAGGTCATT TCACGTTCAG TAGGTGATAC AACTGATATC 
GTTACTAAGG AAATGTATGA TTTTCATGAT AAGGGAGACC GTCATATTAC ACTCCGCCCA 
GAAGGAACAG CACCGGTTGT ACGCTCTTAT GTAGAAAACA AACTCTTTGC GCCAGAGGTC 
CAAAAACCTG TTAAAGTTTA TTATATTGGA TCAATGTTCC GTTATGAACG TCCTCAAGCA 
GGACGCTTGC GCGAGTTCCA CCAACTAGGT GTAGAGTGCT TTGGCTCAAA AAATCCAGCA 
ACAGATGTTG AAACAATTGC CATGGCCTAC CAACTCTTTA ATACGCTTGG CATTAAGGAT 
GTTACTCTTC ATTTGAATAG TCTTGGAAAT ACTGACAGTC GTCTGGCTTA TCGTCAGGCC 
TTGATTGACT ATTTGACACC AATGCGCGAG AGTTTGTCAA AAGATAGCCA ACGCCGTTTG 
GAAGAAAATC CTTTGCGAGT ACTTGATTCA AAAGAAAAAG AAGATAAGGT TGCAGTTGAA 
AATGCTCCAT CTATCCTTGA TTATTTAGAT GAAGAAAGTC AAACTCACTT TGATGAAGTG 
CGTGCCATGC TCGATAGTCT TAACATTCCA TATGTGATTG ATACCAATAT GGTACGTGGT 
CTGGATTACT ATAACCACAC GATTTTTGAA TTTATTACCA CTATTGACAA GTCTGAGTTA 
ACAATCTGTG CGGGCGGTCG TTATGATAGT TTGGTTGAAT ATTTCGGTGG TCCAGAAACA 
GCTGGATTTG GTTTTGGACT TGGTTTAGAA CGCTTGCTTT TGGTTCTTGA TAAGCAAGGC 
ATTAAACTTC CGGTAGAAGA AAGTCTTGAT GTCTACATTG CAGTACTTGG TTCGGGCGCT 
AATGGCAAAG CTCTTGAGTT AGTTCAATCC ATCCGCTACC AAGGATTTAA AGCTGAACGT 
GATTACCTTG GACGTAAGAT TAAGGCACAG TTTAAGTCAG CAGATACCTT CAAAGCCAAG 
ACTGTTATCA CATTAGGTGA GAGTGAAGTG GAGTCAGGTG TGGTTAAGGT CAAAAATAAT 
GCTACTCGTG AGGAAGTTAC TGTAAGTTTT GAAGAGCTAA CTACAAACTT CGCAACAGTC 
CTCAAACAGT TAGAAAAGTA G

Protein sequence

MKLQKPKGTQ DILPGDSAKW QYVENVARET FKKYNYGEIR TPMFEHYEVI SRSVGDTTDI 
VTKEMYDFHD KGDRHITLRP EGTAPVVRSY VENKLFAPEV QKPVKVYYIG SMFRYERPQA 
GRLREFHQLG VECFGSKNPA TDVETIAMAY QLFNTLGIKD VTLHLNSLGN TDSRLAYRQA 
LIDYLTPMRE SLSKDSQRRL EENPLRVLDS KEKEDKVAVE NAPSILDYLD EESQTHFDEV 
RAMLDSLNIP YVIDTNMVRG LDYYNHTIFE FITTIDKSEL TICAGGRYDS LVEYFGGPET 
AGFGFGLGLE RLLLVLDKQG IKLPVEESLD VYIAVLGSGA NGKALELVQS IRYQGFKAER 
DYLGRKIKAQ FKSADTFKAK TVITLGESEV ESGVVKVKNN ATREEVTVSF EELTTNFATV 
LKQLEK