Gene SeD_A2890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2890
Symbol	hisS
ID	6872814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2782547
End bp	2783821
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	56%
IMG OID	642785935
Product	histidyl-tRNA synthetase
Protein accession	YP_002216585
Protein GI	198241839
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.112536
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAAAAA ACATTCAAGC CATTCGCGGC ATGAACGATT ATCTGCCTGG CGAAACCGCC 
ATCTGGCAGC GCATTGAAGG CACACTCAAA AACGTGCTCG GCAGCTACGG TTACAGTGAA 
ATCCGCTTGC CGATTGTAGA GCAGACCCCG TTATTCAAAC GTGCGATCGG TGAAGTTACT 
GACGTGGTTG AAAAAGAGAT GTACACCTTT GAGGATCGCA ACGGCGATAG CCTGACATTG 
CGCCCTGAAG GTACGGCGGG CTGTGTACGC GCCGGCATCG AACATGGTCT CCTGTACAAT 
CAGGAACAGC GTTTGTGGTA TATCGGGCCG ATGTTCCGTC ATGAGCGTCC GCAAAAAGGC 
CGCTACCGTC AGTTCCACCA GCTAGGTGCC GAAGTCTTTG GCTTACAAGG CCCGGATATC 
GACGCGGAAC TGATTATGCT GACCGCACGC TGGTGGCGCG CGCTGGGCAT CTCTGAACAC 
GTTAGCCTGG AGCTGAACTC TATTGGTTCC TTAGAGGCGC GTGCGAACTA TCGCGATGCG 
CTGGTCGCGT TCCTCGAACA GCATCAAGAG ACGCTGGACG AAGACTGCAA ACGCCGTATG 
TATACCAATC CGCTGCGCGT GCTGGATTCA AAAAATCCGG ACGTGCAGGC GCTGCTCAAC 
GACGCGCCCG CTCTCGGCGA CTATCTCGAT GACGATTCAC GCGAGCACTT TGCCGGCCTG 
TGTAAATTGC TGGACGCGGC GGGGATTGCC TACACCGTCA ACCAGCGTCT GGTACGCGGT 
CTGGATTACT ACAACCGCAC CGTATTTGAA TGGGTAACAA ACAGTCTGGG GTCACAAGGC 
ACCGTCTGTG CGGGTGGTCG TTATGACGGT CTGGTGGAAC AACTGGGCGG TCGCGCTACC 
CCGGCAGTGG GCTTTGCGAT GGGCCTGGAA CGACTTGTTT TGTTAGTTCA GGCAGTTAAT 
CCGGAATTTA TTGCCTCTCC TGTTGTCGAT ATATACCTGG TAGCTGCCGG CGCACAAACG 
CAGTCTGCGG CAATGACGCT GGCGGAGCGG CTGCGCGATG AAATGCCAGG CGTGAAGCTA 
ATGACAAACC ACGGCGGCGG CAACTTTAAG AAACAGTTTG CCCGCGCCGA TAAGTGGGGC 
GCCCGTATTG CACTGGTTCT TGGCGAATCT GAAGTCGCCG ATGGGACTGT TGTAGTGAAG 
GATTTGCGCT CCGGTGAGCA AACGGCAGTG GCGCAGGACA GCGTCGCCGC GCATTTGCGC 
ACTTTATTGG GCTAA

Protein sequence

MAKNIQAIRG MNDYLPGETA IWQRIEGTLK NVLGSYGYSE IRLPIVEQTP LFKRAIGEVT 
DVVEKEMYTF EDRNGDSLTL RPEGTAGCVR AGIEHGLLYN QEQRLWYIGP MFRHERPQKG 
RYRQFHQLGA EVFGLQGPDI DAELIMLTAR WWRALGISEH VSLELNSIGS LEARANYRDA 
LVAFLEQHQE TLDEDCKRRM YTNPLRVLDS KNPDVQALLN DAPALGDYLD DDSREHFAGL 
CKLLDAAGIA YTVNQRLVRG LDYYNRTVFE WVTNSLGSQG TVCAGGRYDG LVEQLGGRAT 
PAVGFAMGLE RLVLLVQAVN PEFIASPVVD IYLVAAGAQT QSAAMTLAER LRDEMPGVKL 
MTNHGGGNFK KQFARADKWG ARIALVLGES EVADGTVVVK DLRSGEQTAV AQDSVAAHLR 
TLLG