Gene SNSL254_A2251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2251
Symbol	hisD
ID	6486222
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2159319
End bp	2160623
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	58%
IMG OID	642737598
Product	histidinol dehydrogenase
Protein accession	YP_002041340
Protein GI	194442217
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.849877
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	0.226426
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTCA ATACCCTGAT TGACTGGAAC AGCTGTAGCC CTGAACAGCA GCGTGCGCTG 
CTGACGCGTC CGGCGATTTC CGCCTCTGAC AGTATTACCC GGACGGTCAG CGATATTCTG 
GATAATGTAA AAACGCGCGG TGACGATGCC CTGCGTGAAT ACAGCGCTAA ATTTGATAAA 
ACAGAAGTGA CAGCGCTACG CGTCACCCCT GAAGAGATCG CCGCCGCCGG CGCGCGTCTG 
AGCGACGAAT TAAAACAGGC GATGGCCGCT GCCGTCAAAA ATATTGAAAC GTTCCATTCC 
GCGCAGACGC TACCGCCTGT AGATGTGGAA ACCCAGCCAG GCGTACGTTG TCAGCAGGTT 
ACGCGTCCCG TCGCGTCTGT CGGTCTTTAT ATTCCCGGCG GCTCGGCTCC GCTCTTCTCA 
ACGGTGCTGA TGCTGGCAAC GCCGGCGCGC ATTGCGGGAT GTCAGAACGT GGTTCTGTGC 
TCGCCGCCGC CCATCGCTGA TGAAATCCTC TATGCGGCAC AACTGTGTGG CGTGCAGGAA 
ATCTTTAACG TCGGCGGCGC GCAGGCGATT GCCGCTCTGG CCTTCGGCAG CGAGTCCGTA 
CCGAAAGTGG ATAAAATTTT TGGCCCCGGC AACGCCTTTG TAACCGAAGC CAAACGTCAG 
GTCAGCCAGC GTCTCGACGG CGCGGCTATC GATATGCCAG CCGGGCCGTC TGAAGTACTG 
GTGATCGCAG ACAGCGGCGC AACACCGGAT TTCGTCGCTT CTGACCTGCT CTCCCAGGCT 
GAGCACGGCC CGGATTCCCA GGTGATCCTG CTGACGCCTG ATGCTGACAT TGCCCGCAAG 
GTGGCGGAGG CGGTAGAACG TCAACTGGCG GAACTGCCGC GCGCGGACAC CGCCCGGCAG 
GCCCTGAGCG CCAGTCGTCT GATTGTGACC AAAGATTTAG CGCAGTGCGT CGCCATCTCT 
AATCAGTATG GGCCGGAACA CTTAATCATC CAGACGCGCA ATGCGCGCGA TTTGGTGGAT 
GCGATTACCA GCGCAGGCTC GGTATTTCTC GGCGACTGGT CGCCGGAATC CGCCGGTGAT 
TACGCTTCCG GAACCAACCA TGTTTTACCG ACCTATGGCT ATACTGCTAC CTGTTCCAGC 
CTTGGGTTAG CGGATTTCCA GAAACGGATG ACCGTTCAGG AACTGTCGAA AGCGGGCTTT 
TCCGCTCTGG CATCAACCAT TGAAACATTG GCGGCGGCAG AACGTCTGAC CGCCCATAAA 
AATGCCGTGA CCCTGCGCGT AAACGCCCTC AAGGAGCAAG CATGA

Protein sequence

MSFNTLIDWN SCSPEQQRAL LTRPAISASD SITRTVSDIL DNVKTRGDDA LREYSAKFDK 
TEVTALRVTP EEIAAAGARL SDELKQAMAA AVKNIETFHS AQTLPPVDVE TQPGVRCQQV 
TRPVASVGLY IPGGSAPLFS TVLMLATPAR IAGCQNVVLC SPPPIADEIL YAAQLCGVQE 
IFNVGGAQAI AALAFGSESV PKVDKIFGPG NAFVTEAKRQ VSQRLDGAAI DMPAGPSEVL 
VIADSGATPD FVASDLLSQA EHGPDSQVIL LTPDADIARK VAEAVERQLA ELPRADTARQ 
ALSASRLIVT KDLAQCVAIS NQYGPEHLII QTRNARDLVD AITSAGSVFL GDWSPESAGD 
YASGTNHVLP TYGYTATCSS LGLADFQKRM TVQELSKAGF SALASTIETL AAAERLTAHK 
NAVTLRVNAL KEQA