Gene SNSL254_A2252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2252
Symbol	hisC
ID	6482338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2160620
End bp	2161699
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	56%
IMG OID	642737599
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002041341
Protein GI	194444826
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	0.124333
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACTG AAAACACTCT CAGCGTCGCT GACTTAGCCC GTGAAAATGT CCGCAACCTG 
GTACCGTATC AGTCCGCCCG CCGTCTGGGC GGTAATGGCG ATGTCTGGCT GAACGCGAAT 
GAATTCCCGA CAGCGGTGGA GTTTCAGCTC ACCCAACAAA CGCTTAACCG CTACCCGGAA 
TGCCAGCCAA AGGCCGTGAT TGAAAACTAC GCGCAATATG CTGGCGTAAA GCCGGAGCAG 
GTGCTGGTCA GCCGCGGCGC GGATGAAGGG ATCGAACTGG TGATCCGCGC CTTCTGCGAA 
CCGGGGAAAG ACGCCATTCT CTACTGCCCG CCCACTTACG GTATGTACAG CGTCAGCGCC 
GAAACCATTG GCGTAGAGCG CCGGACGGTT CCCGCGCTTG AAAACTGGCA GCTGGATCTA 
CAGGGGATTT CCGACAACCT TGACGGCGCA AAAGTGGTGT TCGTTTGTAG CCCCAATAAC 
CCCACCGGGC AACTTATCAA CCCGCAGGAT CTACGCACGC TGCTGGAGTT GACACGCGGT 
AAAGCGATAG TCGTCGCCGA CGAAGCTTAT ATTGAGTTTT GCCCGCAGGC CACGCTGACA 
GGCTGGCTGG TTGAATATCC TCATCTGGTT ATCCTGCGCA CATTGTCGAA AGCTTTTGCG 
CTGGCGGGTC TGCGCTGCGG CTTTACGCTG GCTAATGAAG AGGTGATCAA CCTGCTGTTA 
AAAGTGATCG CCCCTTATCC GCTTTCTACG CCAGTGGCGG ATATCGCCGC CCAGGCGCTG 
AGCCCGCAGG GAATAAACGC AATGCGCGAT CGCGTGGCGC AGACAGTGCA GGAACGTCAG 
TATCTGGTGA ATGCCCTGCA ACAGACCGCC TGCGTAGAAC ACGTCTTTGA CTCTGAAACC 
AACTATATTC TGGCGCGGTT TACCGCCTCC AGCAGCGTGT TTAAATCCTT ATGGGATCAG 
GGCATTATCT TACGCGATCA GAATAAACAA CCTTCTTTAA GCGGCTGCCT GCGGATTACG 
GTCGGCACCC GCCAGGAAAA CCAGCGCGTC ATTGACGCCT TACGTGCGGA GCCAGTATGA

Protein sequence

MSTENTLSVA DLARENVRNL VPYQSARRLG GNGDVWLNAN EFPTAVEFQL TQQTLNRYPE 
CQPKAVIENY AQYAGVKPEQ VLVSRGADEG IELVIRAFCE PGKDAILYCP PTYGMYSVSA 
ETIGVERRTV PALENWQLDL QGISDNLDGA KVVFVCSPNN PTGQLINPQD LRTLLELTRG 
KAIVVADEAY IEFCPQATLT GWLVEYPHLV ILRTLSKAFA LAGLRCGFTL ANEEVINLLL 
KVIAPYPLST PVADIAAQAL SPQGINAMRD RVAQTVQERQ YLVNALQQTA CVEHVFDSET 
NYILARFTAS SSVFKSLWDQ GIILRDQNKQ PSLSGCLRIT VGTRQENQRV IDALRAEPV