Gene SeHA_C1563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1563
Symbol	purR
ID	6489086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	1513435
End bp	1514460
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	55%
IMG OID	642741786
Product	DNA-binding transcriptional repressor PurR
Protein accession	YP_002045431
Protein GI	194447411
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00208837
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	93
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACAA TTAAAGATGT AGCGAAACGG GCAAACGTTT CCACTACAAC TGTATCACAC 
GTAATCAACA AAACGCGTTT TGTCGCTGAA GAAACGCGTA ACGCGGTCTG GGCGGCAATT 
AAAGAGCTGC ACTACTCTCC CAGCGCCGTC GCGCGTAGCC TGAAGGTTAA CCATACCAAG 
TCGATAGGCT TACTGGCGAC CAGCAGCGAA GCGGCCTATT TTGCCGAAAT TATCGAGGCA 
GTTGAAAAAA ACTGTTTCCA GAAAGGCTAT ACGCTGATTT TAGGCAACGC CTGGAATAAC 
CTGGAAAAAC AGCGCGCCTA CCTGTCCATG ATGGCGCAAA AGCGCGTGGA TGGCCTGCTG 
GTGATGTGTT CTGAGTATCC AGAACCTCTG CTTTCCATGC TGGAAGAGTA TCGCCATATT 
CCGATGGTGG TGATGGACTG GGGTGAAGCG AAGGCCGATT TTACCGACAC GGTGATTGAT 
AACGCCTTTG CAGGCGGCTA TATGGCGGGT CGTTATCTGG TTGAGCGCGG CCACCGGGAT 
ATCGGCGTTA TTCCCGGCCC GCTGGAGCGC AACACCGGCG CGGGGCGGCT GGCAGGCTTT 
ATGAAAGCCA TGGAGGAGGC GCTGATCAAC GTGCCGGACA ACTGGATTGT TCAGGGCGAC 
TTCGAGCCGG AGTCCGGTTA CCACGCGATG CAGCAAATCT TATCGCAGTC ACATCGCCCT 
ACCGCCGTTT TCTGCGGCGG CGATATTATG GCGATGGGCG CGCTTTGCGC GGCTGACGAA 
ATGGGGCTTC GCGTACCGCA GGACGTTTCG GTGATCGGTT ATGACAATGT GCGTAACGCC 
CGTTACTTTA CCCCGGCGCT GACGACGATT CACCAGCCCA AAGACTCTTT AGGCGAAACC 
GCATTTAATA TGCTACTGGA TCGCATCGTC AATAAGCGTG AAGAGTCACA GTCTATTGAA 
GTTCATCCAC GCCTGGTTGA GCGTCGCTCG GTCGCTGACG GCCCGTTCCG CGACTATCGG 
CGTTAA

Protein sequence

MATIKDVAKR ANVSTTTVSH VINKTRFVAE ETRNAVWAAI KELHYSPSAV ARSLKVNHTK 
SIGLLATSSE AAYFAEIIEA VEKNCFQKGY TLILGNAWNN LEKQRAYLSM MAQKRVDGLL 
VMCSEYPEPL LSMLEEYRHI PMVVMDWGEA KADFTDTVID NAFAGGYMAG RYLVERGHRD 
IGVIPGPLER NTGAGRLAGF MKAMEEALIN VPDNWIVQGD FEPESGYHAM QQILSQSHRP 
TAVFCGGDIM AMGALCAADE MGLRVPQDVS VIGYDNVRNA RYFTPALTTI HQPKDSLGET 
AFNMLLDRIV NKREESQSIE VHPRLVERRS VADGPFRDYR R