Gene SeHA_C1869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1869
Symbol
ID	6489875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	1823993
End bp	1825534
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	54%
IMG OID	642742082
Product	DNA-binding transcriptional regulator TyrR
Protein accession	YP_002045727
Protein GI	194451846
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG3283] Transcriptional regulator of aromatic amino acids metabolism
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.148583
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGG AAGTCTTTTG TGAAGACCGA CTTGGTCTGA CCCGCGAATT ACTTGATTTA 
CTGGTGTTAC GTAGCATTGA TTTACGCGGA ATCGAGATTG ATCCCATTGG GCGAATTTAT 
CTTAATTTTG CTGAGCTGGA ATTCACCGAC TTCAGCAGCC TGATGGCCGA AATCCGCCGT 
ATTTCCGGCG TAACGGATGT CCGTACCGTT CCCTGGATGC CGTCCGAACG TGAACATCTG 
GCCCTGAGCG CGCTGCTTGA GGCGTTGCCG GAGCCGGTGC TCTCATTGGA TATGAAGAGT 
AAAGTGGAGA TGGCGAACCC GGCGAGTTGT CAACTTTTTG CCCAGAGCCA GGAGCGAATG 
CGGCACCATA CCGCCGCACA ATTAATCAAC GGCTTCAATT TTCAGCGCTG GCTGGACGGT 
AACCCGCAAA GCTCCCATAA CGAACATGTC GTGATCAACG GGCAAAACTT CCTGATGGAG 
ATTACGCCGG TACATTTACA AAACGAAAAT GACGAATACG TGTTGACCGG GGCGGTCGTG 
ATGTTGCGTT CCACGATTCG TATGGGGCAG CAGCTACAGA ATTTGTCCAC GCAGGATCTG 
AGCGCGTTTA GTCAGATTAT TGCCGTGAGC GCAAAGATGA AGCACGTCGT TGAGCAGGCG 
CGCAAACTGG CGATGCTCAG CGCGCCGCTG CTGATTACCG GCGATACGGG AACCGGCAAA 
GATCTTTTCG CCTATGCCTG TCACCAGGCA AGCCCTCGTT CAGCGAAACC GTATCTGGCG 
CTCAACTGCG CTTCAATCCC GGAAGATGCG GTAGAAAGCG AACTATTTGG CCATGCGCCG 
GAAGGTAAAA AAGGTTTCTT TGAACAGGCG AATGGCGGTT CGGTGCTGCT GGATGAAATT 
GGCGAAATGT CGCCGCGTAT GCAGGCGAAG CTGCTGCGTT TTCTCAACGA TGGTACGTTC 
CGTCGCGTCG GCGAAGATCA CGAAATTCAT GTTGATGTCC GCGTTATCTG CGCCACGCAG 
AAAAATCTGG TGGAGCTGGT GCAAAAAGGA CTGTTCCGCG AAGATCTCTA TTATCGACTT 
AACGTTCTGA CGCTTAATTT GCCGCCGTTG CGCGATTGTC CGCAGGATAT TATGCCGTTG 
ACCGAACTGT TCGTGGCGCG TTTTGCCGAC GAACAGGGCG TTCCGCGACC GAAACTGTCT 
GCCGATCTGA GTACGGTCCT CACTCGTTAC GGCTGGCCGG GTAACGTTCG CCAGCTTAAA 
AATGCGATTT ACCGGGCGCT GACGCAACTG GAAGGGTATG AGCTGCGTCC GCAGGATATC 
CTGCTGCCTG ACTACGATGC CGCGACGGTG GCAGTCGGCG AGGATGCGAT GGAAGGCTCG 
CTGGATGACA TTACCAGTCG TTTTGAACGT TCTGTCCTGA CCCAGCTTTA TCGTAGCTAT 
CCGAGTACGC GTAAACTGGC GAAACGGTTG GGGGTATCGC ACACCGCGAT TGCCAATAAG 
CTGCGTGAAT ATGGTCTGAG CCAGAAGAAG GGTGAAGAGT AG

Protein sequence

MRLEVFCEDR LGLTRELLDL LVLRSIDLRG IEIDPIGRIY LNFAELEFTD FSSLMAEIRR 
ISGVTDVRTV PWMPSEREHL ALSALLEALP EPVLSLDMKS KVEMANPASC QLFAQSQERM 
RHHTAAQLIN GFNFQRWLDG NPQSSHNEHV VINGQNFLME ITPVHLQNEN DEYVLTGAVV 
MLRSTIRMGQ QLQNLSTQDL SAFSQIIAVS AKMKHVVEQA RKLAMLSAPL LITGDTGTGK 
DLFAYACHQA SPRSAKPYLA LNCASIPEDA VESELFGHAP EGKKGFFEQA NGGSVLLDEI 
GEMSPRMQAK LLRFLNDGTF RRVGEDHEIH VDVRVICATQ KNLVELVQKG LFREDLYYRL 
NVLTLNLPPL RDCPQDIMPL TELFVARFAD EQGVPRPKLS ADLSTVLTRY GWPGNVRQLK 
NAIYRALTQL EGYELRPQDI LLPDYDAATV AVGEDAMEGS LDDITSRFER SVLTQLYRSY 
PSTRKLAKRL GVSHTAIANK LREYGLSQKK GEE