Gene SNSL254_A0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0033
Symbol
ID	6483241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	33357
End bp	34361
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	39%
IMG OID	642735478
Product	putative transcriptional regulator
Protein accession	YP_002039260
Protein GI	194446304
COG category	[K] Transcription
COG ID	[COG0583] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.792057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	0.102163
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCCAA TAAAAAATGC TAAAAAAATT GACTACAATC TGATCAAAGT GTTCGATACG 
GTTATTACTG AAGGAAATGC AACCAGGGCG GCGAGGAAAC TGGATGTCAC GCCTGCGGCG 
ATCTCTCAGG CTCTTCTTCG TTTACAAAAT CTTTATGGCG AAGAGTTATT TATCAGAACC 
CGCAAAGGAT TAGTTCCGTC CAGCAAAGGT AAATCGCTTC ACCAGGTATT TCGCCAGGCA 
ATTGAATCTA TAGAAAGCAC ACTGTGCGAT AAAACAGATG CTCAGGAGAG TAATGAACTC 
ATTGTTCTGG GAAGTGATAT CACTGAAAAT TACTATTTTC CAGCATTGCT GGATACTGTG 
TTGATGAATC GATATATTAT TAAACACTAT GCGATTAAAA AAACAGGGGA ATACTCACCA 
GCCTCCATGC TGACGCATGG CTATGCGGAT GTTATCATGG GAATTCTGGA AATTAAGAAT 
GAGATGATCG AAAGTTATCT TATTGATAAT TTATCTGATT TTGTTTGTGT TTGTGGTGAA 
AAAAGTCCAT TGGTTGGGCT TGAAAAAATT TCTTTATATA ATTTTTATGC TGCCAGACAT 
GCTGTCTATC ATTCAGATAT GTTCTCTTCT TTCACCGCTG ATAGCATTGA TTTATTCAAG 
AGCAGTACGC CTTATGCGGG GCGCAGGGAA ATAGGTTATT ATAGTGATTC ACTATTTGGA 
GTTATCGGTG TTGTTGAAAA AAGCGATATG GTTGCGATTT TGCCAGGAAA GATTGTTACT 
TATTTTAGAG ATGTGCGGCG TTATAATATA AAAATACTAC GTATGCCTGA TGAAATGATT 
TTTCGTACGT TACCCGTTTA TGCTTATCTG GCTACAAACA GCACCCATTA TAAAAATGTC 
AAAAAACTGA TATCAACATT TCAGTCGACC TTTCTTTTTA GCCAGGAAAA GCAGCCTGAC 
GCTTTGGTTG AAGGAAGCAC ATCCTTATGC GATTTGTCGG CTTAA

Protein sequence

MRPIKNAKKI DYNLIKVFDT VITEGNATRA ARKLDVTPAA ISQALLRLQN LYGEELFIRT 
RKGLVPSSKG KSLHQVFRQA IESIESTLCD KTDAQESNEL IVLGSDITEN YYFPALLDTV 
LMNRYIIKHY AIKKTGEYSP ASMLTHGYAD VIMGILEIKN EMIESYLIDN LSDFVCVCGE 
KSPLVGLEKI SLYNFYAARH AVYHSDMFSS FTADSIDLFK SSTPYAGRRE IGYYSDSLFG 
VIGVVEKSDM VAILPGKIVT YFRDVRRYNI KILRMPDEMI FRTLPVYAYL ATNSTHYKNV 
KKLISTFQST FLFSQEKQPD ALVEGSTSLC DLSA