Gene SNSL254_A3959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3959
Symbol
ID	6485208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3842198
End bp	3843079
Gene Length	882 bp
Protein Length	293 aa
Translation table	11
GC content	57%
IMG OID	642739219
Product	putative transcriptional regulator
Protein accession	YP_002042929
Protein GI	194445844
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0229726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.500225
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCAAT ATATCGGTAT TGATGTGGGA GGAACTCACG TCAAATATGG CGTGATTAAC 
AGTGACGGCG AAGAATTAAC CCATCATCAA TTCGATACGC CAGAGGACGC CTCCACGTTT 
ACCCGCAAAT GGCAGGATGT GGTGGCGCGT TGCCAACAGG ACTATGACAT TGCGGCAATC 
GGGGTTAGTT TCCCCGGCCA TATTAATCCC CATAACGGTC ATGCGGCAAA AGCGGGCGCG 
CTGGCTTACC TGGATGACGT CAACCTGATG GAGTTGTTCA GCGGGCTGAC CGATCTGCCG 
CTGGTCGTGG AGAACGACGC GAACTGTGCG GCGCTGGGCG AAATGTGGCG AGGTGCCGGG 
CAGCATTATG ACAATCTGGT CTGTATTACC ATTGGAACCG GCATTGGCGG CGGTATTATC 
GTCGGACGAG AACTGTATCG CGGCGCGCAT TTTCACGCCG GTGAATTCGG CGTCATGCCG 
GTCGGGAACA ATGGCGAAAG TATGCATAAA ATCGCGTCAA CCAGCGGATT AATGGCGTCG 
TGCCGCCAGG CGCTGGCGCT GCCTGCCGAA GAGATGCCGC CTGCGGATGT GATCTTCGAA 
CGAATGGCGA CCGATGTTCA TCTGCGTGAG GCGGTCAATG ACTGGGCGCG TTATCTTTCA 
CGCGGCGTTT ACAGCGTGAT CTCTATGTTT GATCCGGGCG TGGTGCTGAT CGGCGGAGGA 
ATAAGCGAAC AGGAAAAGCT CTACCCGCTC CTGACGCGGC ATCTTGAAAC GTTTGAAATG 
TGGGAGGCGC TCCAGGTGCC GATTCAGCCC TGCCAACTGG GAAATCAGGC GGGCAGGCTG 
GGCGCCGTCT GGCTGGCGCA GCAAAAGCTC GATCGAAGCT AA

Protein sequence

MQQYIGIDVG GTHVKYGVIN SDGEELTHHQ FDTPEDASTF TRKWQDVVAR CQQDYDIAAI 
GVSFPGHINP HNGHAAKAGA LAYLDDVNLM ELFSGLTDLP LVVENDANCA ALGEMWRGAG 
QHYDNLVCIT IGTGIGGGII VGRELYRGAH FHAGEFGVMP VGNNGESMHK IASTSGLMAS 
CRQALALPAE EMPPADVIFE RMATDVHLRE AVNDWARYLS RGVYSVISMF DPGVVLIGGG 
ISEQEKLYPL LTRHLETFEM WEALQVPIQP CQLGNQAGRL GAVWLAQQKL DRS