Gene SNSL254_A3243 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3243
Symbol
ID	6482280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3156001
End bp	3157023
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	58%
IMG OID	642738541
Product	HTH-type transcriptional regulator AscG
Protein accession	YP_002042263
Protein GI	194445314
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0000054765
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATGGCGA CAATGCTGGA TGTTTCCCGC CATGCGGGCG TATCAAAGGC CACCGTCTCA 
CGAGTGCTGA ATGGGACGGG GCAGGTAAAA GAAAGTACGC GCCAGAAAGT GTTTACGGCG 
ATGCAGGCTC TGGGCTATCG CCCCAACCTG CTGGCACGCT CGCTGGCGAA TCGCACCAGC 
AACAGCATCG GTCTGGTCGT CTCTACGTTT GACGGCTTCT ATTTTGGCAG TTTGTTGCGC 
CGGGCGTCGC GCCAGGCGGA GTCTCATAAC AAGCAGTTGA TCGTCACCGA TGGTCACGAT 
ACGCCGGAAC GAGAGCAGAA AGCCGTACAA ATGTTGGCCG ACAGACAGTG CGACGCTATT 
ATTCTTTACA CTCGCTATAT GGATGAGCCG GCGATTTTGT CGTTGATTGA CGCCACGGAA 
ATGCCGCTGG TGATTATTAA TCGCAACGTC ACTCAGGCCC GCGATCGCGC TATTTTCTTC 
GAGCAGGAGA CGGCGGCATT CCAGGCGGTG GAATACCTGA TTACGCAGGG CCATCGCGAT 
ATCGCCTGTA TTACGCTGCC TGTTCATACT CCCACCGGCA CATCACGCGT AGCGGGTTAT 
CGAAAGGCGC TGGAAAAATA TGGCATTCCC TGGCAACCGG CAAAAGTGAA ATACGGCGAT 
TACACGCTGA CGCGCGGCTA TGACGCCTGC CGGGAATTAC TGGAGGAAGG CGTCACGTTT 
AGCGCGCTAT TCGCCTGTAA TGATGACACG GCGCTGGGCG CGGCAAAAGC GCTGCGCCAG 
GCCGGATTAC GCATCCCGCA GGATGTGTCG CTGTTTGGTT TTGACGATGC GCCGGGCGCA 
ACCTGGCTTG AACCGGGGCT TTCAACAGTC TATTTACCCA TCGAGGATAT GATAGCCACC 
GCGATCGATC AGGCCGTTCG TCTGGCGAAC AGCGAGCCGG TCGCCCCGAT CCCGCCCTTT 
ACCGGCACGC TGATTCTGCG CGAGTCCGTC GCCGCGGGCC CGTTTTTTCA ACGTCCGGCC 
TAA

Protein sequence

MMATMLDVSR HAGVSKATVS RVLNGTGQVK ESTRQKVFTA MQALGYRPNL LARSLANRTS 
NSIGLVVSTF DGFYFGSLLR RASRQAESHN KQLIVTDGHD TPEREQKAVQ MLADRQCDAI 
ILYTRYMDEP AILSLIDATE MPLVIINRNV TQARDRAIFF EQETAAFQAV EYLITQGHRD 
IACITLPVHT PTGTSRVAGY RKALEKYGIP WQPAKVKYGD YTLTRGYDAC RELLEEGVTF 
SALFACNDDT ALGAAKALRQ AGLRIPQDVS LFGFDDAPGA TWLEPGLSTV YLPIEDMIAT 
AIDQAVRLAN SEPVAPIPPF TGTLILRESV AAGPFFQRPA