Gene SNSL254_A2952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2952
Symbol
ID	6485823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2878326
End bp	2879519
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	48%
IMG OID	642738269
Product	phage integrase family protein
Protein accession	YP_002041998
Protein GI	194442793
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	3.20289e-17
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCACGGA CAACACGCCC CCTTACCAAC ACCGAAGTTC TGCGCGCTAA AGCGTTAGAG 
AAGGATCTAA CGCTGCATGA TGGCGATGGC CTTTTCCTGA TAGTGAAAAC CAGCGGGAAA 
AAGCTCTGGC GTTTCCGTTA TCAACGTCCA GCGACAAAAC AGCGGACAAT GATGGGGCTT 
GGTGCTTTCC CTGCCCTTTC ACTTGCTGAC GCCCGAGGGT TAAGAGCGGA TTACCTTGCC 
TTGTTAGCCA ACGGAATTGA CCCACAAATT CAGGCCGAAG TTGTAGAGGA ACAGCAACAA 
ATCGCTCTGG ACAGTATTTT CTCAACAGTC GCCGCTAACT GGTTCCAGCT CAAAAGTAAA 
AGCGTTACCC CTGATTACGC AAAAGACATT TGGCGTTCAT TGGAGAAAGA TGTATTCCCT 
GCCATCGGTG AGATCCCCGT TCAGCAAATC AAAGCCCGAA TATTGGTTGA AGCACTGGAG 
CCAATCAAAG CTCGTGGAGC GCTTGAGACT GTACGTCGAC TAGTGCAGCG TATTAACGAG 
ATAATGATTT ATGCCGTAAA CACGGGTCTG ATTGATGCCA ATCCAGCATC AGGTATTGGA 
ATGGCCTTTG AGAAGCCCAA AAAACAAAAC ATGCCGACGC TGCGGCCAGA AGAATTGCCG 
AAGCTGATGC GTTCTTTAGT CATGTCAAAT CTGTCTGTTC CGACTCGCTG TCTCATTGAA 
TGGCAACTCC TGACGCTCGT GCGCCCTTCT GAGGCTTCCG GTGCTCGGTG GGCGGAGATC 
GATCTCTATG CAAAGCTCTG GACTATTCCA GCCGAACGGA TGAAAGCGAA GCGCGAGCAT 
ATTGTACCGC TATCTCCTCA GGCATTAGAG ATTCTGGAAG TCATGAAGCC AATCAGTGCT 
CATCGTGAAC ATGTTTTTCC GAGTCGGAAT GACCCAAAGC AACCAATGAA TAGCCAGACG 
GCAAATGCTG CTTTAAAAAG GATTGGATAT GGAGGTAAAT TAGTAGCACA TGGTTTGCGC 
GCAATAGCGA GTACTGCAAT GAATGAAGCA GGTTTGAATT CAGATGTGAT TGAAGCAGCA 
CTTGCTCACA TTGAGAAAAA TGAGGTCCGG AGAGCATACA ATCGCTCAAC TTACCTTGAA 
AGAAGAAAGG AACTTATGAG TTGGTGGGGT AATTTCATAG TGAATAGCAA GTAA

Protein sequence

MARTTRPLTN TEVLRAKALE KDLTLHDGDG LFLIVKTSGK KLWRFRYQRP ATKQRTMMGL 
GAFPALSLAD ARGLRADYLA LLANGIDPQI QAEVVEEQQQ IALDSIFSTV AANWFQLKSK 
SVTPDYAKDI WRSLEKDVFP AIGEIPVQQI KARILVEALE PIKARGALET VRRLVQRINE 
IMIYAVNTGL IDANPASGIG MAFEKPKKQN MPTLRPEELP KLMRSLVMSN LSVPTRCLIE 
WQLLTLVRPS EASGARWAEI DLYAKLWTIP AERMKAKREH IVPLSPQALE ILEVMKPISA 
HREHVFPSRN DPKQPMNSQT ANAALKRIGY GGKLVAHGLR AIASTAMNEA GLNSDVIEAA 
LAHIEKNEVR RAYNRSTYLE RRKELMSWWG NFIVNSK