Gene SNSL254_A2951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2951
Symbol
ID	6486463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2876970
End bp	2877980
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	45%
IMG OID	642738268
Product	phage integrase
Protein accession	YP_002041997
Protein GI	194445766
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.339524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	3.4545800000000002e-18
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGGTTC GTAAAATAGA CTCTGGCGAA TGGCTATGCG ACCTGCGGCC TACTGGCGTC 
AAGGGAAAAC GCATTCGCAA AAAATTTGCC ACTAAAGGCG AAGCGCTGGC TTATGAAAAA 
TACATTGCCA GCGAAATGGA AGAAAAGCCA TGGTTAGGTG AAAAGCAAGA TAATCGACGA 
CTATCAGAAC TGATTGAACA GTGGCACGAC CTTTACGGCC GTACACTCTC TGATGCGGAT 
CGGATGATGT CAAAATTGAA AGGTATCTGT GCGGGCATGG GCGATCCCAT AGCGGCACAA 
ATCACATCCG CAGATTTTAG CCAATATCGT GAGGGCCGAT TAAAAGGTGA AATTCCCGAT 
GTTAACGGTC GACTAATGCC GATACAGCCC CAGACGGTAA ATCATGAGCA GCGCAACCTC 
TCAGCTGTAT TTGGTACGCT AAAAAAACTG GGGCACTGGT CATTACCTAA TCCTCTGGCA 
GGTATTCCAA CATTCAAAGT TGATGAAAAA ATGGTTTCTT TTTTGTACCC AGAAGAGATC 
AAAAGCCTGC TGCAATACCT ATCAGAATCA AGCAGTGATA GCGTACTTAT AATCACCAAA 
ATCTGCTTGG CTACAGGGGC CAGATGGAGT GAGGCCGAAA ATTTAGAAGG TGCGCAGGTC 
ACGCCGTATC GGATAACCTA CAAGAACACC AAAAATGGAA GAGTCAGATC GATTCCTATC 
TCGAAAGAAC TGTATGACGA AATTCCGAAA AAACGTGGGC GTTTGTTCAC GCCATGCCGT 
AAGACTTTTG AACGAGTAGT GGCTAAAGCG GGCATTGAGT TACCTGACGG GCAATGCACA 
CACGTACTGC GTCATACATT TGCCAGTCAT TTTATGATGA ACGGTGGAAA CATCCTTGTC 
CTCAAAGAAA TACTTGGGCA TTCAGATATA AAAATGACAA TGATTTACGC ACATTTCGCG 
CCTACACATT TAGAAGATGC TGTACTTAAA AACCCTTTGG CTAACCTTTA A

Protein sequence

MAVRKIDSGE WLCDLRPTGV KGKRIRKKFA TKGEALAYEK YIASEMEEKP WLGEKQDNRR 
LSELIEQWHD LYGRTLSDAD RMMSKLKGIC AGMGDPIAAQ ITSADFSQYR EGRLKGEIPD 
VNGRLMPIQP QTVNHEQRNL SAVFGTLKKL GHWSLPNPLA GIPTFKVDEK MVSFLYPEEI 
KSLLQYLSES SSDSVLIITK ICLATGARWS EAENLEGAQV TPYRITYKNT KNGRVRSIPI 
SKELYDEIPK KRGRLFTPCR KTFERVVAKA GIELPDGQCT HVLRHTFASH FMMNGGNILV 
LKEILGHSDI KMTMIYAHFA PTHLEDAVLK NPLANL