Gene SNSL254_A1129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1129
Symbol
ID	6486973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	1135987
End bp	1137006
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	48%
IMG OID	642736531
Product	site-specific recombinase, phage integrase family
Protein accession	YP_002040289
Protein GI	194444962
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	5.3601e-24
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGGCGCA GAAGAAAAGA TCTGGGCGAT GTCAAGCTCC CCCCACGCGT ATCAAAAACC 
AGAACCCGTT ACTACTACAA ACCCACGTCG CGGGAAACTG TGACACTGGG GCCAATCACT 
CTCACTATGT CGGCATTATG GAAACGGTAC GAGGAAGAAC GGCGCAATTA CTCAGATGTA 
ATGACGTTCG AAAAGCTCTG GAAGATGTTT CTTAAAAGCG CCTACTACAC CGAGCTTGCA 
ATACGAACCC AGCGGGATTA TTTGCAACAT CAGAAAAAAT TGCTTGCCGT GTTTGGTAAA 
GTTAAAGCTG ATGTAATAAA GCCAGAAGAT GTGCGTCAGT TTATGGATCG TCGTGGACTG 
CAAAGTAAAA ACCAGGCCAA CCAGGAAATG AGCAGCATGT CACGTGTTTA CCGCTGGGGG 
TATGAACGCG GTTACGTTAA GGGAAATCCG TGTGCCGGCG TCAGTAAATT CTCTCTCAAG 
GCTCGCGAGC AATACATCAC TGACGAAGAC TACCTGGCTA TTTATAAGCA TGCTGATCAC 
GTTGTCAGGG CTGCAATGGA AATTTCTTAC CTGTGCGCCG CCAGGCAAGC TGACGTACTC 
GCTCTGCGCT GGATGCAAAT TTCTGATAAG GGGATTTTTA TCCAGCAAGG AAAGACCGGA 
AAAAAACAGA TTAAGGTCTG GACTCCCCGC CTTCAGCAAG CGCTGAAAAC AGCACAGACA 
GAATGTCCAA AACTGTCACC TGACGCGCTG GTTCTCTACA ACAACGATCG TGGTCAGTTC 
ATCCGCAAGA CGTTCAATAA TCGCTGGTTA AAAGCTGTAC GCGCCGCACA AAGTGAACTG 
GGCCGACAAC TGGATTACAC ATTCCACGAT ATCAAGGCAA AAGCTATTTC AGATTTTGAG 
GGTAGTAGCA GGGATAAGCA GATTTTCAGC GGCCACAAAA CAGAAAGCCA GGTGCTTATC 
TACGACAGGA AGGTACAAAT CAGCCCGACA CTGGATCGTC CGGTTATTGG GGAAAAGTGA

Protein sequence

MGRRRKDLGD VKLPPRVSKT RTRYYYKPTS RETVTLGPIT LTMSALWKRY EEERRNYSDV 
MTFEKLWKMF LKSAYYTELA IRTQRDYLQH QKKLLAVFGK VKADVIKPED VRQFMDRRGL 
QSKNQANQEM SSMSRVYRWG YERGYVKGNP CAGVSKFSLK AREQYITDED YLAIYKHADH 
VVRAAMEISY LCAARQADVL ALRWMQISDK GIFIQQGKTG KKQIKVWTPR LQQALKTAQT 
ECPKLSPDAL VLYNNDRGQF IRKTFNNRWL KAVRAAQSEL GRQLDYTFHD IKAKAISDFE 
GSSRDKQIFS GHKTESQVLI YDRKVQISPT LDRPVIGEK