Gene SNSL254_pSN254_0110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_pSN254_0110
Symbol
ID	4929526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_009140
Strand	+
Start bp	97249
End bp	98259
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	52%
IMG OID	642572409
Product	putative phage-type endonuclease
Protein accession	YP_001101984
Protein GI	134047100
COG category	[L] Replication, recombination and repair
COG ID	[COG5377] Phage-related protein, predicted endonuclease
TIGRFAM ID	[TIGR03033] putative phage-type endonuclease

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	0.300181
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATAG TCAACCTATC GCAACGCGAG GAAGATTGGC TTGATTGGCG GCGTCAAGGT 
GTAACAGCCA CTGACGCCGC TATCCTGCTC AATCGGTCTC CGTACAAAAC ACGATGGAGA 
CTGTGGGCCG AGAAGACTGG GTATGCGCGT GAAGTCGATC TGAGTCTTAA TCCGCTGGTT 
CGCCGGGGGA TAGAAAACGA AGATGCTGCA AGACGCGCTT TCGAGGAGAA GTATGATGAC 
ATGCTGCTCC CCGCCTGTGT CGAATCGGTT CAATACCCGC TCATGAGGGC CTCCCTGGAT 
GGCCTGAGAG ATAACGGGGA GCCCGTCGAG CTGAAAAGCC CGAGTGCGAC TGTCTGGGAA 
GATGTTTGTG CTGAGAAAGC AAACAGCAAG GCATACCAGC TTTATTACCC GCAGGTGCAA 
CACCAGCTCC TGGTAACGGG GGCCAAGCAA GGCTGGTTAG TCTTCTACTT TGAAGGTCAG 
ATTCAGGAGT TTCCAATACT CCGAGACGAA GCCATGATTC AAGAAATCTT GGCCGAGGCT 
AAAAAGTTCT GGCAACAGGT AGTAGACAAG AAGGAGCCCG ACAAAGATCC AGAGAGAGAC 
CTGTACATAC CGCAAGGTGA AGAGGTCAAC CGTTGGATTG CTGCTGCTGA GGAATACCGC 
CTCTATGATG CAGAGATTCA GGAGCTGAAA CAGCGACTGT CTGAGCTTCA AGAAAGGCAA 
AAGCCTCATC TCGACACCAT GAAGTCCCTC ATGGGGGAAT ACTTCCATGC CGACTACTGC 
GGTGTGATGG TAACGAGATA CAAAGCGGCT GGCCGGGTAG ACTACAAAAA GCTGTTGGCT 
GATAAGGCGT CAGGCGTGAA GCCTGAGGAT GTTGACCAGT ACAGAGAGAA GTCATCAGAG 
CGGTGCCGTG TAACGGTTAC TGGCTCTGTG AAGCCACGGT ACATTGTTGA TGAGGACGTG 
CTTGCTCCTC TTGATGATTT GCCGGAAGAA GTAGAGACGT TCTACTGGTG A

Protein sequence

MKIVNLSQRE EDWLDWRRQG VTATDAAILL NRSPYKTRWR LWAEKTGYAR EVDLSLNPLV 
RRGIENEDAA RRAFEEKYDD MLLPACVESV QYPLMRASLD GLRDNGEPVE LKSPSATVWE 
DVCAEKANSK AYQLYYPQVQ HQLLVTGAKQ GWLVFYFEGQ IQEFPILRDE AMIQEILAEA 
KKFWQQVVDK KEPDKDPERD LYIPQGEEVN RWIAAAEEYR LYDAEIQELK QRLSELQERQ 
KPHLDTMKSL MGEYFHADYC GVMVTRYKAA GRVDYKKLLA DKASGVKPED VDQYREKSSE 
RCRVTVTGSV KPRYIVDEDV LAPLDDLPEE VETFYW