Gene SNSL254_A1747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1747
Symbol
ID	6484831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1717646
End bp	1718872
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	39%
IMG OID	642737127
Product	secreted effector protein
Protein accession	YP_002040879
Protein GI	194442907
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG3240] Phospholipase/lecithinase/hemolysin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.343873
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	0.229892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTGA GTGTTGGACA GGGTTATTTC ACATCATCTA TCAGTTCTGA AAAATTTAAT 
GCGATAAAAG AAAGCGTACG CCTTCCGGAA TTAAGTTTAT GGGAGAAAAT CAAAGCATAT 
TTCTTTACCA CCCACCATGC AGAGGCGCTC GAATGTATCT TTAATCTTTA CCACCATCAG 
GAACTGAATC TAACACCGGT ACAGGTTCGC GGAGCCTACA TCAAACTTCG AGCCTTAGCG 
TCTCAGGGAT GTAAAGAACA GTTTATTATA GAATCACAGG AACACGCCGA TAAGTTGATT 
ATTAAAGATG ATAATGGTGA AAATATTTTA TCTATTGAGG TTGAATGTCA TCCGGAAGCT 
TTTGGTCTTG CCAAAGAAAT CAATAAATCA CATCCCAAGC CCAAAAATAT TTCTTTGGGT 
GATATTACCA GACTGGTATT TTTTGGCGAC AGCTTGTCTG ACTCCTTAGG GCGTATGTTT 
GAAAAAACAC ATCATATCTT ACCCTCCTAT GGTCAATACT TTGGCGGAAG GTTTACTAAT 
GGATTTACCT GGACTGAGTT TTTATCATCT CCACACTTCT TAGGTAAAGA GATGCTTAAT 
TTTGCTGAAG GGGGAAGTAC ATCGGCAAGC TATTCCTGCT TTAATTGCAT CGGTGACTTT 
GTATCAAATA CGGACAGACA AGTCGCATCT TACACCCCTT CTCACCAGGA CCTGGCGATA 
TTTTTATTGG GGGCTAATGA CTATATGACA CTACACAAAG ATAATGTAAT AATGGTCGTT 
GAGCAACAAA TTGATGATAT TGAAAAAATA ATTTCCGGTG GAGTTAATAA TGTTCTGGTC 
ATGGGGATTC CCGATTTGTC TTTAACACCC TATGGCAAGC ATTCTGATGA AAAAAGAAAA 
CTTAAGGATG AAAGCATCGC TCACAATGCC CTGCTAAAAA CTAATGTTGA AGAATTAAAA 
GAAAAATACC CCCAGCATAA AATATGCTAT TACGAGACTG CCGATGCATT TAAGGTGATA 
ATGGAGGCGG CCAGTAATAT TGGTTATGAT ACGGAAAACC CTTATACTCA CCACGGCTAT 
GTACATGTTC CCGGGGCTAA AGACCCTCAG CTAGATATAT GTCCGCAATA CGTCTTCAAC 
GACCTTGTCC ATCCAACCCA GGAAGTCCAT CATTGTTTTG CCATAATGTT AGAAAGTTTT 
ATAGCTCATC ATTATTCCAC TGAATAA

Protein sequence

MPLSVGQGYF TSSISSEKFN AIKESVRLPE LSLWEKIKAY FFTTHHAEAL ECIFNLYHHQ 
ELNLTPVQVR GAYIKLRALA SQGCKEQFII ESQEHADKLI IKDDNGENIL SIEVECHPEA 
FGLAKEINKS HPKPKNISLG DITRLVFFGD SLSDSLGRMF EKTHHILPSY GQYFGGRFTN 
GFTWTEFLSS PHFLGKEMLN FAEGGSTSAS YSCFNCIGDF VSNTDRQVAS YTPSHQDLAI 
FLLGANDYMT LHKDNVIMVV EQQIDDIEKI ISGGVNNVLV MGIPDLSLTP YGKHSDEKRK 
LKDESIAHNA LLKTNVEELK EKYPQHKICY YETADAFKVI MEAASNIGYD TENPYTHHGY 
VHVPGAKDPQ LDICPQYVFN DLVHPTQEVH HCFAIMLESF IAHHYSTE