Gene SNSL254_A0484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0484
Symbol
ID	6482851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	494651
End bp	496162
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	43%
IMG OID	642735905
Product	hypothetical protein
Protein accession	YP_002039679
Protein GI	194443482
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.0325737
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAATTA AATTCTTATC ATTATGTATT TTAGCGGGTG TTTTATTTGT TAGCCAGGTG 
AATGCTTCAG CGAACAACGG TAAAGATGAT GTAAAATATG CTGCGCTTAC CCAGAAGGAT 
CTTGATGCTT TGCCTGTGGA AAAAAGAGCT TCGGTTCTGG ATGAACTGGG GTTTATCCAT 
GAATACGGTA TTGGTGTACC GATGAATCGC GAACGGGCGT TGCAGTATTA CAAGCAGGCC 
TGTGAACTTG GCGGTAACTA TGGTTGCTAT AATGTGAAGT ATGCTTATCA GTATGGCGAC 
GGAGTGGCGA AAGATAGCGC TCAGGCCAAT AAGTATGCTA AGAAAATGAA TCTGGATAAT 
TTATTGATTG AGCAAGAATA TATTGATAAG TTTTCGCAAG AAATTTACAT GGCAAAAGCA 
TTGGCCGATA CGGATAAATC GCAGCGGGCG GCATTTATTA GTATACTAAT TCATGCTCTA 
AATAATAGAC CCGAGAGCGA TGCGCTTTTT TTTAGCCGTA TTGGATTTAA CCAGGAAAAA 
ACATTTCGGC TGGCTACGTT ATGGTCGCAG GATGGCGACC CGCAAATGGA TTATCAGATG 
GGGCGACTCA CCCTTAATGA CTTTTCCGGT CGCTATGCGG ACGAGCCTTA TCAAGCCAGA 
CCTGCGTCAT TGAAGTGGTT TCGCGCCGCC GCGGAAAAAG GCGTCGTTGA GGCCCAATCT 
CTCTTGGGGA GTATTTATTC GGGGGGAGAG GGCGATGAGT GGGGGATTAA GCCAGACATT 
CAGGAAGCAC AAAAATGGTA TGGACAGGCG GCTAAGCAGG GGGACAGCGA TGCACAGATT 
GCGTTAGGTA AAATCTATTA TTCTGGCGCA ACAGGGCGCA CTGATTACGC TAAAGCGCTG 
GCATTATTTA CGCAGGTTGA AAATGATGGT ACTAATTCGC GCTCAACGAT GCCGTTGAGT 
TGGATGTATT ATAACGGTTT AGGTACTGCA CCTGATTGTG ATAAAGCCTG GTCGTATTAC 
AAGAAAGCAT CTCGATATGT AGGTAAGATG GTTGAGGAAA AAATATTTTT AAGTAAGTGC 
GCAGCGGATA TTCAGAGTCG AAAAAACAAC GCGGATGCTT TACCTAAAGT AACGCTAAAA 
AAAGAGAGTG TTTTCTCTCG CGGGATAACG GCTAAACCGA AAGAATGCGC ACTAATTTTT 
CAGATTGGCA CAGATAAAAT CCGTAACATG GCGAATTTGC ATATTACGCT TGAGCTGAAA 
AATGATGATG GAATGGCAAC TGAGGAAACG TTGATGATTC CGCCATTCGG TTTGAATACT 
CTGGGGATAG ATATGCAAAA TCATGATGTT GATCCTCTCA TTACCACATA CGATCTCCCG 
CTGTATACGC AAGATTTTTG TCACGGGATC GGCGATATCC ATTTTACGCT GAAATCCGCT 
ACGGCAACGA TTAACGGTAA GAATGTCGAT TTACTGAAAG CTGATAGTGT GCGCTTTTTA 
GATAAAGAAT AA

Protein sequence

MKIKFLSLCI LAGVLFVSQV NASANNGKDD VKYAALTQKD LDALPVEKRA SVLDELGFIH 
EYGIGVPMNR ERALQYYKQA CELGGNYGCY NVKYAYQYGD GVAKDSAQAN KYAKKMNLDN 
LLIEQEYIDK FSQEIYMAKA LADTDKSQRA AFISILIHAL NNRPESDALF FSRIGFNQEK 
TFRLATLWSQ DGDPQMDYQM GRLTLNDFSG RYADEPYQAR PASLKWFRAA AEKGVVEAQS 
LLGSIYSGGE GDEWGIKPDI QEAQKWYGQA AKQGDSDAQI ALGKIYYSGA TGRTDYAKAL 
ALFTQVENDG TNSRSTMPLS WMYYNGLGTA PDCDKAWSYY KKASRYVGKM VEEKIFLSKC 
AADIQSRKNN ADALPKVTLK KESVFSRGIT AKPKECALIF QIGTDKIRNM ANLHITLELK 
NDDGMATEET LMIPPFGLNT LGIDMQNHDV DPLITTYDLP LYTQDFCHGI GDIHFTLKSA 
TATINGKNVD LLKADSVRFL DKE