Gene SNSL254_A4878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4878
Symbol
ID	6485995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4747166
End bp	4749019
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	44%
IMG OID	642740089
Product	hypothetical protein
Protein accession	YP_002043766
Protein GI	194443238
COG category	[S] Function unknown
COG ID	[COG3472] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACGT TTGACACGAC GAAAATTGCT TTAAAAGATA TCCTGGGGCA GATTACTGAT 
GGACGGGTAC AGTTGCCTGA TTTCCAGAGA GGGTGGGTAT GGGATGATGA GCATGTCCGG 
TCTTTGCTGG TCAGTATTGC CCGTTCTTTT CCCGTTGGTG CGGTTATGCT GCTGGAGACT 
GGGGGAGAAG TTCGCTTCCA GGTGCGTCCA GTTGAAAATG TAGAATTGCA GAAAACCGAG 
CCTGAGATGT TGATTCTGGA TGGCCAGCAA CGTTTAACGT CCTTGACTCA AGTCCTGATG 
CTGGATACGC CCGTTAAGAC TTTTAACGAG AAAGGAAAGC AGATAGACCG TTTTTATTAT 
ATTGATATTG AGGCCGCTCT GGACAATAGG CTTGATGAAG CTTTTATTTC TGTTGAAAAG 
TCTAAAAAAG TAACGATGAA TTTTGGTCGT GATATAAAAA CTTTTGTTAA CTCCTTTGGA 
GAAACGGTTG AAATGGATTT TTCTACCGTG CAAAAAGAGT GCGAAGCATT ATTTTTCCCT 
TGTAACCAAA TTATCAACTC TGATGCATGG GAAAGTCATT TATATAAGTG CTCACAAGAA 
AAGTTTTTCA CTTATATGCA GTTCCGTGAA AAAATTCTGA ATGCCTTTAG GAACTATTTG 
CTGCCTGTTA TTAAATTGGG TAAATCAACT AGCAAAGAGG CCGTTTGCCT GGTGTTTGAA 
AAGGTTAATA CCGGTGGTGT TCCACTATCC GTATTTGAAC TGGTGACCGC CAGTTTTGCG 
GCTGATGGGT TTAATCTTCG GGATGACTGG TTTGGCAGTA ATTTGCGTCA AAAATTTGGC 
CGCCGAAATG TACTGAATAA AGAAGCTATC CTACAGGGCG TAGAGCCGAC TGACTTTTTA 
CAGGCTATCA GCATATTGAA TACGCTAAAA AAACGGCGTG CCGATCTGGC CGAAGGGAAG 
ACAGGGAAAT CAGTTACTGC AGTAAGTGCT AAACGAGTTT CAGTATTAGC CCTTTCTCTT 
GAAGATTATC ATTGCTGGGC CGACGATGTG GAAAAAGGCT TCTTACTTGC CGCTAAATTT 
CTCCATCATG AATGTTTTAT GCACTCATGG GATCTTCCTT ATCGTACGCA GCTTGTGCCG 
CTGGCGGCAG TATTATCGAA ATTACAAGGC AATTGGCTGG AGCCCAAAAT TTATGACAAA 
CTGGCGCGCT GGTTCTGGTG CGGTGTCCTG GGGGAACTGT ACGGCGGCGC GGTAGAAACA 
CGTATCGCAA ACGATGTGGA AGAGTTACTA AACTGGATTG AGGGGGAAGG TGAAGAGCCC 
CGGACGATTT ATGAAGCCTC ATTCCAGCCA GGGCGTTTAT TGACGTTACG TTCCCGATTG 
AGCGCCGCGT ATAAAGCGTT AAGCGTGTTG ATCCTACGCA ATGGTGCTCA AGACTTTTTC 
TGGAAGTCGA CGATCCAAAA GTTAGATTAT GGTGAGATTG CACTCGATAT TCACCATATT 
TTCCCAAAGA TATGGTGCGA GAATAATAAT ATTAGTCCAG CAGTGTATAA CTCTATCATT 
AATAAAACAT CAATCTCCTA TAAGGCCAAC CGAATGATTG GTGGGAGATC TCCGGCTGAG 
TATCTGTCGC AGATCCAGAC GCATCAGCAG GTCGGTCTGG AGGATGCCGA GATGGATGCG 
ATCCTGCGTA GCCATTTTAT TGAGCCTTCG TTGTTACGGC AGGATAGTTT TGAGGCATTT 
TTTGCCGATC GAAAAAAACA ATTGCTGAAA TTGATCGAAG CGGCAATGGG GAAAAATATT 
AGTCAGGATG ATGTTGCTGA ATTAGAGACA GCAACAGACG AGATTGATGT CTGA

Protein sequence

MSTFDTTKIA LKDILGQITD GRVQLPDFQR GWVWDDEHVR SLLVSIARSF PVGAVMLLET 
GGEVRFQVRP VENVELQKTE PEMLILDGQQ RLTSLTQVLM LDTPVKTFNE KGKQIDRFYY 
IDIEAALDNR LDEAFISVEK SKKVTMNFGR DIKTFVNSFG ETVEMDFSTV QKECEALFFP 
CNQIINSDAW ESHLYKCSQE KFFTYMQFRE KILNAFRNYL LPVIKLGKST SKEAVCLVFE 
KVNTGGVPLS VFELVTASFA ADGFNLRDDW FGSNLRQKFG RRNVLNKEAI LQGVEPTDFL 
QAISILNTLK KRRADLAEGK TGKSVTAVSA KRVSVLALSL EDYHCWADDV EKGFLLAAKF 
LHHECFMHSW DLPYRTQLVP LAAVLSKLQG NWLEPKIYDK LARWFWCGVL GELYGGAVET 
RIANDVEELL NWIEGEGEEP RTIYEASFQP GRLLTLRSRL SAAYKALSVL ILRNGAQDFF 
WKSTIQKLDY GEIALDIHHI FPKIWCENNN ISPAVYNSII NKTSISYKAN RMIGGRSPAE 
YLSQIQTHQQ VGLEDAEMDA ILRSHFIEPS LLRQDSFEAF FADRKKQLLK LIEAAMGKNI 
SQDDVAELET ATDEIDV