Gene SNSL254_A2905 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2905
Symbol
ID	6484015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2841274
End bp	2842683
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	57%
IMG OID	642738224
Product	type I secretion outer membrane protein TolC family
Protein accession	YP_002041953
Protein GI	194442366
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID	[TIGR01844] type I secretion outer membrane protein, TolC family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.488456
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAGAG TCGCACCTGT CGCCATCGTA CTGGCATTTG CTTTGTTTCA TCACCAGCCC 
CGGGGCGCAG AATCGCTGCC AATTATCACA TCCGAAGGAT TAGCAACGGA CCAGATGCTT 
CCTTCGCTGG ATGGCTCCGC CGCTGAGTTG CCGCTCAGCG CCGCCGCGCC GGGCAACCTG 
ACGCTCAATG ACGCGGTCAA TCGCGCCGTT AACTGGCATC CTTCTATTCG CGAAGCCGTC 
GGCAAACTGC TCGCACAGAA TGAACAAATA GAGGTCGCCA AATCGAAATA TTATCCGCAA 
GTCAGTGCTG GCGTGAACAA TGGGTACAGC AATACCTACA CCGATCACGG GTATAGCCCC 
TCGCTGGTGC TGTCGGTATC GCAAATGCTT TATGACTTCG GCAAAGTGGC AAGCCAGGTT 
CGCGCCGAAA CCGCAGGCGC AGCACAGCAA CAGGCCAACG TGTTGCTCAG TATTGATACC 
GTCGCGCATG AAACCGCCAA CGCCATTGTA CAAACGCAGA GCTGGCAGCA AATGGTAGAA 
GCAGCGGAAG AACAGCTCAC CGCGCTGGAC GGCATCGGTA AACTTATCCG GCAGCGCAGC 
GATGAAGGCG CCACGTCGCT ATCTGACGTA GTGCAAACCG AAGCCAGAAT CGAATCCGCC 
CGCTCGCAAC TGGCGCAGTA TCAGGCCAAT CTCGACAGTG CGAAAGCCTC ACTGATGAGC 
TGGCTGGGCT GGAATTCGCT TAACGGCATC AATAATGACT TCCCGGCGAA ACTTGCTCGC 
AGCTGTGAGA CGGCGACTCC CGACGATCGA CTGGTGCCCG CGGTACTGGC CGCCTGGGCG 
CAGGCCAACG TTGCGCGGGC GAATCTGGAC TATGCCAGCG CGCAAATGAC GCCGACGATT 
TCGCTCGAAC CTTCTGTACA ACATTATCTT AATGATAAAT ATCCCAGTCA TGAAGTGCTG 
GATAAAACCC AGTATTCCAC CTGGGTAAAA GTTGAGATGC CGCTTTATCA GGGCGGAGGG 
CTGACTGCCC GACGCAACGC CGCCAGCCAT GCGGTAGACG CGGCTCAGTC GACCATTCAG 
CGCACCCGGC TTGATGTCCG CCAGAAACTG ATGGAGGCGC GCAGCCAGGC AATGAGTCTT 
GCCAGCGCGT TACAAATCCT TCGTCGGCAA CAGCAGCTTA GCGAACGCAC GCGCGAACTG 
TATCAGCAGC AATACCTTGA CCTCGGTTCC CGCCCGTTGC TCGACGTGCT TAATGCGGAG 
CAGGAAGTTT ACCAGGCGCG TTTTGCCGAA CTGCAAACGG AAAGCCAGTT GCATCAGTTG 
CAACTGAACT GTCTGTATAA CACCGGCGCG CTTCGTCAGG CGTTCGCGTT AAATCATCGC 
AGCATTCAAT CCGTGGAGAT CCAGCCATGA

Protein sequence

MGRVAPVAIV LAFALFHHQP RGAESLPIIT SEGLATDQML PSLDGSAAEL PLSAAAPGNL 
TLNDAVNRAV NWHPSIREAV GKLLAQNEQI EVAKSKYYPQ VSAGVNNGYS NTYTDHGYSP 
SLVLSVSQML YDFGKVASQV RAETAGAAQQ QANVLLSIDT VAHETANAIV QTQSWQQMVE 
AAEEQLTALD GIGKLIRQRS DEGATSLSDV VQTEARIESA RSQLAQYQAN LDSAKASLMS 
WLGWNSLNGI NNDFPAKLAR SCETATPDDR LVPAVLAAWA QANVARANLD YASAQMTPTI 
SLEPSVQHYL NDKYPSHEVL DKTQYSTWVK VEMPLYQGGG LTARRNAASH AVDAAQSTIQ 
RTRLDVRQKL MEARSQAMSL ASALQILRRQ QQLSERTREL YQQQYLDLGS RPLLDVLNAE 
QEVYQARFAE LQTESQLHQL QLNCLYNTGA LRQAFALNHR SIQSVEIQP