Gene SNSL254_pSN254_0098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_pSN254_0098
Symbol	traW
ID	4929529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_009140
Strand	+
Start bp	84789
End bp	86054
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	53%
IMG OID	642572397
Product	type IV conjugative transfer system protein TraW
Protein accession	YP_001101972
Protein GI	134047266
COG category
COG ID
TIGRFAM ID	[TIGR02742] type-F conjugative transfer system pilin assembly protein TrbC

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.122831
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGAT CATTGGCCGC GCATATCCCC TGTTCTAAGA GCGTTCTGGT GGCGTTGATG 
TTCTCTGTGG CTGGCGGGGC ATACGCTCAA GAGTCTCCGC TCACAGAGCA GGATAAGGCG 
CTTATTGAGC AAGGAAAGCA AATTGCCCAA AAGGCCCAGA AGATGGAAAT GCCATCTCTG 
TTGCAAAACC AACACATGGA CGAGGCTCAG GCCGAAGCCA AGGCATTTTT CAAGCAGCTC 
CAAACTACTA ACCCAACGCT CAAGGAGATG CACCGGAAAC AGGCTGAAAA GGGTATCTAC 
TCTGACCATC GGATACTGGT TTTCGCCTCG TTGTCTCTTG GCGAACAGGG GTTAGATGAC 
GTCCTAACGG CGGTGTCAGG CCAGCCTGAT TCTGTAATTG TGTTCCGTGG CATCCCGGAA 
GGAATGAACT TGGGGCAGGG AGTTAAAGCT ATTCAGGCGC TCGCGGCCAA AAAAGACCCA 
GTGCCGAACA TCATCATCAA CCCTACGTTG TTCAAAACGT ACAACATCAC AGCCGTTCCC 
ACGATTGTGA TGCTGGAGGA TGAGCCGCTG CCTGGCGAAC AACCAAACGT CGTCGCCCAG 
GTCTCCGGGT TGTCCGACCC GGTATGGTTG GCTCGGGAAG TGGATAACGG AGAAAAAGGC 
GATCTCGGCG TTAAGGGGCC GGTGGAGAAA ATCAGTGAGC CAGACCTTAT TGATGTTGCC 
AAGAAACGCC TTGCCAATAT CGACTGGGAA GAGAAGAAGA AACAGGCTAT AGAGCGCTTC 
TGGACCAAGC AGAATTTCAA TGAGCTGCCA AGAGCGCCAA AATCTCGAAC ACGAGAAATT 
GACCCTAGCG TCATGATCAC CAGTGACATC AGCACTCCGG ATGGCACTGT GTTCGCTCAC 
GCGGGTGACG TGATCAACCC ATTGTGCGAT CCGAAGGAAG TTTGCAAGCC TGGAACGCGG 
CCATTTACCC AAGCGGTCGT AGTTTTCGAC CCGCTGGACA AAAAGCAAAT GGAACTACTC 
GCCAAGAAGC TGCCTGAAAT CAAGCTGGAG CCTGGCGTAC AACGGATCAC CTATATCGCC 
ACAGAGTTCG ACAAAGACAA AGGCTGGGAT TCCTACAAGA GTGTCACCGA CAACTTTGAC 
GCGCCGGTAT ATCTGCTGAC GCCAGATCTG ATTACCCGGT TCGAGCTGGA GCACACACCG 
AGCGTCATTA CTGCCAGAGG CAAGAAGTTT GTTGTCCGCG AACTTGCTGA GGAGGGCGGT 
GAATGA

Protein sequence

MIRSLAAHIP CSKSVLVALM FSVAGGAYAQ ESPLTEQDKA LIEQGKQIAQ KAQKMEMPSL 
LQNQHMDEAQ AEAKAFFKQL QTTNPTLKEM HRKQAEKGIY SDHRILVFAS LSLGEQGLDD 
VLTAVSGQPD SVIVFRGIPE GMNLGQGVKA IQALAAKKDP VPNIIINPTL FKTYNITAVP 
TIVMLEDEPL PGEQPNVVAQ VSGLSDPVWL AREVDNGEKG DLGVKGPVEK ISEPDLIDVA 
KKRLANIDWE EKKKQAIERF WTKQNFNELP RAPKSRTREI DPSVMITSDI STPDGTVFAH 
AGDVINPLCD PKEVCKPGTR PFTQAVVVFD PLDKKQMELL AKKLPEIKLE PGVQRITYIA 
TEFDKDKGWD SYKSVTDNFD APVYLLTPDL ITRFELEHTP SVITARGKKF VVRELAEEGG 
E