Gene SNSL254_A2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2137
Symbol
ID	6486032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2065989
End bp	2067212
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	61%
IMG OID	642737492
Product	flagellar hook-length control protein
Protein accession	YP_002041239
Protein GI	194443282
COG category	[N] Cell motility
COG ID	[COG3144] Flagellar hook-length control protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.000644258
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCACCC TGCCCCAACT GATCACCACC GATACCGACA TGACCGCGGG TCTGACGTCA 
GGAAAAACCA CCGGTTCAGC CGAGGACTTT CTGGCGCTCC TGGCGGGCGC GTTAGGCGCA 
GACGGCGCAC AGGGCAAAGA CGCCCGCATC ACGCTGGCCG ATTTACAGGC GGCAGGCGGC 
AAGTTATCGA AAGAGCTACT GACCCAACAT GGCGAGCCGG GCCAGGCGGT GAAGCTTGCC 
GACCTGCTGG CGCAAAAAGC GAATGCGACG GATGAAACGC TTACCGATCT GACACAAGCG 
CAGCATCTAC TGTCTACGCT AACGCCATCG TTGAAAACCA GCGCTCTGGC CGCATTGAGT 
AAAACGGCGC AGCATGATGA GAAAACGCCC GCGCTGAGCG ATGAGGATCT TGCCAGTCTG 
AGCGCCTTAT TCGCCATGCT GCCCGGACAA CCTGTCGCGA CGCCTGTCGC CGGAGAGACG 
CCGGCTGAAA ATCACATCGC CTTGCCGTCA CTGTTGCGCG GCGACATGCC ATCGGCGCCG 
CAGGAAGAGA CACATACGCT CTCTTTTAGC GAGCATGAAA AAGGGAAAAC CGAGGCATCG 
CTTGCGCGCG CCAGCGACGA TCGCGCCACG GGTCCAACAC TGACGCCGCT GGTGGTCGCT 
GCCGCCGTGA CCAGCGCGAA AGTGGAGGTG GATAACCCGC CCGCGCCAGT AACGCATGGC 
GCGGCAATGC CGACGCTCAG CAGCGCCACG GCGCAACCGC AACCGCTACC TGTCGCCTCA 
GCCCCGGTAC TCAGCGCGCC GTTAGGCAGC CATGAATGGC AGCAAACGTT CAGTCAGCAG 
GTCATGTTAT TTACGCGTCA GGGACAGCAA AGCGCGCAGC TTCGATTGCA TCCGGAAGAG 
TTAGGTCAGG TGCATATTTC GCTCAAGCTG GATGACAATC AGGCGCAGCT CCAGATGGTA 
TCGCCGCACA GCCATGTCCG CGCCGCGCTG GAAGCCGCCC TGCCCATGTT GCGCACTCAG 
TTGGCGGAAA GCGGCATCCA GTTGGGACAA AGCAGCATCA GTAGCGAAAG CTTTGCCGGA 
CAGCAGCAGT CTTCATCGCA ACAACAGTCT TCCCGCGCCC AACACACGGA CGCGTTTGGC 
GCTGAAGATG ACATAGCGTT AGCGGCGCCG GCCTCGCTTC AGGCCGCCGC GCGCGGCAAT 
GGCGCAGTGG ATATCTTCGC CTAA

Protein sequence

MITLPQLITT DTDMTAGLTS GKTTGSAEDF LALLAGALGA DGAQGKDARI TLADLQAAGG 
KLSKELLTQH GEPGQAVKLA DLLAQKANAT DETLTDLTQA QHLLSTLTPS LKTSALAALS 
KTAQHDEKTP ALSDEDLASL SALFAMLPGQ PVATPVAGET PAENHIALPS LLRGDMPSAP 
QEETHTLSFS EHEKGKTEAS LARASDDRAT GPTLTPLVVA AAVTSAKVEV DNPPAPVTHG 
AAMPTLSSAT AQPQPLPVAS APVLSAPLGS HEWQQTFSQQ VMLFTRQGQQ SAQLRLHPEE 
LGQVHISLKL DDNQAQLQMV SPHSHVRAAL EAALPMLRTQ LAESGIQLGQ SSISSESFAG 
QQQSSSQQQS SRAQHTDAFG AEDDIALAAP ASLQAAARGN GAVDIFA