Gene EcSMS35_1307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1307
Symbol	flhB
ID	6144489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1294901
End bp	1296049
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	55%
IMG OID	641616185
Product	flagellar biosynthesis protein FlhB
Protein accession	YP_001743365
Protein GI	170683078
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1377] Flagellar biosynthesis pathway, component FlhB
TIGRFAM ID	[TIGR00328] flagellar biosynthetic protein FlhB

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0569687
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGACG AGAGCGACGA CAAAACAGAA GCCCCCACAC CTCACCGACT AGAAAAAGCG 
CGGGAAGAGG GGCAAATCCC GCGTTCCCGT GAACTGACCT CGCTGCTGAT TTTGTTAGTG 
GGCGTGTGTG TTATCTGGTT TGGCGGTGTG TCGCTGGCCC GTCGATTGTC GGGCATGCTC 
TCCGCTGGGC TGCATTTTGA TCACAGTATT ATCAATGACC CGAATTTGAT CCTCGGGCAG 
ATTATTCTGC TGATCAGAGA AGCCATGCTG GCGCTGCTAC CGCTGATTAG CGGCGTGGTG 
CTGGTGGCGA TTATTTCTCC GGTTATGCTG GGGGGGCTGG TATTTAGCGG CAAATCCTTG 
CAGCCGAAGT TTTCCAAACT CAACCCGCTA CCGGGCATTA AACGGATGTT CTCGGCACAG 
ACTGGCGCGG AGTTGCTTAA GGCAATTTTG AAAACCATCC TGGTTGGCAG CGTGACGGGG 
TTTTTTCTCT GGCATCACTG GCCGCAGATG ATGCGCTTAA TGGCCGAGTC TCCGATTACC 
GCCATGGGTA ATGCGATGGA TCTGGTAGGG CTATGCGCAC TGCTGGTGGT GCTTGGTGTT 
ATTCCGATGG TGGGATTTGA CGTCTTTTTC CAAATCTTCA GCCACCTGAA AAAGCTGCGA 
ATGTCGCGGC AGGATATTCG TGATGAGTTC AAACAAAGCG AAGGCGACCC CCATGTTAAA 
GGGCGGATAC GTCAGATGCA GCGAGCTGCC GCGCGGCGTC GGATGATGGC CGATGTGCCG 
AAAGCGGATG TCATTGTCAA TAACCCAACC CACTATTCGG TAGCGTTGCA GTATGACGAA 
AACAAAATGA GCGCACCGAA AGTGGTCGCT AAAGGTGCAG GACTGGTCGC GCTGCGCATT 
CGTGAAATTG GTGCTGAAAA TAACGTCCCT ACGCTTGAAG CGCCGCCGCT GGCGCGAGCG 
CTGTATCGAC ATGCGGAGAT CGGTCAACAA ATCCCGGGTC AACTGTACGC CGCGGTAGCG 
GAAGTGCTGG CCTGGGTCTG GCAACTGAAA CGCTGGCGTC TGGCTGGAGG ACAGCGCCCT 
GTACAACCTA CTCATCTTCC GGTGCCGGAA GCCCTGGATT TTATTAACGA GAAACCGTCC 
CATGAGTAA

Protein sequence

MSDESDDKTE APTPHRLEKA REEGQIPRSR ELTSLLILLV GVCVIWFGGV SLARRLSGML 
SAGLHFDHSI INDPNLILGQ IILLIREAML ALLPLISGVV LVAIISPVML GGLVFSGKSL 
QPKFSKLNPL PGIKRMFSAQ TGAELLKAIL KTILVGSVTG FFLWHHWPQM MRLMAESPIT 
AMGNAMDLVG LCALLVVLGV IPMVGFDVFF QIFSHLKKLR MSRQDIRDEF KQSEGDPHVK 
GRIRQMQRAA ARRRMMADVP KADVIVNNPT HYSVALQYDE NKMSAPKVVA KGAGLVALRI 
REIGAENNVP TLEAPPLARA LYRHAEIGQQ IPGQLYAAVA EVLAWVWQLK RWRLAGGQRP 
VQPTHLPVPE ALDFINEKPS HE