Gene EcHS_A1975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1975
Symbol	flhB
ID	5592702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1984214
End bp	1985362
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	55%
IMG OID	640921120
Product	flagellar biosynthesis protein FlhB
Protein accession	YP_001458669
Protein GI	157161351
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1377] Flagellar biosynthesis pathway, component FlhB
TIGRFAM ID	[TIGR00328] flagellar biosynthetic protein FlhB

Plasmid Coverage information

Num covering plasmid clones	79
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCTGACG AGAGCGACGA CAAAACAGAA GCCCCCACAC CTCACCGACT AGAAAAAGCG 
CGGGAAGAGG GGCAAATCCC GCGTTCCCGT GAACTGACCT CACTGCTGAT TTTGCTGGTG 
GGCGTTAGTG TTATCTGGTT TGGCGGTGTG TCGCTGGCCC GTCGATTGTC GGGCATGCTC 
TCCGCTGGGC TGCATTTTGA TCACAGTATT ATCAAAGACC CGAATCTGAT CCTCGGGCAG 
ATTATTCTGC TGATCAGAGA AGCCATGCTG GCGCTGCTGC CACTGATTAG CGGCGTGGTA 
CTGGTGGCGC TCATTTCTCC GGTCATGCTG GGAGGGCTGG TATTTAGCGG CAAATCCTTG 
CAGCCGAAGT TTTCCAAACT CAACCCGCTA CCGGGCATTA AACGGATGTT CTCGGCTCAG 
ACTGGCGCGG AGTTGCTTAA AGCAATTTTG AAAACCATCC TGGTTGGCAG CGTGACGGGG 
TTTTTTCTCT GGCATCACTG GCCGCAGATG ATGCGCTTAA TGGCCGAGTC TCCGATTACC 
GCCATGGGTA ATGCGATGGA TTTGGTAGGG CTATGCGCAC TGCTGGTGGT GCTTGGTGTC 
ATTCCAATGG TGGGATTTGA CGTCTTTTTC CAAATCTTCA GCCACCTGAA AAAGCTGCGA 
ATGTCGCGGC AGGATATTCG TGATGAGTTC AAACAAAGCG AAGGCGACCC CCATGTTAAA 
GGACGGATCC GTCAGATGCA GCGAGCTGCC GCACGGCGTC GGATGATGGC CGATGTGCCG 
AAAGCGGATG TCATTGTCAA TAACCCGACC CACTATTCGG TAGCGTTGCA GTATGACGAA 
AACAAAATGA GCGCACCGAA AGTGGTCGCT AAAGGTGCAG GGCTGGTCGC GCTGCGCATT 
CGTGAAATTG GCGCTGAAAA TAACGTCCCG ACGCTTGAAG CGCCGCCGCT GGCGCGAGCG 
CTGTATCGAC ATGCGGAGAT TGGTCAACAA ATCCCGGGTC AACTGTACGC CGCGGTGGCG 
GAAGTGCTGG CCTGGGTCTG GCAACTGAAA CGCTGGCGTC TGGCTGGTGG ACAGCGCCCT 
GTACAACCTA CTCATCTTCC GGTGCCGGAA GCCCTGGATT TTATTAACGA GAAACCGACC 
CATGAGTAA

Protein sequence

MSDESDDKTE APTPHRLEKA REEGQIPRSR ELTSLLILLV GVSVIWFGGV SLARRLSGML 
SAGLHFDHSI IKDPNLILGQ IILLIREAML ALLPLISGVV LVALISPVML GGLVFSGKSL 
QPKFSKLNPL PGIKRMFSAQ TGAELLKAIL KTILVGSVTG FFLWHHWPQM MRLMAESPIT 
AMGNAMDLVG LCALLVVLGV IPMVGFDVFF QIFSHLKKLR MSRQDIRDEF KQSEGDPHVK 
GRIRQMQRAA ARRRMMADVP KADVIVNNPT HYSVALQYDE NKMSAPKVVA KGAGLVALRI 
REIGAENNVP TLEAPPLARA LYRHAEIGQQ IPGQLYAAVA EVLAWVWQLK RWRLAGGQRP 
VQPTHLPVPE ALDFINEKPT HE