Gene EcolC_3354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3354
Symbol
ID	6067432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3676238
End bp	3677299
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	58%
IMG OID	641602768
Product	flagellar hook-length control protein
Protein accession	YP_001726300
Protein GI	170021346
COG category	[N] Cell motility
COG ID	[COG3144] Flagellar hook-length control protein
TIGRFAM ID	[TIGR02514] type III secretion system needle length determinant

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.26505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCGG CATTGCTTGC CACGCTCGGA ACGCTTGCGG AAACCGCTTC GTTGAAGGCG 
GATATTTTAC CGCCGGTGAG CGGTGAAAAC GCGCCCGCGT TTACCCTGCC GAAAATGGCG 
GTCGCGGCGG TGGCGGAGCG CGTTCATAGC GCTAAAACCA GTCAGCAACA GGCGACGCGC 
CCGCAGGAGA ACGATCCGGT GGCGATGCAG GCGCTAATGG CGCTGTTACT TCCACAACCT 
GCCGCGCCGC ATCAGGACAC GCCGCAGCCG CGAAACGTCG CAACATCGCC GGTTATCCAG 
CAATTGACGA AAGCGGTGGT GCAAAACGCG CCGCAACGCC CGACGCAACA GCAGGAACTC 
ACGCCGTTGC CGCCGCAGTT GCAGGAACTG ATCAGTCAGT TGCCGCAGGA GAAACCCGAA 
CAGCAGGCCA GACTGGCGAC TTACGCCAGT GAAGATTTAC ATGCCATTGC GTCGACGCAG 
CCGCGCGTCT CAACACAGCC AGCTCGCCCG AAACCTGAAC TAACCCGTGT GACCGCGCGC 
CCGCAGGTCG AGCGTAAAAC GGAAAAAGTG CCGGACAGCG AACCGGTTAT TGCGCGTGCG 
GTGTTGCAGG TTAAGACGCC GGAGCTGGTC AGCGATCATC AGGAGATTGT CGCCAAACCC 
GTCACGCTTT CGATGGACGA ACTGGGCGAA AAACTGACGA CGCTGTTGAA AGATCAGATC 
CACTTTCAGC TCAACAAACA ACAGCAGATC TCCACCATCC GTCTCGATCC ACCGTCGCTT 
GGCAAGCTCG AGATCGCCGT ACAACTCGAC AACGGCAAAC TGATGGTGCA CATCGGCGCG 
AACCAAAGTG AAGTTTGCCG CGCGTTACAG CAGTTTAGCG ACGATCTCCG CCAGCATCTG 
ACGGCGCAAA ATTTTATGGA GGTGAGCGTA CAGGTTTCCT CCGAAGGGCA GTCGCAGCAA 
CAACAACAGT CGGGCCATCA GCAGGAAGAG GTGAGTGCTG CCTTACAGCT TGATGATGCG 
CCTCAATTTC AACAGAACGA ATCCGTTTTG ATCAAAGTGT AA

Protein sequence

MNPALLATLG TLAETASLKA DILPPVSGEN APAFTLPKMA VAAVAERVHS AKTSQQQATR 
PQENDPVAMQ ALMALLLPQP AAPHQDTPQP RNVATSPVIQ QLTKAVVQNA PQRPTQQQEL 
TPLPPQLQEL ISQLPQEKPE QQARLATYAS EDLHAIASTQ PRVSTQPARP KPELTRVTAR 
PQVERKTEKV PDSEPVIARA VLQVKTPELV SDHQEIVAKP VTLSMDELGE KLTTLLKDQI 
HFQLNKQQQI STIRLDPPSL GKLEIAVQLD NGKLMVHIGA NQSEVCRALQ QFSDDLRQHL 
TAQNFMEVSV QVSSEGQSQQ QQQSGHQQEE VSAALQLDDA PQFQQNESVL IKV