Gene EcolC_3368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3368
Symbol
ID	6064903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3689283
End bp	3690485
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	58%
IMG OID	641602782
Product	flagellar basal body FlaE domain-containing protein
Protein accession	YP_001726314
Protein GI	170021360
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTATG AAATTGCCGC GACGGGGCTG AATGCCGTTA ACGAACAGCT GGACGGGATC 
AGTAACAACA TCGCCAACGC CGGAACGGTG GGCTATAAGT CGATGACCAC CCAGTTTTCC 
GCCATGTATG CCGGAAGCCA GGCGATGGGT GTCAGCGTGG CGGGCACCGC GCAGAGCATT 
TCGCGCGGCG GTTCGCTGGT CTCCACCGGC AACGCGCTGG ATCTGGCGAT TAACGATGAT 
GGCTTTTTTG TTACCTGCGA CAGTGCGGGC AACATTTCTT ATACCCGCGC CGGTTCGTTT 
GAAACCGACA AAAACGGCTA TATCGTCAAC GCCTCGGGCG CTTATTTGCA GGGTTATCCG 
GTGGATGACA GCGGCACTCT GCAAACCGGT ACGGTCACCG ATATCCAGAT CAAAACCGGC 
AATATCCCGG CGCAGGCAAG CAGCAGCCTG ACTTTTACCG CCAACTTCGA TGCCAGCGAT 
GCGGCTATCG ATCGCACCAC CGTACCGTTC GACGCCACCA ACAGCAGCTC CTATACCGAC 
AGCTACACCA CCACGGTATA TGACTCATTG GGTAACGAAC ACTCGGTATG CCAGTATTTC 
ACCAAAACCA GCGACAACAC CTGGGAAGTG CAGTACACCT TCGACGGTCA GCAGCAGACC 
GGCGTTCCTG CGACCACCTT AACCTTCGAC CCGAACACCG GGAAGCTGAC CTCGCCAACC 
ACGCCGCAGA CCATTGAGTT TCAGACCGAC GCCGCCGCGC CCATCGACTT AACCGTCGAT 
TACTCCACCT GTACGCAATA CGGCTCTGAA TTTTCTGTCA CCACCAACGC CGCCAACGGT 
TACGCTTCCG CCACGCAAAA CGGTGTGCAG GTTGATGACG ATGGCAAAGT TTACGCCACC 
TACAGCAACG GCGAGCGCAT GTTGCAGGGC CAGGTGGTGC TGGCGACTTT CCCGAATGAA 
AACGGCCTGG AGGCAGTGAG CGGCACCGCA TGGGTACAAA CCGGGGAATC CGGCACCCCG 
CTGATTGGCG TTCCCGGCTC CGGCACCTGC GGTACGCTGT CGTCCGGCGT GCTCGAAAGC 
TCTAACGTCG ATATCACCAG CGAACTGGTC AACCTGATGA CCGCCCAGCG TAACTATCAG 
GCCAACACCA AAGTTATCGC TACCAGCACA CAGCTCGATG ACGCGCTGTT CCAGGCAATG 
TAA

Protein sequence

MSYEIAATGL NAVNEQLDGI SNNIANAGTV GYKSMTTQFS AMYAGSQAMG VSVAGTAQSI 
SRGGSLVSTG NALDLAINDD GFFVTCDSAG NISYTRAGSF ETDKNGYIVN ASGAYLQGYP 
VDDSGTLQTG TVTDIQIKTG NIPAQASSSL TFTANFDASD AAIDRTTVPF DATNSSSYTD 
SYTTTVYDSL GNEHSVCQYF TKTSDNTWEV QYTFDGQQQT GVPATTLTFD PNTGKLTSPT 
TPQTIEFQTD AAAPIDLTVD YSTCTQYGSE FSVTTNAANG YASATQNGVQ VDDDGKVYAT 
YSNGERMLQG QVVLATFPNE NGLEAVSGTA WVQTGESGTP LIGVPGSGTC GTLSSGVLES 
SNVDITSELV NLMTAQRNYQ ANTKVIATST QLDDALFQAM