Gene EcSMS35_4428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4428
Symbol	tuf1
ID	6143658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4521516
End bp	4522700
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	53%
IMG OID	641619248
Product	elongation factor Tu
Protein accession	YP_001746364
Protein GI	170681349
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0050] GTPases - translation elongation factors
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00485] translation elongation factor TU

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000375004
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.00000974336
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTAAAG AAAAGTTTGA ACGTACAAAA CCGCACGTTA ACGTCGGTAC TATCGGCCAC 
GTTGACCATG GTAAAACAAC GCTGACCGCT GCAATCACTA CCGTACTGGC TAAAACCTAC 
GGCGGTGCTG CTCGCGCATT CGACCAGATC GATAACGCGC CGGAAGAAAA AGCTCGTGGT 
ATCACCATCA ACACTTCTCA CGTTGAATAC GACACCCCGA CCCGTCACTA CGCACACGTA 
GACTGCCCGG GGCACGCCGA CTATGTTAAA AACATGATCA CCGGTGCTGC TCAGATGGAC 
GGCGCGATCC TGGTAGTTGC TGCGACTGAC GGCCCGATGC CGCAGACTCG TGAGCACATC 
CTGCTGGGTC GTCAGGTAGG CGTTCCGTAC ATCATCGTGT TCCTGAACAA ATGCGACATG 
GTTGATGACG AAGAGCTGCT GGAACTGGTT GAAATGGAAG TTCGTGAACT TCTGTCTCAG 
TACGACTTCC CGGGCGACGA CACTCCGATC GTTCGTGGTT CTGCTCTGAA AGCGCTGGAA 
GGCGATGCAG AGTGGGAAGC GAAAATCCTG GAACTGGCTG GCTTCCTGGA TTCTTACATT 
CCGGAACCAG AGCGTGCGAT TGACAAGCCG TTCCTGCTGC CGATCGAAGA CGTATTCTCC 
ATCTCCGGTC GTGGTACCGT TGTTACCGGT CGTGTAGAAC GCGGTATCAT CAAAGTTGGT 
GAAGAAGTTG AAATCGTTGG TATCAAAGAG ACTCAGAAGT CTACCTGTAC TGGCGTTGAA 
ATGTTCCGCA AACTGCTGGA CGAAGGCCGT GCTGGTGAGA ACGTAGGTGT TCTGCTGCGT 
GGTATCAAAC GTGAAGAAAT CGAACGTGGT CAGGTACTGG CTAAGCCGGG CACCATCAAG 
CCGCACACCA AGTTCGAATC TGAAGTGTAC ATTCTGTCCA AAGATGAAGG CGGCCGTCAT 
ACTCCGTTCT TCAAAGGCTA CCGTCCGCAG TTCTACTTCC GTACTACTGA CGTGACTGGT 
ACCATCGAAC TGCCGGAAGG CGTAGAGATG GTAATGCCGG GCGACAACAT CAAAATGGTT 
GTTACCCTGA TCCACCCGAT CGCGATGGAC GACGGTCTGC GTTTCGCAAT CCGTGAAGGC 
GGCCGTACCG TTGGCGCGGG CGTTGTAGCA AAAGTTCTGA GCTAA

Protein sequence

MSKEKFERTK PHVNVGTIGH VDHGKTTLTA AITTVLAKTY GGAARAFDQI DNAPEEKARG 
ITINTSHVEY DTPTRHYAHV DCPGHADYVK NMITGAAQMD GAILVVAATD GPMPQTREHI 
LLGRQVGVPY IIVFLNKCDM VDDEELLELV EMEVRELLSQ YDFPGDDTPI VRGSALKALE 
GDAEWEAKIL ELAGFLDSYI PEPERAIDKP FLLPIEDVFS ISGRGTVVTG RVERGIIKVG 
EEVEIVGIKE TQKSTCTGVE MFRKLLDEGR AGENVGVLLR GIKREEIERG QVLAKPGTIK 
PHTKFESEVY ILSKDEGGRH TPFFKGYRPQ FYFRTTDVTG TIELPEGVEM VMPGDNIKMV 
VTLIHPIAMD DGLRFAIREG GRTVGAGVVA KVLS