Gene EcHS_A3481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3481
Symbol	fmt
ID	5595059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3478557
End bp	3479504
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	53%
IMG OID	640922598
Product	methionyl-tRNA formyltransferase
Protein accession	YP_001460079
Protein GI	157162761
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0223] Methionyl-tRNA formyltransferase
TIGRFAM ID	[TIGR00460] methionyl-tRNA formyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.000745387
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCAGAAT CACTACGTAT TATTTTTGCG GGTACACCTG ACTTTGCAGC GCGTCATCTC 
GACGCGCTGT TGTCTTCTGG TCATAACGTC GTTGGCGTGT TCACCCAGCC AGACCGACCG 
GCAGGACGCG GTAAAAAACT GATGCCCAGC CCGGTTAAAG TTCTGGCTGA GGAAAAAGGT 
CTGCCCGTTT TTCAACCTGT TTCCCTGCGT CCACAAGAAA ACCAGCAACT GGTCGCCGAA 
CTGCAGGCTG ATGTTATGGT CGTCGTCGCC TATGGTTTAA TTCTGCCGAA AGCAGTGCTG 
GAGATGCCGC GTCTTGGCTG TATCAACGTT CATGGTTCAC TGCTGCCACG CTGGCGCGGT 
GCTGCACCAA TCCAACGCTC ACTATGGGCG GGTGATGCAG AAACTGGTGT GACCATTATG 
CAAATGGATG TCGGTTTAGA CACCGGTGAT ATGCTCTATA AGCTCTCCTG CCCGATTACT 
GCAGAAGATA CCAGTGGTAC GCTGTACGAC AAGCTGGCAG AGCTTGGCCC ACAAGGGCTT 
ATCACCACGT TGAAACAACT GGCAGACGGC ACGGCGAAAC CAGAAGTTCA GGACGAAACT 
CTTGTCACTT ACGCCGAGAA GTTGAGTAAA GAAGAAGCGC GTATTGACTG GTCACTTTCG 
GCAGCACAGC TTGAACGCTG CATTCGCGCT TTCAATCCAT GGCCAATGAG CTGGCTGGAA 
ATTGAAGGAC AGCCGGTTAA AGTCTGGAAA GCATCGGTCA TTGATACGGC AACCAACGCT 
GCACCAGGAA CGATCCTTGA AGCCAACAAA CAAGGCATTC AGGTTGCGAC TGGTGATGGC 
ATCCTGAACC TGCTCTCGTT ACAACCTGCG GGTAAGAAAG CGATGAGCGC GCAAGACCTC 
CTGAACTCTC GTCGGGAATG GTTTGTTCCG GGCAACCGTC TGGTCTGA

Protein sequence

MSESLRIIFA GTPDFAARHL DALLSSGHNV VGVFTQPDRP AGRGKKLMPS PVKVLAEEKG 
LPVFQPVSLR PQENQQLVAE LQADVMVVVA YGLILPKAVL EMPRLGCINV HGSLLPRWRG 
AAPIQRSLWA GDAETGVTIM QMDVGLDTGD MLYKLSCPIT AEDTSGTLYD KLAELGPQGL 
ITTLKQLADG TAKPEVQDET LVTYAEKLSK EEARIDWSLS AAQLERCIRA FNPWPMSWLE 
IEGQPVKVWK ASVIDTATNA APGTILEANK QGIQVATGDG ILNLLSLQPA GKKAMSAQDL 
LNSRREWFVP GNRLV