Gene EcHS_A3920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3920
Symbol	trmE
ID	5592654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3913999
End bp	3915363
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID	640923028
Product	tRNA modification GTPase TrmE
Protein accession	YP_001460505
Protein GI	157163187
COG category	[R] General function prediction only
COG ID	[COG0486] Predicted GTPase
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00450] tRNA modification GTPase TrmE

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	0.189642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATA ATGACACTAT CGTAGCCCAG GCCACGCCTC CGGGACGTGG CGGCGTTGGC 
ATCCTGCGCA TCTCCGGCTT CAAAGCCCGT GAAGTTGCCG AAACCGTGCT GGGTAAACTG 
CCTAAGCCGC GCTACGCCGA TTATCTTCCG TTTAAAGACG CCGACGGCAG CGTGCTCGAT 
CAGGGGATTG CGCTATGGTT CCCTGGCCCG AACTCGTTCA CCGGCGAAGA TGTGCTGGAA 
CTGCAAGGTC ATGGCGGTCC GGTGATCCTC GACCTGCTGT TAAAACGCAT TCTGACCATT 
CCCGGCCTGC GGATTGCTCG CCCTGGTGAG TTTTCCGAAC GCGCGTTTCT TAACGATAAA 
CTTGACTTAG CCCAGGCCGA GGCGATTGCC GATCTTATCG ACGCCAGTTC GGAACAGGCG 
GCCCGTTCGG CACTTAACTC GCTGCAAGGC GCATTCTCCG CACGGGTTAA TCATCTGGTA 
GAAGCCCTCA CCCACTTGCG CATTTACGTC GAAGCGGCAA TTGATTTCCC CGATGAAGAG 
ATCGATTTCC TCTCCGACGG AAAAATTGAA GCCCAGCTTA ATGACGTGAT TGCCGATCTC 
GATGCAGTGC GTGCTGAAGC ACGTCAGGGT AGTTTGTTGC GCGAAGGGAT GAAGGTGGTG 
ATTGCCGGAC GTCCTAACGC CGGTAAATCG AGCCTGTTAA ACGCGCTGGC GGGCCGTGAA 
GCAGCAATCG TAACTGATAT CGCCGGAACC ACACGTGACG TGCTGCGTGA GCATATCCAC 
ATTGACGGAA TGCCGCTGCA TATCATCGAT ACCGCTGGGC TACGTGAAGC CAGTGACGAA 
GTGGAACGTA TTGGTATCGA GCGCGCGTGG CAGGAAATTG AACAGGCCGA CCGCGTGCTG 
TTTATGGTCG ATGGCACCAC AACAGACGCC GTGGATCCGG CAGAGATCTG GCCGGAATTT 
ATCGCCCGTC TGCCAGCGAA ACTGCCGATC ACCGTGGTGC GCAATAAAGC CGATATCACC 
GGCGAAACGC TGGGAATGAG TGAAGTGAAC GGTCACGCGT TAATTCGTCT CTCGGCAAGG 
ACAGGTGAAG GCGTGGAGGT GCTGCGTAAC CATCTCAAAC AGAGCATGGG CTTTGACACC 
AACATGGAAG GCGGCTTCCT GGCGCGTCGT CGCCACCTAC AGGCGCTGGA ACAGGCAGCG 
GAACATCTAC AACAGGGCAA AGCGCAACTG TTGGGAGCCT GGGCAGGTGA ACTGCTGGCG 
GAAGAGTTGC GTCTGGCACA GCAGAACTTA AGCGAAATCA CCGGGGAATT TACTTCAGAC 
GACCTGCTGG GGCGGATTTT CTCCAGCTTC TGTATTGGTA AGTAA

Protein sequence

MSDNDTIVAQ ATPPGRGGVG ILRISGFKAR EVAETVLGKL PKPRYADYLP FKDADGSVLD 
QGIALWFPGP NSFTGEDVLE LQGHGGPVIL DLLLKRILTI PGLRIARPGE FSERAFLNDK 
LDLAQAEAIA DLIDASSEQA ARSALNSLQG AFSARVNHLV EALTHLRIYV EAAIDFPDEE 
IDFLSDGKIE AQLNDVIADL DAVRAEARQG SLLREGMKVV IAGRPNAGKS SLLNALAGRE 
AAIVTDIAGT TRDVLREHIH IDGMPLHIID TAGLREASDE VERIGIERAW QEIEQADRVL 
FMVDGTTTDA VDPAEIWPEF IARLPAKLPI TVVRNKADIT GETLGMSEVN GHALIRLSAR 
TGEGVEVLRN HLKQSMGFDT NMEGGFLARR RHLQALEQAA EHLQQGKAQL LGAWAGELLA 
EELRLAQQNL SEITGEFTSD DLLGRIFSSF CIGK