Gene TM1040_0224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0224
Symbol
ID	4076257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	239155
End bp	240252
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	59%
IMG OID	638005518
Product	GTP-dependent nucleic acid-binding protein EngD
Protein accession	YP_612219
Protein GI	99080065
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0012] Predicted GTPase, probable translation factor
TIGRFAM ID	[TIGR00092] GTP-binding protein YchF

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.626495
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCTTTA AAATGGGAAT CGTGGGTCTG CCCAATGTGG GCAAGTCGAC CCTGTTCAAC 
GCGCTGACCA AAACCGCCTC GGCGCAGGCG GCAAATTTTC CGTTCTGTAC GATCGAACCG 
AACGTGGGTG AGGTGGGCGT TCCGGACGCG CGTCTCGACA AATTGGCGGC GATTGCGCAG 
TCCAAACAGA TCATCCCAAC CCGCATGACG TTTGTGGATA TTGCTGGCCT CGTCAAAGGC 
GCCTCAAAGG GCGAAGGTCT GGGCAACCAG TTCCTTGCCA ATATCCGTGA GGTGGACGCA 
ATTGCCCATG TTTTACGGTG CTTTGAGGAC GGTGACGTTA CCCATGTCGA TGGTCGCGTT 
GATCCGGTTG CGGACGCCGA TACCATCGAA ACCGAGCTGA TGCTGGCGGA TCTTGAGAGC 
ATCGAGAAAC GCCGCGCCAA CCTCGTACGC AAGCTCAAGG GCAACGACAA GGAAGCCCAG 
CAGCAGGACC GCCTGCTCGC AGCGGCGCAG GCCATGCTCG AAGATGGCAA ACCAGCCCGT 
CTGGTTGAGG TCGACGCAGA GGACCAGAAG GCCTGGACCA TGCTGCAACT GCTGACCACA 
AAGCCGGTGC TTTACGTCTG CAATGTGGGT GAAAGCGAGA GCGTCGAAGG CAACGCACAT 
TCCGCCAAAG TTGCCGAGAT GGCCGCGGCT CAGGGTAACG CGCATGTGAT CATTTCGGCG 
CAGATCGAAG AGGAAATCAG CCAGCTTGAG CCCGAAGAAG CGCAGATGTT CCTCGATGAG 
ATGGGTCTCG CAGAAGCCGG TCTCGACCGC CTGATCCGCG CCGGTTACGA GCTCTTGCAT 
CTGGAAACCT ATTTCACGGT CGGCCCCAAG GAAGCGCGCG CCTGGACCAT TCGCTCGGGC 
ACCGCTGCGC CCCAGGCGGC AGGCGTTATC CACGGCGATT TTGAAAAGGG TTTCATCCGC 
GCGGAGACCA TCGCCTATGA CGACTACATC GCTTGCGGCG GTGAATCCGG CGCCAAAGAA 
GCGGGCAAGA TGCGCGCCGA GGGCAAGAGC TACATCGTCA AGGATGGCGA TGTGATGCAC 
TTCTTGTTCA ACACCTGA

Protein sequence

MGFKMGIVGL PNVGKSTLFN ALTKTASAQA ANFPFCTIEP NVGEVGVPDA RLDKLAAIAQ 
SKQIIPTRMT FVDIAGLVKG ASKGEGLGNQ FLANIREVDA IAHVLRCFED GDVTHVDGRV 
DPVADADTIE TELMLADLES IEKRRANLVR KLKGNDKEAQ QQDRLLAAAQ AMLEDGKPAR 
LVEVDAEDQK AWTMLQLLTT KPVLYVCNVG ESESVEGNAH SAKVAEMAAA QGNAHVIISA 
QIEEEISQLE PEEAQMFLDE MGLAEAGLDR LIRAGYELLH LETYFTVGPK EARAWTIRSG 
TAAPQAAGVI HGDFEKGFIR AETIAYDDYI ACGGESGAKE AGKMRAEGKS YIVKDGDVMH 
FLFNT