Gene TM1040_3173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3173
Symbol
ID	4075343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	153696
End bp	155003
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	63%
IMG OID	638004676
Product	ROK domain-containing protein
Protein accession	YP_611409
Protein GI	99078151
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.66636
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.682387
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCCTT TCTCACAGGG AGAGATTGCC GCGGCGTGCC CAAGGTGGCA TAAGCGAGCG 
CCTTTTGGCG GGCGGCGAGG GAGGAGCTTT GAATTGGCAC GATCAGGACG GCTGACGCCG 
AGCAGCGAGC AACGCGAAAG CGGGCGCCAG CAGATACTGG ATGTGATCCG CGCGCAGGAA 
AGCATCGCCC GCATCGACAT CGCCCAGGCC ACAGGCATGA GCCCGGCGAC GGTGACCGCG 
ATCACCGCCG AGTTGCTGGC AGCGGGCCTG ATCGAAGAGA TCGCGCCCGA GCTGGCGCCC 
GGTGCGCGCC GGGGGCGTCC GCGTGTGGCT CTGCGTCTGC GCGGCGCGGC GCGCCTGATC 
GCCGGTCTCA AGGTTTCCCA TCATGTGATC TCCACCGTGA TTACCGATTT TGTCGGACAG 
GAACTTGCCA GCCACGAGAT GCCGCTGGTG CAGGGCACGA TGCCGGTGCC CGAACTGTGC 
GCGCAGATCC GCCGCGCGCT TGACCTCACC TGCGAGAAAG GCGGCTTCAG CATCGAGGAT 
CTCTCCGGTG TCGGTCTCGG AATGGCCGGG ATGATGGATG CGGACCGGGG CTTTATCTAT 
TGGTCCTCAT CGCTCGAAGA GCGCAATGTC GCCTTCACCG CCGCCATCAG TGCCGAGCTG 
CCCTGTCCGG TGTTTCTGGA CAATGACGCA AACCTCGTGG CCAAGGCCGA ACATCTTTTT 
GGCGAGGGGC GCACCTGCGA CAATTTCATT GTCATCACCA TCGAACACGG CGTTGGCATG 
GGGATCGTGA TCGACCAGCA GATCTATCGC GGCACCCGCG GCTGCGGCGC CGAATTGGGT 
CACACGAAGG TCCATCTCGA AGGGGCGCTG TGCCAATGCG GGCAACGCGG CTGTCTGGAG 
GCCTATGTGG GCGATTACGC GCTCCTGCGC GAGGCGAATA TTTCGAGCGG CAGTGAACGC 
CACACCACCA TCGCCTCACT GTTTCAGTCG GCTGAAAATG GCGATGTGGT GGCTAAGTCC 
ATCCTTGACC GCGCGCGGCG GATGTTTGCG ATGGGGTTGG CAAATGTCGT CAACATTTTT 
GACCCGAGCA AGATCATCCT CGCGGGGGCC CGGTTGTCAT TCGACTATCT CTATTCCGAC 
AAGCTCATCG AGGAGATGCG TCAGTGGGTG GTGCAGGTGG ATGCCCCGCT GCCAGAGGTC 
ATGGTCCATG ACTGGGGCGA TCTGATGTGG GCCAAGGGGG CGGCGGCCTA TGCGCTCGAA 
GAGGTGACGG CGCGCACCGT GCGGGAGCTT GCAAATGCGG CGGCCTGA

Protein sequence

MYPFSQGEIA AACPRWHKRA PFGGRRGRSF ELARSGRLTP SSEQRESGRQ QILDVIRAQE 
SIARIDIAQA TGMSPATVTA ITAELLAAGL IEEIAPELAP GARRGRPRVA LRLRGAARLI 
AGLKVSHHVI STVITDFVGQ ELASHEMPLV QGTMPVPELC AQIRRALDLT CEKGGFSIED 
LSGVGLGMAG MMDADRGFIY WSSSLEERNV AFTAAISAEL PCPVFLDNDA NLVAKAEHLF 
GEGRTCDNFI VITIEHGVGM GIVIDQQIYR GTRGCGAELG HTKVHLEGAL CQCGQRGCLE 
AYVGDYALLR EANISSGSER HTTIASLFQS AENGDVVAKS ILDRARRMFA MGLANVVNIF 
DPSKIILAGA RLSFDYLYSD KLIEEMRQWV VQVDAPLPEV MVHDWGDLMW AKGAAAYALE 
EVTARTVREL ANAAA