Gene TM1040_3336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3336
Symbol
ID	4075235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	346296
End bp	347858
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	58%
IMG OID	638004844
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_611570
Protein GI	99078312
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.490957
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCA AGTGGCGCCC GCGCCTCTGG ACTGTTGTCC TCCTGGTGCT GGCAATTGTG 
CTGTGCCTTC CGATTGCCGG GCTGATCCTG TTTCGGTTCT ATGACAATCA GTTGGTGCAA 
CAGACCGAAG AAAGCGTGCT GGCGCAGGCT GCGGTGATGG CGGCCACCTA TGCAGACCTT 
TACAGCGAGG CTGCGGGGCT CGCCCCGCCA AAGCCAAAGC CCGTGTCGGC GCAAGACGCC 
ATCTTTCCGT CGCTGTCAAT CAACAGCGCC ACCGTCTTGC CACCTCGTCC CGACGCGGCC 
AACCCGTCAA CATCAGTGAC TGCAACTTAC CAGCGCCTCG CACCGCAACT CTCTCGGATC 
GCAAGTTCAG CGCAAGCGCA AACACTTGCG GGCTATCGCT TCCTTGACAC GCAAGGCAAT 
GTGATTGCTG GGACCGCCGA AATTGGCCGC GATCTGGGCC ACGTCAGCGA AGTCCGTGCC 
GCCCTTGATG GTCATGTCGT TTCTGTTGCG CGCACGCGGG TGCGAGACAG CAGCCCGCCT 
GCGCTTTATA CGCTCAGCCG TGGGGCCAGA GTGCGCGTCT TTGTGGCAAT GCCTGTACAT 
GTGAACGAGG CTTTGATCGG GGCGGTCTAT GTCAGCCGTA CACCCAGCCA TATTTTTCGT 
TTCCTCTATG GGGAGCGCTT CAATTTGCTA AAGGCCGCTG CCTTTGTTGC ACTGTCTACC 
ACGCTGATCG GATATGTGTT CTGGCGCTTC ATCACCCGCC CCATCCGACT GCTGAAAGAG 
CGTAGCCAAC TGGCCACCCA AGGCAATCAC GCCTTTGAGG CACCAGATCA TCTTGGCACG 
CGCGAGATCG AAGACCTAAG CCTCAGCTTC AAATCGCTGA CCGAGCGGCT GCAGAACAAT 
CGCGATGCGC TCAAGACGTA TACGGCCCAT GTCACCCACG AATTGAAATC ACCCCTCACT 
GCACTGAAGG GCGCAGCAGA GCTCTTGCGT GACGATGATC TGAGCCAGAG CCAGCGACAT 
CGGTTGCTCG ACACGATCGA GAAAGGCGGC ACACGCATAG AAGATCTGCT GGCCCATATG 
CGTGCCTTCA GCCTTGCGGA CCAACAAGCG ATGTCCGGGC GCTGTAGTCT TGAGCAGATC 
CAAGATCAGA TCACGCAGGC GTTTCCCGCT CTTAGTATCA TGATCGAGAA TGGCTCTCTT 
GGTCTACCAT CAGAGGCCAC CACACTCTCC ATCCTGTTGA CGCATCTTTT GCAAAACGCA 
CAGCAACATG GCGCAAAAAC CGTCAAACTA CGCACAGCGC ACACAAACGG ATCAATCACC 
CTGCGGATCT CGGATGACGG CGCGGGGATC AGTGCGGGCA ATGCCGACAA GATCTTGCAG 
CCTTTCTTCA CCACCCGACG CGACAGTGGC GGAACAGGGA TGGGACTCAA TATCGTGAAA 
TCGACAGTGG AGGCCCTTGG CGGGCACTTG TACATTCTAC CGCAAGACAC GGGCGCAGGG 
TTCGAGTTGG AGTGGCCCAA CGCCACCCCG TCACTGGATC GAACTCAAGC TCCCGGCGCA 
TAG

Protein sequence

MIRKWRPRLW TVVLLVLAIV LCLPIAGLIL FRFYDNQLVQ QTEESVLAQA AVMAATYADL 
YSEAAGLAPP KPKPVSAQDA IFPSLSINSA TVLPPRPDAA NPSTSVTATY QRLAPQLSRI 
ASSAQAQTLA GYRFLDTQGN VIAGTAEIGR DLGHVSEVRA ALDGHVVSVA RTRVRDSSPP 
ALYTLSRGAR VRVFVAMPVH VNEALIGAVY VSRTPSHIFR FLYGERFNLL KAAAFVALST 
TLIGYVFWRF ITRPIRLLKE RSQLATQGNH AFEAPDHLGT REIEDLSLSF KSLTERLQNN 
RDALKTYTAH VTHELKSPLT ALKGAAELLR DDDLSQSQRH RLLDTIEKGG TRIEDLLAHM 
RAFSLADQQA MSGRCSLEQI QDQITQAFPA LSIMIENGSL GLPSEATTLS ILLTHLLQNA 
QQHGAKTVKL RTAHTNGSIT LRISDDGAGI SAGNADKILQ PFFTTRRDSG GTGMGLNIVK 
STVEALGGHL YILPQDTGAG FELEWPNATP SLDRTQAPGA