Gene TM1040_1263 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1263
Symbol
ID	4077657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1361081
End bp	1362121
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	62%
IMG OID	638006571
Product	histidine kinase
Protein accession	YP_613258
Protein GI	99081104
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCAAG AGCTGATCGA CGGGCTTCTG GCCGCGTTTC CGATGCCGGC TGTTTTGATC 
GATCAGACAG AGCGGTTGAT TGCGGCCAAT GTGGAGGGGG CGACCCTGCT TGGCCCGCAA 
GTCATCGGGC GTCATTTTGC AACGATCTTG CGTCAGCCCA ATGTGACCAC TGCGATCGAG 
GCCTGTCTTC TGGACCGCAA ACCGCGCACC GCGCGCCATC TTTCCAATGA TGGCGCGCAG 
GACACCACCT TTGAAGTGAC CCTGCGATAT GTGCCGGGAG TAGGAGCCGT GAATGGCGGC 
GCGGTGCTCT TGTGTTTTGA CGACATCACC GACCGCGAGC AGGCCAGCCA GATGCGGCGT 
GATTTTGTCG CCAATGTCAG CCACGAGCTG CGCACGCCAC TGACCGCATT GATGGGGTTC 
ATCGAGACCC TGCGGGGTGC TGCGCGCAAT GATGCGGCGG CGCGGGATCG TTTCCTGGAA 
ATCATGGAAG GCGAGGCGAG CCGGATGAAT CGCCTTGTGG GGGATCTGCT GTCGCTCAAC 
CGTGTCGAGA GCGAGGAACG CGTACGCCCG AAGGAACGTA TCGACCTCTT GGCGCATCTT 
CAGTCCACGA TCAAATCGCT GGCGCCCCTC GCCGAGAGCG GCGGCACCCA GCTTACGCTT 
GATGCGCCCG CAGGCGCAGT GGAGATCCCT GCGGATCCGG ATCAGCTCCA GCAGGTTTTC 
ACCAACCTCA TAGAGAATGC GCTGAAATAT GGTGGGGACA ATGTGACCGT CTCCCTGATG 
GCGCTGGAGC GGGATCCCGC GCTCAGATGT CCGGCGGTGC GGGTGCAGGT GATCGATGAT 
GGCCCTGGCA TTGATCCGGT TCACCTGCCG CGCCTGACCG AACGATTCTA TCGCGCCGAC 
AATCACCGCT CCCGCGAGTT GGGGGGCACG GGCCTTGGAC TCGCGATTGT AAAACACATC 
ATCAACCGCC ACCGCGGACG CCTGCGCGTC GAGAGCGACC TTGGCAAAGG CGCGACCTTC 
ACCGTGATCT TGCCCCAATA G

Protein sequence

MSQELIDGLL AAFPMPAVLI DQTERLIAAN VEGATLLGPQ VIGRHFATIL RQPNVTTAIE 
ACLLDRKPRT ARHLSNDGAQ DTTFEVTLRY VPGVGAVNGG AVLLCFDDIT DREQASQMRR 
DFVANVSHEL RTPLTALMGF IETLRGAARN DAAARDRFLE IMEGEASRMN RLVGDLLSLN 
RVESEERVRP KERIDLLAHL QSTIKSLAPL AESGGTQLTL DAPAGAVEIP ADPDQLQQVF 
TNLIENALKY GGDNVTVSLM ALERDPALRC PAVRVQVIDD GPGIDPVHLP RLTERFYRAD 
NHRSRELGGT GLGLAIVKHI INRHRGRLRV ESDLGKGATF TVILPQ