Gene Tpau_3533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_3533
Symbol
ID	9157712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	3644770
End bp	3645879
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	72%
IMG OID
Product	histidine kinase dimerization and phosphoacceptor region
Protein accession	YP_003648451
Protein GI	296141208
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGGGC CCGACAAGTT CCGTCTCTAC ACCCGGGCAG TGCTCCAGAG CGCTCTGGTC 
AGCGTCCTGA TCATGCTGGC GGTCACCGGG ATTCGCGCCT GGTCACTCGC GGGCATCCTC 
ATCGTCGGGA TCGCCGCCCT CGCCGCGGTC GAGGCCCAGC CCGAACTGTC CATGCGCGCC 
GACGACAAGC AACGGCGCAT CGCCTGGCGA TTCGCCGTGC TCGCGCAGGC CGCGGTGTTC 
ACGGTCTCCG TGGCGGTCGC GGCCCTTGCG GCGCCGAGCC CGGTCGCGAA CGACGCCGCG 
GTCACCGCCT TTCTGACCTA CCTGATCGCC GCCGGATCGG TGCTGCCCTT CGTACGGCAC 
CCGTGGCCGC TGCTCGTGGC AGGTGCGGTG ATCATCGCCG TGCTCATGCG CGACGCCGAC 
ACCCTGCTCC GCCTCGCCGT CGCCCTACCG CTGGCCGTGG CGCTGATGTG GACCACCAGG 
GCCACGGTGT GGAGCCTGAA CATCCTCTCC GAGGTGGAGG AGAGCCGGGA TATGGCGGCC 
GAACTGCACG TCGCCGAGGA GCGCCTGCGC TTCGCCCGCG ATCTCCACGA CGTGGTCGGG 
CGCGGCTTCT CCGCCGTCGC CGTCAAGAGC GAGCTCGCCG CCACCCTGGC CCGCGCCGGC 
GCCACCGACC GCGCCGCCGC GGAGATGGAC GAGGTGAAGT CGCTCGCGGT GACCTCGATG 
GAGGAGATGC GATCGCTGGT GCGCGGCTAC CGCGATGTGG ATCTGGCCGG CGAGGTCGCC 
GGCGCCCGCT CCCTCCTCTC CGCCGCCGGC TGCCGGCTCA CCGTCGAGGG CTCACCGGAC 
GATGTACCCA CCCGTTTCCA CGAGACCGCC GCCTGGGCGG TCCGCGAGGG CACCACGAAC 
ATCGTCAAAC ATTCGACCGC CGGATCCGCG ACGCTCGCGC TCCGGGCGAA CGGCCTGGAA 
CTGCGCAACG ACGGTGCGCC CGAGGCCCCC GGGGGCGCAC CGTCGGGCCT GGCGGGACTC 
GCCGAGCGCG TGCACACCGT GGGCGCACGG CTCGACACCA CCGCCGGCGA CGGCGCCTTC 
GTACTCACCG TGACCTGGGA GGAACGATGA

Protein sequence

MPGPDKFRLY TRAVLQSALV SVLIMLAVTG IRAWSLAGIL IVGIAALAAV EAQPELSMRA 
DDKQRRIAWR FAVLAQAAVF TVSVAVAALA APSPVANDAA VTAFLTYLIA AGSVLPFVRH 
PWPLLVAGAV IIAVLMRDAD TLLRLAVALP LAVALMWTTR ATVWSLNILS EVEESRDMAA 
ELHVAEERLR FARDLHDVVG RGFSAVAVKS ELAATLARAG ATDRAAAEMD EVKSLAVTSM 
EEMRSLVRGY RDVDLAGEVA GARSLLSAAG CRLTVEGSPD DVPTRFHETA AWAVREGTTN 
IVKHSTAGSA TLALRANGLE LRNDGAPEAP GGAPSGLAGL AERVHTVGAR LDTTAGDGAF 
VLTVTWEER