Gene Noca_1019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1019
Symbol
ID	4599680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1070611
End bp	1071789
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	75%
IMG OID	639775618
Product	histidine kinase, dimerisation and phosphoacceptor region
Protein accession	YP_922225
Protein GI	119715260
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.181556
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCAGT TCCGGCGGCA GCTCTCGACG TACGGTCTCG ACGCCCTCCT CGACGCCCTC 
CTCGGCGTGG CCGCCGTGTG GAGTGCCGTC GGCACCCTGC GCCGCGACGA TCGGTACCTC 
CCGGCCGGGG CCGCGGCGTG GTGGGAGGCC GCGGCGATCG CCGCGATCAT CCTCGTCCTC 
GTGCTGCGCC GTCGGTTCCC GTTCGGTGCG CCTGCCGGTG TCTGGCTGAC GTGTGCGGCG 
CTCTCCTTCG CCGACGGGCG GATGATCCCC AGCCAGGCCG GCCTCTTCGT CGCCGGGCTC 
GGCGCCGCGC TGCTTCTCGG CAACCAACGC AACGGAGTGC AGGCGCGGGT CGGCCTGGCC 
ATCGTGGTCG GCAGCGGCGC GATCGTCATG TACAACGACC CCACGCACTC GTCCGGTGCC 
CTGGTCTCCA CTCCGCTGCT GTTCGCGATG GCCTGGCTGG TCGGCTACGC GCTGCGCGAG 
CGCACCGAGC GGACCGAGGC CGCGGAGGAG CGCGCCGCTC GTGCCGAGCG CGACCGCGAG 
GTGGCGGCGC GCGTGGCCGT GGCGGAGGAG CGCGGCCGGA TCGCGCGGGA GCTCCACGAC 
GTCGTGGCGC ACGCGGTCAG CGTGATGGTC CTCCAGGTCG GCGCCGTCCG GCACCGGATG 
TCCGACTCCG ACGCGGAGAA CCGCGAGGCG CTCGAGAACG TCGAGCGGGC CGGGCGGGCC 
GCCCTCGCCG AGATGCGCCG CCTGCTCGGG GCGATGCGGC GCGACGGCGA GCAGCCCGAG 
CTGGTGCCGC ATCCGGGCCT GGCCGACCTG GACAGCCTGC TCGCGGACGT GCGGGCTGCC 
GGGCTGCCCG TCCGGCTGCA GGTCCACGGC GAGCCGGTCG AGCTGCCGCC GGGGCTCGAT 
CTCTCGGCGT ACCGCATCGT GCAGGAGGCC ATCACCAACA CCCTCAAGCA CGCCCGGGCG 
CACCGCGCGG ACGTGGACGT GTACTACGAG CCCCACGACC TTCGGGTGGA GGTCCGCGAC 
GACGGCCGGG GCTCGACGTC CGGTGCTGGG CTGGGGCACG GGCTGGTGGG CCTGCGCGAG 
CGGGTCAAGA TCTACGGCGG GGAGATGACG GCGGGCCGAG GTCCTGCCGG AGGGTTCGCG 
GTGCGCGCAC GGCTTCCGTT GGACGGTGAC GGGTCATGA

Protein sequence

MSQFRRQLST YGLDALLDAL LGVAAVWSAV GTLRRDDRYL PAGAAAWWEA AAIAAIILVL 
VLRRRFPFGA PAGVWLTCAA LSFADGRMIP SQAGLFVAGL GAALLLGNQR NGVQARVGLA 
IVVGSGAIVM YNDPTHSSGA LVSTPLLFAM AWLVGYALRE RTERTEAAEE RAARAERDRE 
VAARVAVAEE RGRIARELHD VVAHAVSVMV LQVGAVRHRM SDSDAENREA LENVERAGRA 
ALAEMRRLLG AMRRDGEQPE LVPHPGLADL DSLLADVRAA GLPVRLQVHG EPVELPPGLD 
LSAYRIVQEA ITNTLKHARA HRADVDVYYE PHDLRVEVRD DGRGSTSGAG LGHGLVGLRE 
RVKIYGGEMT AGRGPAGGFA VRARLPLDGD GS