Gene Noca_4901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4901
Symbol
ID	4595276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008697
Strand	+
Start bp	233319
End bp	234470
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	71%
IMG OID	639772686
Product	histidine kinase, dimerisation and phosphoacceptor region
Protein accession	YP_919346
Protein GI	119714204
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.316421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.344545
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCGT CCGCGATCGC CGGGAGGTAC CGCGACCAGA TTCTGGCCGC GGGCCTCGCA 
GCGTTCTACG CGCTCGAGGT GCTGTTCAGT AGCGAAGTCG AGCACCACCG GGGCTCAGCA 
GCCGCCGTCG CGGTGCTGAT GGCCGTCAGC CTCGTCGTAC GCCTCACGAT GCCCCTGCTG 
CCGCTGGTGG CCGTGATCGC CGTCATCCAG CTCAACCACA CCGTCCTCCC CGGCTTGGCC 
GAGGGAGGCG CGTTCATGAT CGCCTTGATC GTCACGATTT TCTCCGCCGG CCACTACCTG 
CACGGGCGGA TGCTGGCCCT GGGCGGCGTG ATCGTCGCGG GCATCATCCC GCTGGCGGCG 
CTCGACCCCC GCCAGCCGCC AGCGGTCGGC GACTGGATCT TCTTCATCGT GTATCTCGGT 
ACGCCATTCG TGGCGGGAGT CGTGTTCCGC CGCCGCCGCG AACGCGACCG GGAGATGACC 
GAGATGGCCC GGCGCGCAGA GGAGGAGGGC GAGACGCGGG CCGGTGAGGC TGTCGCCGCG 
GAGCGCGCCC GAATCGCTCG GGAACTGCAC GACGTGGTTG CTCACGCGAT CAGCGTCATC 
GTGGTCCAGG CTCGCGGCGG ACGTCGGGTC CTGGCCGACG ACACCGGAGG GGCGCGGAGT 
GCGTTCGACG TCATCGAGCA CGCCGGGGAG CAGGCACTGA CCGAGATGCG GCGATTGCTG 
GCGCTCTTAC GAGAGACGGA GCCGGAGGCA GCGGCGTTAC AGCCGCAGCC GAGCCTGGGC 
CGCATCGACG TGCTCGCCAC CGAAGTGGCG GCGTCCGGTT TGCCGGTTGA GGTCGTCCGC 
GAGGGCGACC CGGTCGAACT GCCGCCCGGG GTGGATCTCT CGGCGTACCG GATCGTGCAG 
GAAGCACTGA CCAACGCCCT CAAGCACGCC GGGCCGGCTC GCGCCCGAGT GGTGCTGCGC 
TACCTGCCGC GGGCATTCGA GGTGGAGGTG CTCGACGACG GTCACGGGAC CGGCGCGGGC 
GGCGGTTCGG GGCACGGGCT GACCGGCGTC CGCGAGCGCG TCGAGGTCTA CGGCGGTCAG 
CTCTCGGCGG GCACTCGGCC CGAGGGTGGG TTTGCCGTGC GAGCGCGGCT GCCGATCGAG 
ATACCGTCAT GA

Protein sequence

MDASAIAGRY RDQILAAGLA AFYALEVLFS SEVEHHRGSA AAVAVLMAVS LVVRLTMPLL 
PLVAVIAVIQ LNHTVLPGLA EGGAFMIALI VTIFSAGHYL HGRMLALGGV IVAGIIPLAA 
LDPRQPPAVG DWIFFIVYLG TPFVAGVVFR RRRERDREMT EMARRAEEEG ETRAGEAVAA 
ERARIARELH DVVAHAISVI VVQARGGRRV LADDTGGARS AFDVIEHAGE QALTEMRRLL 
ALLRETEPEA AALQPQPSLG RIDVLATEVA ASGLPVEVVR EGDPVELPPG VDLSAYRIVQ 
EALTNALKHA GPARARVVLR YLPRAFEVEV LDDGHGTGAG GGSGHGLTGV RERVEVYGGQ 
LSAGTRPEGG FAVRARLPIE IPS