Gene Noca_2984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2984
Symbol
ID	4595622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3172990
End bp	3174627
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	70%
IMG OID	639777589
Product	chemotaxis sensory transducer
Protein accession	YP_924173
Protein GI	119717208
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.660626
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCACGT CCACCGCCCA GACCGAGCGC CCGGCGCCGC CACGCTCCGG CCTGCGTCTG 
CTGCACTGGT TCGACAACCG TCGGCTGCGC ACCAAGGTGC TCGCCGTCTC CCTCATCGGC 
ATCGTGCTCG CGGGCACGAT CGGCCAGCTC GCGATCATCC AGATGGGCAA GATCGCCGAC 
GAGGCGGCCG CGATCGAGAC CGAGGGCCTG AAGCCGGTCG ACCACGCCAA TGCGGTGCGC 
GAGGCCTTCC TGCAGACCCG GATCGACGGG CTGAGCGATC AGCAGCAGAC CAGCGACGGT 
ACCGCCCACG ACGCCTACCT GGCCGACATC GACGCAGTCG ACGCCGCCCT TGCGACGTTC 
GAGAAGGACT TGGATCCCGA GGACATGCAG ATGATGGCGG ACTTCCGGGC CAACTGGGAC 
GCCTACACCG AGCTCGCCGG TGGCGAGGTC CTCACCCTCG CCCGGGAGCG CAAGTTCGAC 
CAGCTCGACG CGCTGCGCCA GAAGGAGGTC GCCCCACTGG CGGCCGCGCT CGGCCAGACC 
CTCACGGACC TCGAGGACAT GATCAATGGC GAGGCCGCCA CCGCGGTCGA GCACGCACGC 
TCGACGTACA CCAGCGCGCG CACCATGGTC TACATCGCCC TGGGGATCGG CCTGCTGCTC 
ACCCTGGCCC TCTCGCTGTT CGTGGCCCGC CGGATCACCC GGCCGATCGA CCAGACGGCG 
ACCGCCCTGC GCGCGCTCGC CGAGGGCGAG CTGGCCCAGC ACCTCGACCT CGACACGAAG 
GACGAGGTCG GTCAGATGGC CACCGCGCTG AACGTCGCGA GCGAGAAGCT CGCCGAGGCG 
ATGTCCGACA TCGCCGGCAA CGCCGAGACC CTGGCGTCCG CCTCGCAGGA GCTGTCCAGC 
GTGTCCGGGC AGATGTCCGG GACGGCACAG GAGTCCGCGA CCCAGGCCGG CGTGGTGTCC 
AGCGCGGCCG AGCAGGTCTC GCGCAACGTG CAGACCGTCG CCACCGGCAC CGAGGAGATG 
TCGGCGTCGA TCCGGGAGAT CGCCCAGAAC GCCACCAGCG CCGCGAACGT CGCCGCCGAC 
GCCGTCCGGG TCGCCGACTC GGCGAACTCG ACGGTGGCCA AGCTCGGCGA GTCCTCCTCC 
GAGGTCGGCA ACGTGATCAA GGTGATCAAC TCGATCGCCG AGCAGACCAA CCTGCTGGCG 
CTCAACGCCA CCATCGAGGC CGCCCGCGCC GGCGAGGCCG GCAAGGGCTT CGCGGTGGTC 
GCCAACGAGG TCAAGGAGCT GGCCCAGGAG ACCGCCCGCG CCACCGAGGA CATCAGCCGC 
CGGATCGAGA CGATCCAGAC CGACACCGAG GCCGCGGTCG CGGCGATCAG CCAGATCTCC 
GGGATCATCG CCCAGATCAA CGACGCCCAG ACCACGATCG CCTCGGCCGT CGAGGAACAG 
ACCGCGACCA CCAACGAGAT GTCGCGCAAC GTCTCCGAGG CAGCGCTCGG CTCGACCGAC 
ATCGCCGACA ACATCACCGG CGTCGCGCGG TCCGCCTCCG ACACGACGGT CGCCGCGGAG 
AGCACCAGCC AGGCCGCCGA GGAGCTGGCC CGGATGGCGG CCAAGATGCA GCAGCTCGTC 
GGGCAGTTCC GCTACTAG

Protein sequence

MSTSTAQTER PAPPRSGLRL LHWFDNRRLR TKVLAVSLIG IVLAGTIGQL AIIQMGKIAD 
EAAAIETEGL KPVDHANAVR EAFLQTRIDG LSDQQQTSDG TAHDAYLADI DAVDAALATF 
EKDLDPEDMQ MMADFRANWD AYTELAGGEV LTLARERKFD QLDALRQKEV APLAAALGQT 
LTDLEDMING EAATAVEHAR STYTSARTMV YIALGIGLLL TLALSLFVAR RITRPIDQTA 
TALRALAEGE LAQHLDLDTK DEVGQMATAL NVASEKLAEA MSDIAGNAET LASASQELSS 
VSGQMSGTAQ ESATQAGVVS SAAEQVSRNV QTVATGTEEM SASIREIAQN ATSAANVAAD 
AVRVADSANS TVAKLGESSS EVGNVIKVIN SIAEQTNLLA LNATIEAARA GEAGKGFAVV 
ANEVKELAQE TARATEDISR RIETIQTDTE AAVAAISQIS GIIAQINDAQ TTIASAVEEQ 
TATTNEMSRN VSEAALGSTD IADNITGVAR SASDTTVAAE STSQAAEELA RMAAKMQQLV 
GQFRY