Gene Saro_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1664
Symbol
ID	3918773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1743718
End bp	1745310
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	67%
IMG OID	640444405
Product	histidine kinase
Protein accession	YP_496938
Protein GI	87199681
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.586003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGCGC TGCCGCGCTT CGCCGCCCTG CCATCGCGTG GCGTTCCCAT CGCCGCGGCA 
TGGGCGGCGC TGGCGGTGGC CCTTCTGATC GTGGACGCCG TGGTGCCCGG AGAGAGCCTT 
GCGCTTCACG GCGCTACTCT CACCAGCTTC TGCATCTTCG TTCTCACCTG CATTCGCCAG 
GCGCGGCGGG ACGACGACAG CCAAGACACG GACCGCGAAG CCCTGCGCCA GGAGCTTGAC 
GCTGCCGAAT GCGCCAGCGC TGCGAAGAGC CGGTATCTTG CCAGCGTCAG CCACGAGATC 
CGCTCGCCGC TCAATGCGAT CTATGGCTAT GCGCAGCTCG TCGAGCGCGA AGGCACGGTC 
GATCCGCGCG ATGCGGCCAG GGTCATCCGT CGCAGCGCCG AACATCTCAC TAACCTCGTG 
GAAGGCCTGC TCGACATCGC CTCGATCGAA CAGGGCGTAG TGCGCATCGA CAGCACGGTT 
GCACGCCTCG ATGCGCTGGT CGAGCAGGTG GCGGAAATGT TCCGGCCGCT CGCGGTGCAG 
AAGGGCCTCG CGTTCCGCTG CGATCTTCCC GCGCGTCTGC CCGAGTTCGT GCGGATGGAC 
GAACGTCGGG TGCGGCAGGT GTTGATCAAC CTTGTCTCCA ACGCGGTGAA GTTCACCCAG 
GCGGGCGAAG TGGTCCTGGC GGTGCGCTGG AGCGGCGAAA TAGCGACATT CGAAGTGCGC 
GATACCGGCC CGGGCATTTC CCCGGCCCAT CAGGAGACGG TATTCTCGCC CTACCAGACT 
GGTGGGGTCG AATGTGGCGG CGGTGCCGGA CTGGGACTGG CGATCACGCG TGCGATAGTC 
GACATGCTGG GCGGCGACCT GCGGCTGGAA AGCCGGCTGG GCGAGGGATC GCTGTTCCGC 
GTCGTGCTGA TGATGCCGCA TGTCTCCGGC ATGGTGGACT GTGCCGCGCC GCGCCCTCGA 
CCGGTGGGGT ATCGGGGGGC AAGGCGGTCG CTGTTGCTCG TCGATGACGA TGCCGACCAT 
CTTGCCGTGC TGCGCTGCAC GCTCGAATCC TGTGGGTTCG ACGTTTCGCT GGCGCCCGAC 
GGCGCGGCGG CGCTTGCTCT GGCTCACGCG CGCGCCTTCG ATGCTGTCGT CCTGGACATT 
GCGATGCCGG GATTGTCGGG TTGGGAGGTC GCGGAAAGGC TGCGTGCCGC GCACGGGCAG 
TCATTCAGGC TGGTCATGCT TTCCGCCAAT GCCGAAGAGC GGCACGGGCC ACGGGGCAAG 
GAGCCTGACC ACGACCTGTT CCTGATGAAG CCGGTTGAAC TGTCCGCGCT GGTCGACTCG 
CTGGGCAAGC TGCTGGGGCT GGAGTGGATA CTCTCCGAAG GCGGCGGCGA CACCGTGCTG 
GCCCAGCCGC GGATCGACGT GTCGGACAGC GCGCGGACAC ATGTCGATCG TCTGAAATCG 
TTGGCGAGGA TCGGCCACTT GCGAGGGTTG GAGGCGGAAA TTCGCAGCAT GCAGGAAACG 
GACACCGGGA CGGCGCCACT TGCCGCGCGC CTCTTCGATT GCCTCGACCG GTGCGACCTC 
GTGGCGATGC GGCGGGTGTT GGAGGGCATA TGA

Protein sequence

MIALPRFAAL PSRGVPIAAA WAALAVALLI VDAVVPGESL ALHGATLTSF CIFVLTCIRQ 
ARRDDDSQDT DREALRQELD AAECASAAKS RYLASVSHEI RSPLNAIYGY AQLVEREGTV 
DPRDAARVIR RSAEHLTNLV EGLLDIASIE QGVVRIDSTV ARLDALVEQV AEMFRPLAVQ 
KGLAFRCDLP ARLPEFVRMD ERRVRQVLIN LVSNAVKFTQ AGEVVLAVRW SGEIATFEVR 
DTGPGISPAH QETVFSPYQT GGVECGGGAG LGLAITRAIV DMLGGDLRLE SRLGEGSLFR 
VVLMMPHVSG MVDCAAPRPR PVGYRGARRS LLLVDDDADH LAVLRCTLES CGFDVSLAPD 
GAAALALAHA RAFDAVVLDI AMPGLSGWEV AERLRAAHGQ SFRLVMLSAN AEERHGPRGK 
EPDHDLFLMK PVELSALVDS LGKLLGLEWI LSEGGGDTVL AQPRIDVSDS ARTHVDRLKS 
LARIGHLRGL EAEIRSMQET DTGTAPLAAR LFDCLDRCDL VAMRRVLEGI