Gene Saro_1600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1600
Symbol
ID	3918708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1663284
End bp	1664690
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	69%
IMG OID	640444340
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_496874
Protein GI	87199617
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.298704
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGCGCG GGATGCTGCG CTCGACGACC GTGCGGTTCG CCGCGCTCGT GTTCCTGCTG 
CAGGTCGTGG CAGCGGCGTT CATGCTGGGC GGCCTTGGCG CCGTAATGCG GCAGCAGAGC 
CGCGCGCAGG CCCTCGATAC CGTGGAAACC CTGCGCGACG ACCTGATGGC GACGACGGCA 
CAGGGCGGCG AGCGGCAATT GGTCGAGGCG ATCAGGCTGC GGCTGGCGAA CGAGGTCGGC 
CGGGGTGTCG TGGTGGCGCT GGTGGACCCG TCCGGACGTC TGGTGGAGGG CAATCTGGCT 
CGCATGCCCG ACGACGGTTT CGCCGTGCAC CTGAACAGGG TCGCCAGCGT CGTCAACGTG 
CGACGGCGCA ATCACGCGGC TGACGAGGCA GCTCTCATCG TAGCTGCGCG CCTGCCCGGC 
GGCCAACTAC TGCTCGCCGG AACGGTGGTG GAAAGCGACA GGCAATTCCT GGCGCTGCTC 
GAACGCGCCA GCATTGCGAC GCTGGCGTTG TCCCTTCTTC TGGCGGGGCT GGCGTCCTTT 
CTGGCGACGC GGCAGATCGT CCAGCGGTTG CGCGGTACGG TCGCGACGCT CGAGGCCGTC 
GGGGCAGGCG ATCTGGCCCG CCGGGTGCCG CCCGACGGGT CCGGAGACGC GTTTTCGCGG 
CTGGGCGAGG AGGTCAACCG CGCGCTGGCC CGGGCCGAGG CGCTGAACGG GGAACTGAAA 
ATTGCGACCG ACGTCCTCGC CCACGATCTC AAGTCACCTT TGACGCGATT GCTGTCGGCG 
CTGGATCGCG CTTCGGCCCG CGCCGAGGAT GCCGAGGCGC TTGCCGCCGT TGAGCAAGCC 
GAGGCGGAGG CACGGCGGGT GCTTTCGATC ATCGACACGG CGCTTGGCAT CTCGAAGGCC 
GAGGCGGGGT TCGGCCGCGA GAGTTTCACG CCTGTCGATC TCGGCGCAAT GCTCGAGACG 
ATCGCCGAAA TCTACGCGCC GGTGGTGGAA GAGGAGGGGC GTCGCATGGA AGTGCAGGCA 
CCGCCGGGAC TGGTGGTGCC GATCCATCGC CAGCTCATGG ATCAGGCCAT CGGCAACCTG 
CTGGACAACA CGATCCGTTA TGGCGCCGGG GCGATAAGCC TTGCTGTGGA GCCGCGCGAC 
GGCGCGATGG CGATTTCGGT TGCTGACGAA GGGCCCGGCA TTCCGCAACA CCAGCACGAA 
GAAGCGCTGC GCAGGTTCGG AAGGCTCGAC GAGGCGCGTG GCGGTTGGGG CGCAGGGCTC 
GGGCTCGCTC TGGTCGAAGC GGTCGCGCAC TTGCACGGAG GGCGGGTCGA ACTGGCCGAA 
AACCGGCAAT CGCGGTCCGG CCAGCCGGGT TTGAAGGTGA CGCTGGTGCT CGGGCAACGC 
GCTCCGGGCG GCGGCGATAG CGGTTGA

Protein sequence

MLRGMLRSTT VRFAALVFLL QVVAAAFMLG GLGAVMRQQS RAQALDTVET LRDDLMATTA 
QGGERQLVEA IRLRLANEVG RGVVVALVDP SGRLVEGNLA RMPDDGFAVH LNRVASVVNV 
RRRNHAADEA ALIVAARLPG GQLLLAGTVV ESDRQFLALL ERASIATLAL SLLLAGLASF 
LATRQIVQRL RGTVATLEAV GAGDLARRVP PDGSGDAFSR LGEEVNRALA RAEALNGELK 
IATDVLAHDL KSPLTRLLSA LDRASARAED AEALAAVEQA EAEARRVLSI IDTALGISKA 
EAGFGRESFT PVDLGAMLET IAEIYAPVVE EEGRRMEVQA PPGLVVPIHR QLMDQAIGNL 
LDNTIRYGAG AISLAVEPRD GAMAISVADE GPGIPQHQHE EALRRFGRLD EARGGWGAGL 
GLALVEAVAH LHGGRVELAE NRQSRSGQPG LKVTLVLGQR APGGGDSG