Gene Saro_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2047
Symbol
ID	3917694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2185739
End bp	2187115
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	64%
IMG OID	640444799
Product	two component, sigma54 specific, Fis family transcriptional regulator
Protein accession	YP_497320
Protein GI	87200063
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR02915] putative PEP-CTERM system response regulator

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAG CGAAGCCCGG ACAGCGACCG GCACTGCTGA TCGTCGAGGA CGATCCCGGT 
CTGCAGGCGC AGTTGAAATG GGCGTACGAG GATTTCGACG TCTTCATCGC GGGCGACAGG 
GTAAGCGCGC TGACCCTGCT ACGTTCGGTG GAACCGGCGG TCGTGACCCT CGACCTCGGG 
TTGCCGCCCG ATCCTGACGG AACCACCGAG GGCTTTGCCG TGCTCGACGA GATCATGGCC 
CTGCGCCCCG ACACCAAGGT GATCGTCGCA AGCGGCCACG GTGCCCGCGA AAGCGCGCTC 
AAGGCCATCG AGAAGGGGGC GTACGACTTC TACCAGAAGC CGGTGGACAT CGATGCGTTG 
GGCCTGATCG TTCGCCGTGC GCTGCACCTT TCGCGGATCG AGTCCGAAAA TCGCCATCTC 
GCGACCCGTG CAAGCACCGA CAACAGGGTG CTGGGGCGCA TGATCACCGC GGCACCCGAG 
ATGATCAAGG TGGCCCGCAC AATCGAGCGC GTCGCCAATA CCAGCGTCTC GGTGATGCTG 
CTGGGCGCGA GCGGCACCGG CAAGGAACTG TTGGCGCGCG GCCTGCATGA TGCGTCCGGA 
CGCGCACGCG GATCGTTTGT CGCGATCAAC TGCGCGGCCA TTCCGGAGAA TCTGCTCGAA 
AGCGAACTGT TCGGGCACGA GAAGGGAGCG TTTACCGGAG CGGTCAAGAC GACCGAGGGC 
AAGATCGAAC AGGCCAGCGG CGGCACGCTG TTCCTCGACG AAGTGGGCGA CATTCCGCTC 
CAGCTTCAGG TCAAGCTGCT GCGCTTCCTG CAGGAACGGA CGATCGAGCG CATCGGCGGG 
CGAAAGTCGA TCGAGGTCGA TACACGCATC GTCTGCGCCA CGCACCAGAA CCTCGAGGCC 
ATGATTGCCG ATGGGCGGTT CCGCGAGGAC CTTTACTATC GCCTCGCGGA AATCGTTGTG 
CGCATTCCCA GCCTGGCGGA GCGCCCCGGC GATGCGACGC TTCTCGCCAA GACCTTTCTC 
ATGCGCTTTG CCAAGGAGAT GAACCCGCAG GTCAAGGGCT TCGCGCCGGA TGCGCTGGCG 
GCGATCGACA GCTGGAACTG GCCCGGAAAC GTCCGCGAGC TGGAGAACCG CGTCAAGCGT 
GCGGTCATCA TGGCCGACGG CAGGCTGGTT ACCGCAACCG ATCTCGACCT GCCGGGAAAT 
GCGGACGAGG AATCATCGCC GCTCAACCTG AAGACCGCGC GCGAAGCGAC TGACCGCAAG 
GTCATCCGCC ACGCGCTCGC CCGCAGCGAA GGCAACATCT CCAGCACCGC GCGCCTGCTC 
GGCATCAGCA GGCCGACGCT TTATGATCTG CTCAAGCAGT ACGACCTCCA GAACTAG

Protein sequence

MSEAKPGQRP ALLIVEDDPG LQAQLKWAYE DFDVFIAGDR VSALTLLRSV EPAVVTLDLG 
LPPDPDGTTE GFAVLDEIMA LRPDTKVIVA SGHGARESAL KAIEKGAYDF YQKPVDIDAL 
GLIVRRALHL SRIESENRHL ATRASTDNRV LGRMITAAPE MIKVARTIER VANTSVSVML 
LGASGTGKEL LARGLHDASG RARGSFVAIN CAAIPENLLE SELFGHEKGA FTGAVKTTEG 
KIEQASGGTL FLDEVGDIPL QLQVKLLRFL QERTIERIGG RKSIEVDTRI VCATHQNLEA 
MIADGRFRED LYYRLAEIVV RIPSLAERPG DATLLAKTFL MRFAKEMNPQ VKGFAPDALA 
AIDSWNWPGN VRELENRVKR AVIMADGRLV TATDLDLPGN ADEESSPLNL KTAREATDRK 
VIRHALARSE GNISSTARLL GISRPTLYDL LKQYDLQN