Gene Saro_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3089
Symbol
ID	3916704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3309817
End bp	3311067
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	63%
IMG OID	640445872
Product	LuxR family transcriptional regulator
Protein accession	YP_498358
Protein GI	87201101
COG category	[K] Transcription
COG ID	[COG2771] DNA-binding HTH domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGAGC GGCACCTACG ATTCCCTGCG CTTCTGTCGT GTCGCAATGG CCAGGCTGGG 
CAGCACGCAT ACTGCTTGCC GGGCAATTTT CGGGAGACTA CTCACGATCT CATGTCCGAT 
CTTCCCCTTC TGTCCGGAAG GCCCCTGCCC GACGACGTTG AGGACCTTGC TGACCTGCTT 
TTCAGCGGCC TGGCCGAGCG GCCACTTTGG AGCAGCTTTC TGATCCGGAT CGCCCGGAGA 
CTGAAAGCGG ATGCAGCCGC GTTTGTAATC TCTTCGCGCG GGCACAAGGC GACCGACAGC 
GCTGTTCTCG TTCCCGATGG TCAGGAAGCC GAGCCTTTCG CCCGGTTGAT CGAGCTTGAG 
ACTTTCGCCG ACGTGGACTT CGACCGTCCG CAGATTCTTG TCGGGCGCAA CGAGAATTGT 
CCTGCGGGCG AGCATGTCGT GCTGCGGCTG CGGTTCGATG GTGACCGATC CGTCTGGATG 
ATCTGTTCGA CCCAGGCTTC TGGTGCAGCC ATGCTGGTCG CGGATTGGCA GGAGGTCCTG 
CTGGCGCTGC TCCCGCTGTT GCAGCGAGTT GTCCGGCTTT ATCTCGCGAT TGGCGAGAGC 
GAGCGACAGC GAAGAATTGC CGAGTACGTG CTTGAGACCA GCGGCGTGGG AGTGATCCTG 
GTTGACAGTG CGGGGTCTGT GGTCACGGTC AACGCGGCGG CCGAGGCGAT CATGGCCCAA 
ACACACGTAT TGCATATTCA TGGCGGGCAG TTGCATGCCC AGCGCCAGAC CGACCAGCAG 
CTACTGCTTC GACACATCCG TGAAAAGTCC GAGCAGCAAA GCGCGAACGA TGCCGTTCCA 
GGTTGTTATG CCGCATTTGC GCTGCTGCGT GACGATCATC CTCTGCCTGT CACAGTGATG 
GTCCGTCCAG GGCCGCCATT CGGTCCGGTA TCCGCGCCAC TGCGCCGGAC CGCCACGGTT 
ATCCTGCGCG ACCCGGCGCG GCGGCTCGGT CTGGCCAGTC CAGATCTGGA GCAACTGTTC 
GGCCTCAGCC CGGCCGAAGC CCGGCTGGCC CAGTTGCTCG CTGATGGCCT CAGCACCGAA 
GAGGCCGCGC TGCAGTTGGG GGTCAGCCGC AACACCGTGC GTTCCCAGCT CCAGGCCGTG 
TTCGCGAAAA CCGGAACCAA CCGGCAGGGT GATCTGGTGC GCCTGTTGCT GAGTTCCGCC 
GCCACGCTGA CCCAGCGTAG CGGGGAGGTG CCCTCGACGA CCAGGAGGTG A

Protein sequence

MVERHLRFPA LLSCRNGQAG QHAYCLPGNF RETTHDLMSD LPLLSGRPLP DDVEDLADLL 
FSGLAERPLW SSFLIRIARR LKADAAAFVI SSRGHKATDS AVLVPDGQEA EPFARLIELE 
TFADVDFDRP QILVGRNENC PAGEHVVLRL RFDGDRSVWM ICSTQASGAA MLVADWQEVL 
LALLPLLQRV VRLYLAIGES ERQRRIAEYV LETSGVGVIL VDSAGSVVTV NAAAEAIMAQ 
THVLHIHGGQ LHAQRQTDQQ LLLRHIREKS EQQSANDAVP GCYAAFALLR DDHPLPVTVM 
VRPGPPFGPV SAPLRRTATV ILRDPARRLG LASPDLEQLF GLSPAEARLA QLLADGLSTE 
EAALQLGVSR NTVRSQLQAV FAKTGTNRQG DLVRLLLSSA ATLTQRSGEV PSTTRR