Gene Saro_3595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3595
Symbol
ID	5077744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	218660
End bp	219805
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	640481319
Product	LuxR family transcriptional regulator
Protein accession	YP_001165981
Protein GI	146275821
COG category	[K] Transcription
COG ID	[COG2771] DNA-binding HTH domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.351896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGGT TACCCGCCTA TGCTGTCGCG ATGGCGGGTA CGGTGGACCT CGAATTTTCG 
GACCTGATCG CGCGGCTCTA TTCCGGCATC GGAGAGGAGC AGCCGTGGCG CGGCTTTCTC 
GAGGCGCTGG CGCGGTGGAT GGACGCGACT TTCGCCACGC TCATCATCAC CGCTCCCGGC 
AAGCGCCAGC CGGCAACCTT CCTGACCCCC GGCGGTAGCG CCGACTTTGC CAGCAACTAT 
GCCGAGAGCC TCTTTGCCGA GGATCCGTTC CAGGGCCTCG CGGACGGGGT GGTCACGTCC 
TATGCCGAAT TCATGGCCGG CCTGCCGGAC GAGGCCTTTC CCGAATATCG CCGCACCATG 
GCGGACACCG GCTTCGACCA GGTGCTTGGA ATCGATCTCC ACTTTGGCGG GGCGCAGGCG 
CGCCGGGCCG ATGACGGGCG CTACGAGGCG CGCTTTCGCA TAAGCCGCCA CAACGCCCTG 
CCCGACTTCA ATCGCGAGGA TCGCGCGCGG CTTCAGGCGC TGTCGCAACA CTTGCGCATC 
GCGGTGGGCC TGTTCGAGAG GTTGCAGTTC GCGGGCGCCC AGCACGGCGT GTTCCATGCC 
ACCGCGCAGG GGCTCGGCCT TGCTCTCGTG GTTCTCGACC GCAACCGCCG CATCGTCAGC 
ACCAACGCAC TGGCCGACAG CATCCTTGGC GAGGACGAAG GCCTGAGACG GCGGGGCGAG 
GAACTGGCGC TTGCCGATCC GGCGCACCAG CGGCTGGTGG TCGACCTGCT GGCGGGCGGA 
GCGGTGGGAC CGGGGTTGAC GCGATTCCGT ATCGAACGGC CGGGCCACGG CGATCTTGTC 
GTCACCGCGC GACCGCTCGA TGTCAGCGCG ATCCATTCCG GAGCGGGGGC GCTGGCGCTG 
TTCCTGGCAC GGCCGGGGCC GGAAAAGAGC ACCGACCCCC AGGCCCTGCG CGACCTGCTG 
GGCCTGACCA TGGCCGAGGC GCGGCTCGCC GCCGTGCTGG CCGAGGGGCA CAGCCTGGTC 
GAGGCGGCGA GGCGGCTTGG CATCGCGCAC AACACCGCGA AAGTGCAATT ACGCGCGGTC 
TTCGCCAAGA CCGGTGTGCA CCGGCAGGCG CAGCTCGTTG CCTTGCTCGC ATCGCTTGGA 
GGGTAG

Protein sequence

MSRLPAYAVA MAGTVDLEFS DLIARLYSGI GEEQPWRGFL EALARWMDAT FATLIITAPG 
KRQPATFLTP GGSADFASNY AESLFAEDPF QGLADGVVTS YAEFMAGLPD EAFPEYRRTM 
ADTGFDQVLG IDLHFGGAQA RRADDGRYEA RFRISRHNAL PDFNREDRAR LQALSQHLRI 
AVGLFERLQF AGAQHGVFHA TAQGLGLALV VLDRNRRIVS TNALADSILG EDEGLRRRGE 
ELALADPAHQ RLVVDLLAGG AVGPGLTRFR IERPGHGDLV VTARPLDVSA IHSGAGALAL 
FLARPGPEKS TDPQALRDLL GLTMAEARLA AVLAEGHSLV EAARRLGIAH NTAKVQLRAV 
FAKTGVHRQA QLVALLASLG G