Gene Saro_0807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0807
Symbol
ID	3915861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	858057
End bp	859577
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	68%
IMG OID	640443538
Product	XRE family transcriptional regulator
Protein accession	YP_496086
Protein GI	87198829
COG category	[R] General function prediction only
COG ID	[COG3800] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGGGC TCAACTGCGG TTTGGCCTTC CACCTGCGCC AGAGCGGTTG CCAAGTCCAA 
TGTTATTCTG CAAACTTGCG AAGGCACACT TTGCAAATTG GAATACGGGA AATGGCCAGA 
CGCCGCCTCT TTGCGGGAGA ACAGCTCAAG GCCTTGCGCA GCGCGCGCAA GCTGCGCCAG 
GGCGAAATGG CCGCGCTGCT GGGCATCAGC GCCTCCTACC TCTCGCAGAT CGAGAACGAC 
GAACGCCCGC TGACGCCGGC GCTGACGGAC CGCCTGCAAT CGAGCTTCCC CGTCGAATGG 
CAGGACTTCG CCTCGGACCG GGTCGAGCCG GTCCTGGCCG CGCTGCGCGA TGCCACCGCC 
GACCCGCTCA TCGGCCAGGC CCTGCCGGGC GAGCAGGTGG AGCGCGTGGC AGAACAATAC 
CCCGCTTTCG CCCAGGCCTT CGCCCGCCTG TGGGACCAGC ACCGCCGCTC GGTCCAGCGG 
CTCGAGATCA TCGATGAGGC ACTGGGCTCC GACAACATCT CCGGCGGTCG ACTGCCGTGG 
GAGGAAGTGC GCGACTGGTT TCACCACGCC AACAACTACG TCGACGCCAT CGACCGCGCT 
GCGGAACGGC TAGCCATCCG CCTTTCCGGC ACCGGCATGT CTCCCACGAT GGGACAGATG 
GCGGTCTGGC TCGAAAGCCG GGGCATCGCG GTCGAGCAGG TCAGCGGCGG AGCCATGCGG 
CGTTTCGACC CCGAGGCTCG CCGCCTCACC CTCGATCCAA ACCAGCCGGT CGAGTCCGGC 
CGGTTCCAGA TGGCCTACCA GCTCGCCGCC GAAGCCCTGA GCGAGGAGAT CGCGGCCATC 
GTGAACGAGG CGACGCTCCA ATCCGCCGCC GCGCGCCAGC TCCTCACCGT CGGCCTCGGC 
AACTATGCCG CGGGCGCGCT GATCATGCCC TATGAGTGGT TCCGCACCCG CGCGCGCGAA 
CTGCGCCACG ACATCGACCA GTTGCGCCAG CTCTTCGGCG CCAGTTTCGA ACAGGTCTGC 
CACCGCCTGT CCACGCTGCA ACGCCCCCAG GCGCGCGGCA TTCCGATGTT CTTTTGCCGT 
GTCGACATGG CCGGGAACAT CACCAAGCGC CATTCCGCCA CGCGCCTGCA ATTCGCCCGC 
TTCGGCGGCG CCTGCCCGCT ATGGGTGGTG CACGAAGCCG TGGCGATCCC CGACCGCATC 
CACGTCCAGG CCGCGGAGAT GCCCGACGGC GTGCGCTACG TCTCGATCGC CAAGGGTCTG 
GTGAAGCCTT CGGGCAGCTA CTATCGCCCG CCGCGCCGCT ACGCCGTGGC GCTCGGCTGC 
GAGGCGGCGC TGGCGGACGA GTTCATCTAC GCCGACGGCA TCAATCTGGC GCGGCCCGAG 
GCGGTTACCC GCATCGGCAT TTCCTGCCGC ATCTGCCCGC GCGACCGCTG CGACCAGCGC 
GCCTTCCCGC CCAGCGACCG GGCGATCCTC GTCGACCCCC ACGCCCGCGA CCTCGTCCCT 
TACGGAATCA CCGACATCTA G

Protein sequence

MFGLNCGLAF HLRQSGCQVQ CYSANLRRHT LQIGIREMAR RRLFAGEQLK ALRSARKLRQ 
GEMAALLGIS ASYLSQIEND ERPLTPALTD RLQSSFPVEW QDFASDRVEP VLAALRDATA 
DPLIGQALPG EQVERVAEQY PAFAQAFARL WDQHRRSVQR LEIIDEALGS DNISGGRLPW 
EEVRDWFHHA NNYVDAIDRA AERLAIRLSG TGMSPTMGQM AVWLESRGIA VEQVSGGAMR 
RFDPEARRLT LDPNQPVESG RFQMAYQLAA EALSEEIAAI VNEATLQSAA ARQLLTVGLG 
NYAAGALIMP YEWFRTRARE LRHDIDQLRQ LFGASFEQVC HRLSTLQRPQ ARGIPMFFCR 
VDMAGNITKR HSATRLQFAR FGGACPLWVV HEAVAIPDRI HVQAAEMPDG VRYVSIAKGL 
VKPSGSYYRP PRRYAVALGC EAALADEFIY ADGINLARPE AVTRIGISCR ICPRDRCDQR 
AFPPSDRAIL VDPHARDLVP YGITDI