Gene Saro_3209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3209
Symbol
ID	3917467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3426482
End bp	3427507
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	66%
IMG OID	640445993
Product	ArsR family transcriptional regulator
Protein accession	YP_498478
Protein GI	87201221
COG category	[H] Coenzyme transport and metabolism [K] Transcription
COG ID	[COG0640] Predicted transcriptional regulators [COG2226] Methylase involved in ubiquinone/menaquinone biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAACT CGATGACCAT CCTAGACGCC ATCCGTGCGC TCGATGACCC GACGCGCCTG 
CGCATCATGC GCTTGCTCGC CAGCATGGAA CTGGCGGTGG GCGAGGTCGC GCAAGTATTG 
GGACAGAGCC AGCCGCGCGT CTCGCGTCAC ATCAAGATCC TTTGCGATTC GGGCCTTGCC 
GAACGTCGGA AGGAAGGCGC CTGGGTGTTT CTGCGCAGTT CCATCGGCGA AGGCGCGGAA 
AGCCCGCTCG CCTCTGCGCT GGCGCGCCTG CTGGCCGTCG CGGAGCACGA AGACACGGCT 
TTTGGCCGCC GTTGCTCCGA AGACCGCCAG CATCTCGACG CTATCCGTTC GTCGCGGGAG 
AGCCACGCGC TCGAATGGTT CGCCCGCCAT GCCGACGAGT GGGACGAATT GCGCTCCCTT 
CATATCGCCG ATGGTCCGGT CGAGGCCGCG CTTACCGAGA TGCTCCTGGC GCTTTCAGGC 
GACGGTTCGC TCGGTCGCCT GCTCGACGTC GGCACCGGTA CCGGCCGGAT CGCCGAACTC 
TTTGCGCCCA ATGCCGCCCA TGTCGTCGCC TTCGACAAGA GCCCGGACAT GCTGCGCATC 
GCGCGCGCGC GCCTCCAGCA TTTGCCAGCC GACGCGGTGG AACTGGTCCA GGGCGATTTC 
GCGCAACTTC CCTTCGCCGC GCGCAGCTTC GATACCGTAC TGTTTCATCA GGTTCTGCAC 
TACGCCCAGG CACCGGAAGC AGTGCTCGCC GGCGCGGCTC GCGTTACCGC ACCCGGTGGC 
CGCGTCGCCA TCGTCGACTT CGCCGCGCAC GAGCGCGAGG ACCTGCGCCA GACCCATGCC 
CACGCCCGCC TCGGCTTCTC CGACGCGCAG ATCGAGACGA TGCTGCTCGA TGCCGGTTTC 
ATTCCGCACG AGACCCGCGC GCTCGCCGGC CATGAACTCG TCGTCAAGCT GTGGACCGCA 
GTCCGCCGCG AAGACAGCGT CACCCAGCTT GAACCCCGTC AGAAATCCAG CTCCGGAAAG 
ACCTGA

Protein sequence

MKNSMTILDA IRALDDPTRL RIMRLLASME LAVGEVAQVL GQSQPRVSRH IKILCDSGLA 
ERRKEGAWVF LRSSIGEGAE SPLASALARL LAVAEHEDTA FGRRCSEDRQ HLDAIRSSRE 
SHALEWFARH ADEWDELRSL HIADGPVEAA LTEMLLALSG DGSLGRLLDV GTGTGRIAEL 
FAPNAAHVVA FDKSPDMLRI ARARLQHLPA DAVELVQGDF AQLPFAARSF DTVLFHQVLH 
YAQAPEAVLA GAARVTAPGG RVAIVDFAAH EREDLRQTHA HARLGFSDAQ IETMLLDAGF 
IPHETRALAG HELVVKLWTA VRREDSVTQL EPRQKSSSGK T