Gene Saro_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2040
Symbol
ID	3917687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2177102
End bp	2178367
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	65%
IMG OID	640444792
Product	radical SAM family protein
Protein accession	YP_497313
Protein GI	87200056
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCAGC CGTCCCTTCC AGCCGGAAAG TCCGTAATCG AGCGTCTCGC GATCCTCGCC 
GATGCGGCCA AGTACGATGC TTCGTGCGCC TCGTCGGGCA CGACCAAACG CAACAGTAAG 
GGCGGCAAGG GGATAGGTTC GACCGAGGGC ATGGGGATCT GCCACGCCTA CGCGCCCGAT 
GGCCGCTGCA TATCCCTGCT CAAGATCCTG CTGACGAACC ACTGCGTGTT CGATTGCCAT 
TACTGCGTGA ACCGCAAGAG TTCGAACACC CCACGCGCGC GCTTTACCCC CCAGGAAGTG 
GTCGACCTGA CGCTATCGTT CTACCGCCGC AATTACATCG AGGGTCTGTT CCTCTCCTCA 
GGTATCGTGA AAAGCTCCAG CCATACGATG GAGCAGTTGA TAGAAGTCGC CCGTATCCTG 
CGGGAAGAGC ACGATTTTCG CGGGTATATC CATCTCAAGA CCATCCCTGA GGCCGATCCC 
GATCTGGTCG CGCGGGCGGG GCTGTTCGCC GATCGCGTCT CGATCAACGT GGAACTGCCC 
ACCGTGGCGG GCCTCACGCG CCTTGCGCCC GACAAGTCCG CGCCGCAGAT CGAAGGCGCG 
ATGGGATCGC TGAAGCAGGC GATTGCCGAG GCGAAGGACG CCCGCAAGCG TTTCCGCCAT 
GCGCCGAAGT TTGCGCCCGC GGGCCAGTCC ACTCAGATGA TCGTCGGCGC TGATGCCGCG 
ACCGATGCTG ACATCGTCGG CCGCGCGAGC ACGCTTTATG ATCGATTCCG CCTCCGCCGC 
GTCTATTATT CAGCATTCAG CCCCATTCCC GATGCCAGCG CCGTCCTTCC GCTGAAACGC 
CCACCCTTGA TGCGCGAGCA TCGCCTCTAC CAGTCCGACT GGCTGATGCG CTTTTATGGC 
TACGCCCCGC ACGAGGTGCA GCAGGCGGCG GGGGACGACG GGATGCTTCC GCTCGACATC 
GACCCCAAGC TGTCCTGGGC CTTGCGTTTT CGCGGCGATT TCCCGGTCGA CATCAACCGC 
GCCCCGCGCG AGAGGCTGCT GCGCGTTCCA GGGCTGGGGG TGAAGGCGGT CAACGCGCTC 
ATCGCCGCGC GCCGTCAGCG CCGCTTGCGC CTGGCGGACA TCGGCAAGCT CACGGTTTCG 
CTCGCCAAGG TGCGCCCGTT CATCGTGGCC GAGGACTGGC GCCCGGTCCT GCTCACAGAC 
CGGGCCGACC TGCGCAGCCT CGTGGCGCCT GCCGCGCCCG GACAACAGCT TGAACTCTTC 
GCATGA

Protein sequence

MPQPSLPAGK SVIERLAILA DAAKYDASCA SSGTTKRNSK GGKGIGSTEG MGICHAYAPD 
GRCISLLKIL LTNHCVFDCH YCVNRKSSNT PRARFTPQEV VDLTLSFYRR NYIEGLFLSS 
GIVKSSSHTM EQLIEVARIL REEHDFRGYI HLKTIPEADP DLVARAGLFA DRVSINVELP 
TVAGLTRLAP DKSAPQIEGA MGSLKQAIAE AKDARKRFRH APKFAPAGQS TQMIVGADAA 
TDADIVGRAS TLYDRFRLRR VYYSAFSPIP DASAVLPLKR PPLMREHRLY QSDWLMRFYG 
YAPHEVQQAA GDDGMLPLDI DPKLSWALRF RGDFPVDINR APRERLLRVP GLGVKAVNAL 
IAARRQRRLR LADIGKLTVS LAKVRPFIVA EDWRPVLLTD RADLRSLVAP AAPGQQLELF 
A