Gene Saro_1196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1196
Symbol
ID	3916493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1243919
End bp	1245124
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	640443932
Product	Rieske (2Fe-2S) protein
Protein accession	YP_496475
Protein GI	87199218
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGTTC GCGCGAAACT GGTGGCAGAC GCACGGCACA TGCTGGAGCG GCTGGAGAAG 
GGCACGATCA CGCCAGCTCC GGCGCGTACC AGCCGGCCAT CTTCGATCTA TACCGACGAG 
GCGCTGTTCG GGCGCGAGAA GGAGCGCATT TTCCGCAAGG CGCCGCTGAT GCTGGCCGCA 
TCGTGCGAAC TGCGCCGGGC GGGCGACTAC AAGGCGATGG ACGTGGCGGG TGTTCCGGTG 
CTTCTGGTGC GCGGACAGGA TGGAACCGTC CGGACCTTCC TCAACGCCTG CACCCACCGC 
GCCGCGAAGC TGGCGCACGG GTGCGGCCAT GCGGCGCGGC TGACGTGTCC CTATCATGCC 
TGGAGCTTCC GGCTCGACGG GGCGCTGCTG GCGGTGGCGT CGCGCGGGGT GTTCGGCGAA 
GTCGATGCGG AGGAGAGCCG GCTGGTATCG TTCCCGACGA CCGAGCGGGC AGGGCTGATC 
TGGGCAGTGC TGGACCCGGA CGCGAGCCCC GACTTCGATG CTTTCCTTGG CGGTTTCGAC 
AAGCTGATCG CCCAGTTCGG CTTCGAGAAC TGGCACCACT TCGAAAGCCG CAGCCTGCCG 
GGCGCGAACT GGAAGCTGGC CTTCGACGCG CATCTCGAAT TCTACCACCT TCCGGTGCTG 
CACCGGGCGA CCTTCGGTCC CGGAATGAGC AACCTTGCGG AATACTTCTT CCACGGCCCG 
CACCAGAGGC TGGGACTGGT GACGAACGCC GGGCACGTGC TGGAGCAGGA CGACGTCGCC 
AGCCTCGCCA CGCTTCCGGA AGGCGAGTGG CCGGCCACCC CGCTATTGTT CGGCGAGTGG 
ATCATCTTCC CGAACGTGTC GATCAACTGC TTCTACAAGG GCGGGCGCGG CGTGATCATC 
TCGCAGGTGT TCCCGGGAGC GAGCGTGGGG GAATCGGTGA CCGTGCAGAT GTTCCTCCAC 
GAGAACCCGC CTGCCGAAGA CCTTGTGGCC GATGCGCGAG CGATGTCCGA TTTCCTTGGT 
CAGGTGGTTG GCGAGGAGGA CCTGCCGATG TCGCGTGGCC AGCAGGAGGT GCTGGAGTCC 
GGCCTGCTGC CGCGCGTCCA GTTCGGCCGC AACGAGGGCG GCGTGCAGCA TTTCCACGAG 
TGGATCGACC GGTTCGTCGA AGCGCCGCGC GAGGCGACGC TGGCCGCCGT CATGGGCGGG 
GAATAG

Protein sequence

MDVRAKLVAD ARHMLERLEK GTITPAPART SRPSSIYTDE ALFGREKERI FRKAPLMLAA 
SCELRRAGDY KAMDVAGVPV LLVRGQDGTV RTFLNACTHR AAKLAHGCGH AARLTCPYHA 
WSFRLDGALL AVASRGVFGE VDAEESRLVS FPTTERAGLI WAVLDPDASP DFDAFLGGFD 
KLIAQFGFEN WHHFESRSLP GANWKLAFDA HLEFYHLPVL HRATFGPGMS NLAEYFFHGP 
HQRLGLVTNA GHVLEQDDVA SLATLPEGEW PATPLLFGEW IIFPNVSINC FYKGGRGVII 
SQVFPGASVG ESVTVQMFLH ENPPAEDLVA DARAMSDFLG QVVGEEDLPM SRGQQEVLES 
GLLPRVQFGR NEGGVQHFHE WIDRFVEAPR EATLAAVMGG E