Gene Saro_1488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1488
Symbol
ID	3916153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1529171
End bp	1530226
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	59%
IMG OID	640444230
Product	Rieske (2Fe-2S) protein
Protein accession	YP_496764
Protein GI	87199507
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAATA CACGCCCGAA TTTTGTCCGG AATTGCTGGT ATGTCGCTGG CTGGGATTAT 
GAATTCACCG CAGGAAAACC GCACCCGCGC ACTTTCCTTG CCGAACCTGT CGTCTTTTAC 
CGCAAGGGTG ACGGAACTCT GGTGGCGATG GCCGATAGAT GTGTGCACCG CCTTGCGCCG 
CTTTCCCTTG GCCGTCTGGA AGGCGACGAT ATCCGCTGCA TGTACCATGG GATGCGTTTC 
ACTGCAGACG GCAAATGCGT TGAAATTCCC GGGCAAGACA TGATTCCCTC ATCAGCCTGC 
ATCCAGACTT ATCCTGTGGT CGAGAAAGGC AGTTGGGCAT GGATATGGAT GGGCGATCCA 
CACTTGGCGG ACGCAGCACT TCTGCCTGAC GCACGCGGCC TGGACGATCC TGTATGGGTC 
TTGAAATCGG GTCAGCTGGA CTATGCCGCA CCGCATGAAC TGATCAACGA CAATCTGCTG 
GACCTGTCTC ACCTCGCCTA CGTCCACGTA GCCTCGTTCG GAGCGACGCC CGGATGGATC 
ACGCAGCAGC CGCGCACGAC CCAGATCGAA CGAGGCGTCC GCGTCGAGCG CTGGGTCGAA 
AGCGCACCGC CGCTGCCACC CCTGCCCTCG CTTGCCGCGT ATGAAAGCGT CGACATGTGG 
GCCAGCTATG AGTTTCTGAT CCCCGGCGTA TTTCTGATGT ACACGTCACT CCATCCCCCT 
GGCACCGCTA AGGGGAGCAA TCATGCTGCG CCAGCGGGCG ATGTGCTATT TTCCAATTTT 
ACCTGCCAGG CCGTAACCCC GCTCACTGCG GGCAGCTCAC GCTATTTCTT TTCGTGGGGA 
CCCGGATCTC AATTCGGCGG CGAGGAAATT GCGCAGCAGA TGATCGACGT GGCGATGGCT 
GCCTTCCTTG AGGACAAGCT GATCATTGAG GCGCAGGCCC GCATCATCGC GATGTCGCCT 
GGCGAGAAGA TCATGCCCAA CGCCGCAGAC CGGACTGTCA CGATTTTCCA GCGGATGATG 
GAGCGGATGA AACACCCCGC CAGCACTTCC TCCTAA

Protein sequence

MTNTRPNFVR NCWYVAGWDY EFTAGKPHPR TFLAEPVVFY RKGDGTLVAM ADRCVHRLAP 
LSLGRLEGDD IRCMYHGMRF TADGKCVEIP GQDMIPSSAC IQTYPVVEKG SWAWIWMGDP 
HLADAALLPD ARGLDDPVWV LKSGQLDYAA PHELINDNLL DLSHLAYVHV ASFGATPGWI 
TQQPRTTQIE RGVRVERWVE SAPPLPPLPS LAAYESVDMW ASYEFLIPGV FLMYTSLHPP 
GTAKGSNHAA PAGDVLFSNF TCQAVTPLTA GSSRYFFSWG PGSQFGGEEI AQQMIDVAMA 
AFLEDKLIIE AQARIIAMSP GEKIMPNAAD RTVTIFQRMM ERMKHPASTS S