Gene Saro_1487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1487
Symbol
ID	3916152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1527910
End bp	1528980
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	55%
IMG OID	640444229
Product	Rieske (2Fe-2S) protein
Protein accession	YP_496763
Protein GI	87199506
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCCC CAACTCACAC TAATACGCGA TACCTGGAAA ATGCCTGGTA TGTCGCAGCC 
CTTTCCTCGG AAGTTCAAGG ACAGGCGCTA TTCCACAGGA AGATCCTCGA TATTTCGGTA 
ATGATTTACC GACTTTCCGA CGGCTCGCCC ACTGCGCTTC GTGATCGCTG CCCACATCGC 
TTTGCGCCGC TGCACATGGG CAAACGGGAA GGCGACGAAA TTTCCTGTTT TTATCATGCG 
CTGCGCTTCA ACAGCGTCGG CACCTGCACT CATAATCCGC ACGGTAATGG CAACATCCCG 
GATGGGGCAA ACGTCCGGGC GTTCCCGTTG CTGGAGCGCC ACGGCTTCAT ATGGATCTGG 
ATGGGTGAGC AGACAGCCGA CCCGGATCTC CTGCCCGACT TCAGTCCTCT TGAGGACAGC 
GGCCCCAACG CCGTGGGCTA TACCTACATG CACATGGACG CTAATTTCGA ACTGATCGTC 
GACAACGTAA TGGACCTGAG CCACATCGAC CATGTCCATG GCGAAATCAT TTCGACACGG 
GGGAAATTGT CGCCCAAGAT ACCAAAAATA CGCTCCACCT CGCGCTCGAT CTCGTCGCGC 
TGGGAGTGGG AGCAACAACC GGCGATGCTG ATTCTTGCAC CGTTTCTTCC CGCTCCTGAT 
GCCGAGGCAC GCCAATATTT CGACATCACC TGGACGCCAC CCGCCAATAT CCAGTTGTCT 
GTTGGTGCGG TTCAGGGGGA ACTGAGTTTC GACGAAGCCG TAATGCAGTA CGACCTGCAT 
ACCGCCACCC CCGAAACTCA GTTCACGACG CATTATTTCT TTGCTACGCG GCGCAATCAC 
GATACCGACA ATGCCGAATA CAACGCCATG AAAATCAAGG CGATGCACGA CACTTTCGAA 
GCCGAGGACG GACCGATCAT CACCGGTGTC CAGCGCGAAA TGGGCGATAC TGATTTCTTC 
GACCTGAACC CTGTGCTGAT GTCCAACGAC GTCGGCCCGG TCCGTGTCCG CAAACTACTG 
CGGAAGTTGA TTGAGGAAGA GCGCGCCGAC GATTACCACA AATCTGAATA A

Protein sequence

MNAPTHTNTR YLENAWYVAA LSSEVQGQAL FHRKILDISV MIYRLSDGSP TALRDRCPHR 
FAPLHMGKRE GDEISCFYHA LRFNSVGTCT HNPHGNGNIP DGANVRAFPL LERHGFIWIW 
MGEQTADPDL LPDFSPLEDS GPNAVGYTYM HMDANFELIV DNVMDLSHID HVHGEIISTR 
GKLSPKIPKI RSTSRSISSR WEWEQQPAML ILAPFLPAPD AEARQYFDIT WTPPANIQLS 
VGAVQGELSF DEAVMQYDLH TATPETQFTT HYFFATRRNH DTDNAEYNAM KIKAMHDTFE 
AEDGPIITGV QREMGDTDFF DLNPVLMSND VGPVRVRKLL RKLIEEERAD DYHKSE