Gene Saro_3840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3840
Symbol
ID	5077451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	+
Start bp	7948
End bp	9300
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	62%
IMG OID	640480950
Product	ring hydroxylating dioxygenase, alpha subunit
Protein accession	YP_001165612
Protein GI	146275451
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGACA GCATTGCCGA TCTGGTTGAT TCCCGCACCG GGCGCCAATC GCGCTCGATC 
TACGCGAGCG AAGACATTTA TCGGCAGGAA CTTGAGCGGA TCTTCGGGCG CTGCTGGCTG 
TTTCTGGTCC ACACCAGCCA GATTCCGAAG CCGGGCGACT ATTTCCGCAC CTTCATGGGC 
GAAGACGATG TGATCGTGAT CCGCCAGAAG GACGGGTCGA TCAAGGCGTT CCTCAACAGC 
TGTACCCATC GCGGCAACCG GATCTGCCGC GCCGATCGCG GCAATGCGCG CGCTTTCACC 
TGCAACTATC ACGGCTGGTC TTTTTCCCCG GACGGCGCGC TCTCCGGGGT GCCGCTGGAA 
AACGAGGCCT ATTTCGGCGA ACTCGACCGC ACCAAGTTCG GCCTGATCCC GGTGACGAAA 
GTGGCCGAGT ATAAGGGCCT GGTGTTCGGC TGCTGGGATG CCAATTCGCC CAGCCTCGAT 
GACTATCTGG GCGATGCCAA GTTTTTCCTC GATGTCTGGC TGGATGCCAT GCCAGGCGGA 
TCGGCACTGC TCGGCGAGAC GCAGAAGATG GTGCTGGGCA CCAACTGGAA GCTGCCAGTC 
GAGAACGTCT GCGGCGATGG CTATCACCTG GGCTGGGCCC ATGCCGGCGC TATGGCGGCG 
GTCCAGTCGA TGGACCTCAC CGGGCTCAGC GTCGGCAATT CCGGGGTCGA TCTCGATGGC 
GGGCTGTCGG TCGCCGGCAT GAACGGGCAC ATGGTCCTGA GCGCGCTCGA CGGCGTTTCC 
GGCTATGCCT TCTATCCCGA TCCCAAGCCG ATCCTCGAAT ACCTGGAGGC CAACCGCCAG 
ACGGTGATCG ACCGTCTGGG CGAAGTGCGC GGCAGGCAGG TGTGGGGTGC GCAGGTCAAC 
ATCACCATTT TCCCCAACCT GCAGCTGCTG CCCGGGCTCA ACTGGTTCCG GGTCTATCAT 
CCCAAGGGTC CCGGCCAGAT CGAGCAGTGG ACCTGGGCCA TGGCCGAAAA CGACATGCCC 
GAGGCGGTGA AAGCGCAGAT CCTCGAAAAC CAGTGCCTGA CCTTCGGCCT GGCAGGCCTG 
TTCGACAACG ACGATGGCGA CAATCTGACC GCCTGCACCG AACAGTCGCG CGGCTGGCGC 
ACGGCGCAGA TGGATGTCTA CACCAACATG GCGCTGGGCC GCTCGGGCAA GCGCGAGGGC 
TTCCCCGGCG ATATCGCCGC CGGCTTGGTA AGCGAACACA ACCAGCGCTA TTTCTACCGC 
CGCTGGCAAG AGCACATGAT GGCGGAAACT TGGGCCGAAG TGCCCACGTA CAACATCAAC 
TCGTTGACCG AACAGGAAGC CGAGCATGCT TGA

Protein sequence

MNDSIADLVD SRTGRQSRSI YASEDIYRQE LERIFGRCWL FLVHTSQIPK PGDYFRTFMG 
EDDVIVIRQK DGSIKAFLNS CTHRGNRICR ADRGNARAFT CNYHGWSFSP DGALSGVPLE 
NEAYFGELDR TKFGLIPVTK VAEYKGLVFG CWDANSPSLD DYLGDAKFFL DVWLDAMPGG 
SALLGETQKM VLGTNWKLPV ENVCGDGYHL GWAHAGAMAA VQSMDLTGLS VGNSGVDLDG 
GLSVAGMNGH MVLSALDGVS GYAFYPDPKP ILEYLEANRQ TVIDRLGEVR GRQVWGAQVN 
ITIFPNLQLL PGLNWFRVYH PKGPGQIEQW TWAMAENDMP EAVKAQILEN QCLTFGLAGL 
FDNDDGDNLT ACTEQSRGWR TAQMDVYTNM ALGRSGKREG FPGDIAAGLV SEHNQRYFYR 
RWQEHMMAET WAEVPTYNIN SLTEQEAEHA