Gene Oant_1836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oant_1836
Symbol
ID	5380335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ochrobactrum anthropi ATCC 49188
Kingdom	Bacteria
Replicon accession	NC_009667
Strand	+
Start bp	1931532
End bp	1933076
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	57%
IMG OID	640834498
Product	sulfatase
Protein accession	YP_001370381
Protein GI	153009166
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGAA AAAATGTCCT GCTTATCGTC GTTGATCAAT GGCGAGCAGA TTTTATCCCC 
CACCTGATGC GGGCGGAGGG TCGCGAACCC TTCCTCAAAA CTCCCAATCT TGATCGCTTG 
TGCCGGGAAG GCTTGACCTT CCGCAACCAC GTCACAACCT GTGTGCCGTG TGGACCAGCA 
AGGGCAAGCT TGCTTACTGG CCTTTACCTG ATGAACCATC GGGCGGTACA GAACACTGTT 
CCGCTTGATC AGCGCCATTT GAACCTCGGC AAAGCCCTCC GCGCCATCGG CTATGATCCC 
GCGCTCATTG GTTACACGAC GACGACGCCT GACCCGCGTT CGACGTCCCC AAGAGATCCG 
CGTTTCACGG TTCTTGGCGA TATCATGGAC GGGTTTCGCT CAGTGGGCGC ATTCGAACCC 
AATATGGACG GATATTTCGG CTGGGTGGCG CAGAACGGTT TTGAACTGCC GGAGAACCGG 
GAAGATATCT GGCTGCCAGA AGGGGAGTAT TCCGTTCCCG GTGCTACCGA CAAGCCGTCG 
CGTATCCCGA AGGAGTTCTC GGATTCCACA TTCTTCACGG AACGCGCGCT GACCTACCTT 
AAGGGCAGGG ATGGCAAGCC ATTCTTTCTG CATCTAGGTT ACTACCGCCC GCACCCGCCA 
TTCGTCGCCT CCGCGCCTTA TCATGCGATG TACAAGGCCG AAGATATGCC TGCGCCGGTT 
CGCGCGGAAA GTCCGGATGC CGAAGCGGCA CAGCATCCGC TTATGAAGCA CTATATAGAT 
CATATCAGGC GTGGTTCGTT TTTCCATGGG GCGGAAGGCT CCGGCGCAAC GCTGGACGAA 
GGCGAGATTC GCCAGATGCG CGCCACCTAT TGCGGCCTGA TTACGGAAAT CGACGATTGT 
CTGGGGCGGG TCTTCGCTTA CCTTGATGAA ACTGGTCAGT GGGACGACAC ACTAATCATC 
TTCACCAGCG ACCATGGTGA GCAGCTCGGT GATCATCATC TGCTCGGCAA GATCGGCTAC 
AACGACGAAA GTTTCCGTAT TCCTTTGGTT ATAAAGGATG CGGGGGAGAA CCGGCACGCT 
GGCCAGATCG AAGATGGGTT TTCCGAAAGC ATCGATGTCA TGCCCACCAT CCTCGAATGG 
CTCGGCGGGG AAACGCCACG CGCTTGCGAC GGACGTTCGC TGTTGCCATT TCTGGGTGAG 
GGAAAACCCG CCGACTGGCG CACAGAATTG CATTACGAAT TCGACTTCCG CGACGTCTTC 
TACGATCAGC CGCAGAACTC GGTACAGCTC TCCCAGGATG ATTGCAGCCT CTGTGTGATC 
GAGGACGAGA ACTACAAGTA CGTGCATTTT GCGGCCCTGC CGCCGCTGTT CTTCGATTTG 
AAGGCGGACC CGCACGAATT CAACAATCTG GCTGAAGACC CCGCTTATGC GGCTCTCGTT 
CGCGACTACG CCCAGAAGGC TTTGTCGTGG CGACTGTCTC ATGCCGACCG GACACTGACC 
CATTACAGAT CCGGCCCGCA AGGGCTCACA ACGCGCAACC ATTGA

Protein sequence

MTRKNVLLIV VDQWRADFIP HLMRAEGREP FLKTPNLDRL CREGLTFRNH VTTCVPCGPA 
RASLLTGLYL MNHRAVQNTV PLDQRHLNLG KALRAIGYDP ALIGYTTTTP DPRSTSPRDP 
RFTVLGDIMD GFRSVGAFEP NMDGYFGWVA QNGFELPENR EDIWLPEGEY SVPGATDKPS 
RIPKEFSDST FFTERALTYL KGRDGKPFFL HLGYYRPHPP FVASAPYHAM YKAEDMPAPV 
RAESPDAEAA QHPLMKHYID HIRRGSFFHG AEGSGATLDE GEIRQMRATY CGLITEIDDC 
LGRVFAYLDE TGQWDDTLII FTSDHGEQLG DHHLLGKIGY NDESFRIPLV IKDAGENRHA 
GQIEDGFSES IDVMPTILEW LGGETPRACD GRSLLPFLGE GKPADWRTEL HYEFDFRDVF 
YDQPQNSVQL SQDDCSLCVI EDENYKYVHF AALPPLFFDL KADPHEFNNL AEDPAYAALV 
RDYAQKALSW RLSHADRTLT HYRSGPQGLT TRNH