Gene Saro_3003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3003
Symbol
ID	3917439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3219642
End bp	3221714
Gene Length	2073 bp
Protein Length	690 aa
Translation table	11
GC content	61%
IMG OID	640445782
Product	hypothetical protein
Protein accession	YP_498272
Protein GI	87201015
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGACG AACTCTACGA ACCCGATGAT GCTCTTGAAG AGCAGACCCG CGACGAGGAA 
AAGCTGCGCG AGGTCCATGC CCGCGCGCTT GCCCGGTTCG ATGCCATCGC CTCCGCGACG 
CAGGAATGCC GCGCCAAGAG CCTGGAAGCC CGCCGCTTCA TCACGATCCC CGGTGCGCAG 
TGGGAAGGCG AGTGGGGCGA GCAGTTCGAT AACTCGATCA AGCTCGAAGT TGACAAGGTT 
GGTCGCGGCG TCGCCAAGAT CGAAACCGAC TACCGCGAAA ACCGCATCAT CCCGGACTTC 
CGCCCCGATG GCCCGAATGC CGATCAGGAT ACGGCGGATA TGCTCGATGG TCTGCACCGT 
GCCGACAGCT ATCGGTTCAA GTCGCAGCAG GCCCGCGACA ATGCGTTCTT CGAGGCCGTT 
GCCGGTGGCT TCGGTGCCTA TCGCCTGACC AATGAATGGG AAGACGAGAG CGACAAGGAC 
AACGACCACC AGCGCGTCAA CCCGGCATCG ATCATTGTTG ACGCTGACCA GTCGGTGTTC 
TTCGATCTAC AGGCGCGCAT GTATGACAAG TCCGATGCGC GCTTTGCCTT AGTCCGGACC 
AAGCTGACCC GCGAAGCGTT CGAGGATGAG TATGACGGCT GCTATTCCGA ATGGCCCGAG 
GCTCCGCGCT GGAAGTTCAC GGACTGGTTT GCGCCGGATA CCGTGGCCAT CGCGGAATAC 
TACGAGCGCG AGGAAGTATC GGACACGCTC CATATCCTGA CCAACAAGCT CTCTGGCGAG 
GAATTGCGCC TGTGGGCTTC GGACATGGAA AAGGGCGTTC TGGCGCAATA CAAGGCCGAT 
GGCTGGGCGG TCAAAAGCCA GAAGCGGAAG CGCTGCCGGG TCCACAAGTA TGTACTGTCC 
GGTGCCGAGG TTCTGGAGGA CTGCGGTTAT ATCGCGGGCA CCGAACTCCC CATCGTTCCG 
GTCTACGGCA AGCGCTATTT CGTTGACGGC ATCGAACGGT GGAACGGTTA CGTCCAGCCC 
AAGATGGACA GCCAGCGGCT TTACAATTCC AACGTGTCGA AGCTGGCGGA AACCAATGCG 
CTTTCGCCGC GTGAGGTGCC GATCTTCGAT CCGACGCAGA TCGATGCCGT GCAGGAAGGC 
CAGTGGGCGC GAGCGAATAT TGACCGCCTG CCGTACCTGA CTGCCCATGC GCTGCGGAAC 
CCCGACGGTT CGGTTGCTAT GGCTGGGCCG ATTGGCAAGG TGGAGCCGCC GACGCTCGCA 
CCGGTCACGG CGACCCTGTT GCAGATCGCC AACCAGGACT TGCAGGAAGA GCTTAACGAC 
GGCGCGGACG AGGTAAAGGC CAACACCTCT GCCGAGGCGA TGGACATTGC AGCCGCGCGC 
GTTGATGCGA AGTCGGGCAT CTATCTCGAC AACATGCGCC AGTCCGTGCA GCGCGAGGGC 
GAGATCTACA TCTCCATGGC GTCCGAGGTC TATTCCGAGG AAGGCCGCGA AGTCCGCACC 
ATGACTGAGG ATGGTGACGA CGGCACGGCC ATCCTCAAGC AGATGAAGAC CGATCCCAAG 
ACCGGCGAGA ATGCCACGAT CAACGATCTG GAGCATGGGC GCTACAAGGT GATTGCATCG 
GTCACGGAAG CAACTGCGAC CCGCCGTGAC AAGACCGTCA AGGCGATGCT TCGCGTTGCC 
GAGGTGGCCA CTGCTGCGCA GGACATGGAA ATGGCGCAGG CTGCCATCGT TACCGCCGTG 
ATGAATACGG ACGGCGAAGG CACCGATGGC TTCATGCAGT GGATGCGCAA GGTCAAGGCG 
CTCCCGATGG GCCTTGTCGA GCCGAACGAC GAAGAAAAGG CGGAAATGGA ACAGGCAGCG 
CAGAACGTGC AGCCCGATCC CATGGCAAAC CTTGCCAACG CACAGGCCAG GCAGTTCGAG 
GCGGATGCAG CCAAGAAGGC GGCGGAAGTT GCCGAGACGG AGGCGAACAC CCGCTTGCTC 
GACGCAAAGA CCGTGGAGAC GCTGGAGAAG GCGCAGCAGC CTGCGAACGA TCAGCCATCC 
ATCCCGCTCA ATCGCGGACC ATACGCGGCG TAA

Protein sequence

MADELYEPDD ALEEQTRDEE KLREVHARAL ARFDAIASAT QECRAKSLEA RRFITIPGAQ 
WEGEWGEQFD NSIKLEVDKV GRGVAKIETD YRENRIIPDF RPDGPNADQD TADMLDGLHR 
ADSYRFKSQQ ARDNAFFEAV AGGFGAYRLT NEWEDESDKD NDHQRVNPAS IIVDADQSVF 
FDLQARMYDK SDARFALVRT KLTREAFEDE YDGCYSEWPE APRWKFTDWF APDTVAIAEY 
YEREEVSDTL HILTNKLSGE ELRLWASDME KGVLAQYKAD GWAVKSQKRK RCRVHKYVLS 
GAEVLEDCGY IAGTELPIVP VYGKRYFVDG IERWNGYVQP KMDSQRLYNS NVSKLAETNA 
LSPREVPIFD PTQIDAVQEG QWARANIDRL PYLTAHALRN PDGSVAMAGP IGKVEPPTLA 
PVTATLLQIA NQDLQEELND GADEVKANTS AEAMDIAAAR VDAKSGIYLD NMRQSVQREG 
EIYISMASEV YSEEGREVRT MTEDGDDGTA ILKQMKTDPK TGENATINDL EHGRYKVIAS 
VTEATATRRD KTVKAMLRVA EVATAAQDME MAQAAIVTAV MNTDGEGTDG FMQWMRKVKA 
LPMGLVEPND EEKAEMEQAA QNVQPDPMAN LANAQARQFE ADAAKKAAEV AETEANTRLL 
DAKTVETLEK AQQPANDQPS IPLNRGPYAA