Gene Saro_3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3943
Symbol
ID	5077427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	+
Start bp	114946
End bp	116901
Gene Length	1956 bp
Protein Length	651 aa
Translation table	11
GC content	58%
IMG OID	640481049
Product	hypothetical protein
Protein accession	YP_001165711
Protein GI	146275550
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATCAAGC GCTTACGTCG TGCAGCGAGA CAGGGAACCC ACTGGTTGAC TGCCGGGCGT 
TCTCGCGAGC ATCAAATCAA CTCTGCGGCA CCGTTGAAAA TCCCGTTCGA GAAGGACACT 
GTCGAAGGAT ACATAGCGAG TCTGGATGCG CTGATCCGTG CGCCCGGAAC CCACGTGTAT 
GTCGACACCT CGTTTCTGGT TTGGCTAACT GCCCTCGGGT GCGAGGCCCG CAACGAATTC 
ACAGGATGGC TGCGGGCAGT AGCGGCAGGT CGGGTGCATG TCCCTGTGTG GGCGGCGCAC 
GAATACCTGC GACACCACAT GGGGAATCTG CACGGCAAGA AGCTGAAGGG CATCGAAACC 
GCGTTGAACG ATCTCGCCAA CAATACCTTC AACGACCTTC GGCCGTACAT CGATACCTCA 
TTCACAGGCG ACAGCCGGTC GCCAGCAGAA ATCATTGCCG CGACGAGGTC AGTGCTTATT 
GACGTCAAAC GCGTCGCCGC CATCGCCGGG CGGTGGACGA AGCAGCACTA TGACAGCAAT 
TCTAAAGCAA TTATCGAATT CATCAATGAG TGCGGCCTTC CAAGCGCACC GATGCTCGAC 
TGGATGGGCG ACATCCAATC CGTAGAGGAG GCCCGTTTCG AAGGCCGCAT ACCCCCAGGC 
TTCCAGGACC GGAACAAGTC TGGTGCGAAC GGAGGGGGAG CCAACAGCTT CGGCGATCTG 
ATGTTCTGGA AAGAGATCCT TCATCACGCT GGTCAACGGC GCGCTCGAGG CGTCGTGGTC 
ATCAGCAACG ACGGCAAGAA CGATTGGGTC ATGGGAGGGC TAGATCAACC GGACCTGGAT 
GCGGAACTTA AGGTGATCGC GAGCAAGCTA CCCCCGATCC CAAGGCCGCA ACCGATGCTT 
GAATATGAGG CCAAAGCGTC CGCCGGTGTT CAAGAACTGA TGCTGGTAGA TCGGAAATAT 
CTCGCGATCT ACTTGCGCCG CACCGGCGTC CCAAGTGACA GGTTCTTTGG TTCGGCTATC 
GACGTCACGC TTCCCTCCCC TGACCGAGAA GACGAGGCCA TTCGGAAGCA AGCGCGTGAC 
CAAGCGACCG GCAGAACTTC CGTCGCGAGC GGAATAGAGC CACAGAGAGA CACGCCAAAG 
CACCTGCCAG TGGATGACGC TTCTGGCATT GCTGACAATC CTCTCGCTCT TCGGCTTGCG 
TTCAGTGCCA GCAGCTCGGA CGCAAACGAG AAATCCGGCC CTCTCCTCGA TCACATGCTT 
GCCAATGATG CGGAAGGACT AGGCCTAGAT GCATTCCTGA CAAAGGAAGC GTTGGCTAAC 
TGGGACGGCC GGGCGGCTGT TTGGTTCGGT CGATCGCTGG GCACCAGATC CATCGAGGGC 
AATGCCCTAG CTACCACCTA CACGACGGAC TTGCTCGGCG TGTTCGAGCG GCTGCCGCCG 
AGGACAGCAA CTAACCTTTA CCTTGGCCTC CTGGCGTCGG CCTACGTTGA TGGGTCATCG 
CTCAAGACAA TTCCCCGCAC ACCTTGGCTG CCTCGGCTCT TAGCGCTTCA AGGGCAACCG 
CGTGCCAAGG GGGCCATCGA CGCGTTCCGG AACATTGTCG CTGATTGGCC CGGTCGCCCA 
GTCTATCTGC CAGACGCGGA TCGACCTGCA CTGTCGGTCA AACCACTACT TGCGAAGGCT 
ACCGGCACCG CGCCCCGCCT GACAGGTCTA CAGATTGGGG GGATTGGCGT AATCGTGGAA 
GCTCAGGAAG ATGCAGGACT TCGCTTGGCC AACCGGTTTC CAGGAGTAAC GACCGTCGTT 
CTCGGCGATG TCGTCAAAGA TGTGTGCAAC GCTCTGGGCA TACCGTTTGA CCAATTGATG 
GCGCATGAGG CCTTCGAGCG AGAGGTCGCT TTCGGAAGTA CCGTCGGGAT TGCTGCCGAA 
GGGGATCTTA GAAATAGTAT GGAAGACCAA TCATGA

Protein sequence

MIKRLRRAAR QGTHWLTAGR SREHQINSAA PLKIPFEKDT VEGYIASLDA LIRAPGTHVY 
VDTSFLVWLT ALGCEARNEF TGWLRAVAAG RVHVPVWAAH EYLRHHMGNL HGKKLKGIET 
ALNDLANNTF NDLRPYIDTS FTGDSRSPAE IIAATRSVLI DVKRVAAIAG RWTKQHYDSN 
SKAIIEFINE CGLPSAPMLD WMGDIQSVEE ARFEGRIPPG FQDRNKSGAN GGGANSFGDL 
MFWKEILHHA GQRRARGVVV ISNDGKNDWV MGGLDQPDLD AELKVIASKL PPIPRPQPML 
EYEAKASAGV QELMLVDRKY LAIYLRRTGV PSDRFFGSAI DVTLPSPDRE DEAIRKQARD 
QATGRTSVAS GIEPQRDTPK HLPVDDASGI ADNPLALRLA FSASSSDANE KSGPLLDHML 
ANDAEGLGLD AFLTKEALAN WDGRAAVWFG RSLGTRSIEG NALATTYTTD LLGVFERLPP 
RTATNLYLGL LASAYVDGSS LKTIPRTPWL PRLLALQGQP RAKGAIDAFR NIVADWPGRP 
VYLPDADRPA LSVKPLLAKA TGTAPRLTGL QIGGIGVIVE AQEDAGLRLA NRFPGVTTVV 
LGDVVKDVCN ALGIPFDQLM AHEAFEREVA FGSTVGIAAE GDLRNSMEDQ S