Gene Saro_0838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0838
Symbol
ID	3915893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	886512
End bp	888626
Gene Length	2115 bp
Protein Length	704 aa
Translation table	11
GC content	69%
IMG OID	640443570
Product	hypothetical protein
Protein accession	YP_496117
Protein GI	87198860
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.827538
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGGC CTGACATGAA GCCAATCGCG GCCGCGTTCC TGCTTGCCCC CATGATCGCG 
GCGCCGGCCA TGGCAGCATC TCCCAAGGCA TTGCCTGCGT CTAACCGTCA GGTGCAGGTC 
GTCCCCGCAC CGGCCTGGGT GGTCCCCCCG CCCACGCCGA CCGAGCAGGC GGACCTTCCG 
ACCGCCGCGA TGCGCTTCGT CTACGTCGAC AACCAGGCCT TCGCCGGGCC GGCCGGGCTG 
GAATCCTACT CGGCCTACCG CATCCGCCTG CTCAAGCCCG AAGCACTGGC ACTCGGCACG 
ATCACCCTTT CGTGGTTGCC GGACGCCGGA AGCGCCCGCC TCCACGCATT GCGCCTGATC 
CGTGACGGCA AGGTCACGGA CCTAACCGCC AACGCGAAGT TCGAGGTGAT CCAGCGCGAA 
AGCAACCTCG AGGCATCGAT GCTCGATGGC AGGCTGACCG CGGTCTACCA GGTGCCCGGC 
CTCCAGGTCG GGGACGAGAT CGAGATCGCC CAGACCGTCA CCATCAAGGA CCCGACCCTT 
CCGGAGCATC GTTCGGGCCT GGCCATCCTG CCGCAGGGCG GCGTCCCCGG CGCCTTCCGC 
ACGCGCATCG CCTGGCCGGA AGGCGCCGCG ATACGCTGGC AGGCGACAAA GGACGTCGAG 
GTTGCGGAAC CATCGCTAGT CGGCGCGAAC CGCGTCCTCT CGGTCGAACT GCGCGATCCC 
GCCGCGCCCG AGGAGCCGGT CGTCGGCGCA CCCCCGCGCT ACTCGATCCA CCGCCTGATC 
GAGTTCACCG ACTTCGCCAG GTGGCCCGAA CTCTCGGCGC GCCTCTGGCC GCTCTACGAC 
AAGACCTCGC GCCCTGCCCC GGGTTCGCCG ATCCTGGCCG AAGCGGCAAA GATCGCGGCT 
GCCACATCCG ACCCCACGCG CAGGGCCGAA ATGGCGCTGC GCCTCGTGCA GGACCGCATC 
CGCTACGTCT ATGTCGGCCT CGACACCGGC AACATGACGC CGGCCAGCGT CGACGAAACA 
TGGACCCGCC GCTTTGCAGA CTGCAAGGGC AAGACCGTCC TGCTCATCGC CATCCTGCGC 
GAACTGGGCA TCGCGGCAGA GCCGATGCTG GTCAATTCGA ACGGCGGCGA TGGGCTCGGC 
CTGCGCCTGC CCAACCCCGG ACTGTTCGAC CACGTGATCG TGCGCGCGAC GATCGCCGGG 
AAGCCGTGGC TCCTCGACGG TACGCGGCTT GGCGACCGCG CGCTCGACCT GCTGCCGGTC 
GGGGCATGGC GCGAAGGCCT GCCCCTGCGC GAAGGCGGCG GCGAACTGGA GAAGCTGCCG 
ACGCCGTCTC CGGTCCATCC GCAGGCGGTC AATCTCCTCG ACATCGACGC GACGGCCGGG 
ATCGACCAGC CTGCACTCGT CACCGCAAGG CGCATCCTGC GCGGGAACGA TGCGGCAAGC 
CTCGCCGCAT GGTTCGCCAC GGTCCCCGCG GATCAGGCGC AGCGCGCGAT CAAGGAATAC 
TGGCGCGGCG AGGAACCGTG GATCGAAGGC GACAAGGCCT CATGGAAGCT CGACGAGGAT 
AGCGGCATCC TCACGCTGAC CCTTACCGGC GAAGGGGAAC TGGGCGACCC GGACGAAGCG 
AAGACGGAGA ATGGCAGCGT CGACGTGCCG GCAAGCGGAC TTACCGCGCC AAGCAGGTTG 
CGACGCCCCC GGTCGCAGGA CCAGACCCTG CCCTGGGTAA CCGCTTACCC CTCGTTCAAC 
TGCTGGGCCA CCACGCTGCG CCTGCCGCCG CCGCCAGCGA ACCAGCGCTG GGATCTTTCG 
GGCGAGCCGT TCGACAAGCT GATGGGCGGC GTCGGTTATT GGCGGCGCCT CTCGCTGGCC 
GACAACGTGG TACGAACCGT GATGAGCCGC CGTTTCCAGG TCCCGGAAAT CAGCGCCGCG 
CAGGCCACCG AACTCAATGG ACAACTGGCC AGCTACGATG GCAGCGCGGC AACGCTGTCG 
CTGCGCCAGA CGTTCAAGGG CGCGGCAAAG TGGCCGCAAC AGCCCCAGCC CTTCTCCGAC 
GCGACCGACT GGACGCAGGG CGGCACCCCA TGCGCCCCGG CCCAGAACGC CAAACCTTCC 
GCCGCCGGAC AGTAG

Protein sequence

MQRPDMKPIA AAFLLAPMIA APAMAASPKA LPASNRQVQV VPAPAWVVPP PTPTEQADLP 
TAAMRFVYVD NQAFAGPAGL ESYSAYRIRL LKPEALALGT ITLSWLPDAG SARLHALRLI 
RDGKVTDLTA NAKFEVIQRE SNLEASMLDG RLTAVYQVPG LQVGDEIEIA QTVTIKDPTL 
PEHRSGLAIL PQGGVPGAFR TRIAWPEGAA IRWQATKDVE VAEPSLVGAN RVLSVELRDP 
AAPEEPVVGA PPRYSIHRLI EFTDFARWPE LSARLWPLYD KTSRPAPGSP ILAEAAKIAA 
ATSDPTRRAE MALRLVQDRI RYVYVGLDTG NMTPASVDET WTRRFADCKG KTVLLIAILR 
ELGIAAEPML VNSNGGDGLG LRLPNPGLFD HVIVRATIAG KPWLLDGTRL GDRALDLLPV 
GAWREGLPLR EGGGELEKLP TPSPVHPQAV NLLDIDATAG IDQPALVTAR RILRGNDAAS 
LAAWFATVPA DQAQRAIKEY WRGEEPWIEG DKASWKLDED SGILTLTLTG EGELGDPDEA 
KTENGSVDVP ASGLTAPSRL RRPRSQDQTL PWVTAYPSFN CWATTLRLPP PPANQRWDLS 
GEPFDKLMGG VGYWRRLSLA DNVVRTVMSR RFQVPEISAA QATELNGQLA SYDGSAATLS 
LRQTFKGAAK WPQQPQPFSD ATDWTQGGTP CAPAQNAKPS AAGQ