Gene Saro_0944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0944
Symbol
ID	3918030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	991721
End bp	993067
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	67%
IMG OID	640443678
Product	Pyrrolo-quinoline quinone
Protein accession	YP_496223
Protein GI	87198966
COG category	[S] Function unknown
COG ID	[COG1520] FOG: WD40-like repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCCA ACCCCAATAT TCGCCGCGCT TCGCTCGCCA GCGTGCTGGT CCTTGCGCTC 
GCGCTGGGTG GCTGCGGCAT TTTCGGCGGC AAGGACAAGG CCAAGACGAC CCCGACGCTG 
GGCCAGCGCG TGCCGATCCT GTCGAAGATC GAGGCCGGCA CAAAGGTCGA CGATTCGATC 
TCGCTGACCA CGGTCGTCCT GCCCGCGCCC GAAGTGAACG CCGATTTCGC GCAGGGCGGC 
GGCAATGCGA GCAAGTCCTA CGGCCACCTC GCGCTCGGCG ATGCGCCGCG CAAGGCCTGG 
ACGGTCGGGA TCGCCGGGTC CTCCTCGAAG CAGCGTCTGG CCGCGTCGCC GGTCGTCGGC 
GGGGGCAAGC TCTACGTGAT GGACACGGAC GGCACCGTCC ATGCCTTCGA CGCGGCGAGC 
GGGAAGTCCG TGTGGGAGAC CCCGGTCAAG GCCGAGAAGC AGAACGCCAA CTCCACCTTC 
GGCGGCGGCG CGTCCTATGA CGACGGCGTG GTCTATGTGA CCAATGGCGT TGGCGAAGTC 
GCTGCGCTTG ATGCCGCTAA CGGAGCGGTA AAGTGGCGCG TCAAGCCCGC CGGCCCGCTG 
CGCGGATCGC CCACGGTCGC CTTCGGGCAG GTCATGGCGA TGACCCAGGA CAACCAGATC 
GTCACCCTGA ACGCCGCCGA TGGCGTGGTC CTGTGGAACG AGAACGCCTC GGTCGGACAG 
ACCAACGTGT TCGGCGTCGC CTCGCCCGCG GCAGGGCAGG GCACGATCGT GGCCGGTTAT 
TCCTCGGGCG AACTGGTCGC CTACCGCTAC GAGAACGGGC GCCAGCTCTG GGCCGACGCC 
CTTGCGCGCA CCAGCATCGC GACCAGCGTC TCGACGCTGA CCGACATCGA CGCCGATCCG 
ATCATCGAGC GCGGCCGCGT CTTCGCGCTG GGGCAGGGCG GGCGCATGGC CGCCTACGAA 
CTCGTGACCG GCCAGCGCGT GTGGGAACTC AATCTCGCGG GCATCTCCAC CCCCGCCATC 
GCCGGTGACT GGATCTTCAC GCTGACCGAC GAGGCCAAGC TGCTGTGCAT CGCCAAGTCC 
AACGGCAAGG TCCGCTGGAT GACGCAGCTT CCGCGTTATC GGAACGAGAA GAAGAAGAAG 
AACCAGATCC TGTGGACCGG CCCGGTCCTT GCCGGCAACC GCCTGTGGAT CGCCAATTCG 
CGCGGCGAAG TGATGCACGC ATCCGTCACC GACGGCACCG TCAGCGAATT CACCAAGCTC 
GGCGCGGCGG TAAGCCTTGC CCCCGTGGTC GCGAACCAGA CGCTCTACAT CCTCGACGAC 
AACGGCAAGA TCACCGCGTT CCGCTGA

Protein sequence

MTPNPNIRRA SLASVLVLAL ALGGCGIFGG KDKAKTTPTL GQRVPILSKI EAGTKVDDSI 
SLTTVVLPAP EVNADFAQGG GNASKSYGHL ALGDAPRKAW TVGIAGSSSK QRLAASPVVG 
GGKLYVMDTD GTVHAFDAAS GKSVWETPVK AEKQNANSTF GGGASYDDGV VYVTNGVGEV 
AALDAANGAV KWRVKPAGPL RGSPTVAFGQ VMAMTQDNQI VTLNAADGVV LWNENASVGQ 
TNVFGVASPA AGQGTIVAGY SSGELVAYRY ENGRQLWADA LARTSIATSV STLTDIDADP 
IIERGRVFAL GQGGRMAAYE LVTGQRVWEL NLAGISTPAI AGDWIFTLTD EAKLLCIAKS 
NGKVRWMTQL PRYRNEKKKK NQILWTGPVL AGNRLWIANS RGEVMHASVT DGTVSEFTKL 
GAAVSLAPVV ANQTLYILDD NGKITAFR