Gene Saro_3247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3247
Symbol
ID	3917505
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3467726
End bp	3469084
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	68%
IMG OID	640446031
Product	O-antigen polymerase
Protein accession	YP_498516
Protein GI	87201259
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAAGA CTCGGCCCAA CCAGCTTGGC GCTCTGCTTC TCGTGGCTTG TCTGTTTGGA 
GGTGGCGGCG TCGCCTATGG CCTCGCAAAC CTTGTCGTAC AGCTCGCGGC TATCCTGCTA 
CTTGCACTCC ACCGCGCGGA ACTCGGCAAG TTTCTCGCCC GTTCGCCGCG GATGCTCGCT 
GGCCTGGTTG TACTAACCCT GGCTCTCCCG CTGGTGCAGC TATTGCCGCT GCCGCCTGCC 
GCATGGACCA CCCTTCCCGG CCGGGATTTC GTCAACGAGG CGCTTGCCGT GGCCGATGGC 
GCGACCACAG CGTCCGGATG GTTTCCCTTC ACGGTCAGCA GCGCCCGCAC CCTCGTCGCC 
TTTCTTGGCT TGCTCGCACC GTTCGCGGTG ATCGTCCTCG CATGGCGGCT GGACGAGGCC 
GCGACCGTCA GGATCATGCA CCTTGTGGTC ATGATCGGGC TCGCCAATGT GCTGTTAGGT 
GTCGTTCAGG TCCTCGGCCA GGGCGGTTCC GGGCAACTCT ACATCGAGAA TGAGATGCCG 
GGCGTGCTCT TCGGGTTCTT CGCGAACCGC AATTCGACCG GCGTATTCCT TGTCTGCTGC 
CTGCTCGTCC TCGCAGCCCT GCCCGCAGCC CGCCCGCTGT CGGGCATCTG GCTGACCAAG 
GCAGGCGCAG CGCTGCTCCT CGCCACCGGC GTGTTCCTCA CCCAGTCGCG CACCAGCATG 
GTGCTGCTGG GGCTCCCCGC CGCGTTTGCC GTTCTGCGCA TCGGAGCGAT GGCGCTCGAC 
CGCCGCGTCG GCGGGAGCGG GCGCAATGCG GCCCGTACGG CTCTCGGCGG CGCGCTTGTC 
GCGCTTGCGC TGGGCGCGAC GCTGACCGTT GCCGGTGGCG GATCGCGCAT CGACACCGCG 
CTAGCCCGTT TCGAACGATC CGAGGAACAG CGGCCAGCTA TCTGGGAAGA TACCCGCTAC 
GCCATCGAGC GATACTGGCC GGTCGGTGCC GGGATGGGCA CGTTCGACGA AGTCTTCCAG 
ATCGACGAAT CGCTCGAGAA CATCACGCCG CGCCGCGCCG GGCGCGCACA TAACGACTAC 
CTCGAGATCG CGGTCGAGGC CGGGGTCGTC GGCCTCGCAG TGGTCGCGCT CTGGGCGATC 
TGGGCCGCGT TCGCCTCATG GCGGGCCGCG TCCACGCCGC AGCGCTGGCC CGCGCTTGCG 
GGAACGGGAA TCCTGATGGC CGTCGCTCTC CAGTCGCTGC TCGACTATCC GCTGAGGAAC 
CAGGCCATGC TGTGCATCGC CGCGCTTGCG GTCGCGCTTC TCACACGCGC GGGGCGCAGC 
GACGCGTCAG GGCACGTCGC CGGAGGTGCC GGCCGATGA

Protein sequence

MFKTRPNQLG ALLLVACLFG GGGVAYGLAN LVVQLAAILL LALHRAELGK FLARSPRMLA 
GLVVLTLALP LVQLLPLPPA AWTTLPGRDF VNEALAVADG ATTASGWFPF TVSSARTLVA 
FLGLLAPFAV IVLAWRLDEA ATVRIMHLVV MIGLANVLLG VVQVLGQGGS GQLYIENEMP 
GVLFGFFANR NSTGVFLVCC LLVLAALPAA RPLSGIWLTK AGAALLLATG VFLTQSRTSM 
VLLGLPAAFA VLRIGAMALD RRVGGSGRNA ARTALGGALV ALALGATLTV AGGGSRIDTA 
LARFERSEEQ RPAIWEDTRY AIERYWPVGA GMGTFDEVFQ IDESLENITP RRAGRAHNDY 
LEIAVEAGVV GLAVVALWAI WAAFASWRAA STPQRWPALA GTGILMAVAL QSLLDYPLRN 
QAMLCIAALA VALLTRAGRS DASGHVAGGA GR