Gene Saro_3179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3179
Symbol
ID	3918221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3399971
End bp	3401332
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	65%
IMG OID	640445963
Product	O-antigen polymerase
Protein accession	YP_498448
Protein GI	87201191
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID	[TIGR03097] probable O-glycosylation ligase, exosortase system type 1-associated

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.579286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGACC TGTTCCTGCT GAGCTTCGTG CTGGCCTTCA TCGGCGCGGG CTTTCGCCGG 
CCCTTCATCT TCGTGCTGGC CTACTCGTAC ATCGACATCG TGGCCCCGCA GAAGGTGAGC 
TGGGGCATCC TCAGCCACAT TCCGGTGTCG CTCATCGCAT TCCTCTGCGC GTTCATCTCG 
TGGTTCGTGG CGGAGGACAA GAACGGCATC CGCTTCTCCA TGCGCCAGTT CCTGCTGCTG 
GCCCTGCTGG TCTATTGCGG GCTGACGACG CAGACCGCCG ACTTCCCGGC AGAGGCCGCG 
GACAAGTGGG CCTGGGTGTG GAAGGCGCTG CTGTGGGCCC TGTTCCTGCC GCTGACGCTG 
CGCACGCGCC TGCGCATCGA GGCGATCACC CTGATCCTTG CCCTGTCCAT CGGCGTGATC 
GTGATCGGCG GCGGCATCAA GACCGCGGCC GGTGGCGGCG GATACGGCGA ACTGCGCCTG 
CTGGTGAACG ACAACACCGG CCTCTACGAG GGCTCGATCA TCTCGGCAGT CGCCATTGCG 
GTCATTCCGC TGGCGCTCTG GCTTTCGCGC TTCGGCACGA TCTTCCCGCC CGACTGGAGG 
GTGAAGACCT TCGCCTGGGC GCTTTGCTTT GCCTGCGCGC TCATGCCCAT CGGCACCGGG 
GCGCGGACCG GCCTTGTCTG CGTGGTGGTG CTGGCCGCGA TGATCCTGCG CACGGCAAAG 
CGGCGCTTGC TGATCGTGTC GGTCATGGCC GCAGGCGCCC TGATCGCGGT CCCGCTCCTG 
CCCAAGGAGT TCACCGACCG CATGGGCACG ATCCGGAACC ACCAGTCCGA CCAGTCCGCC 
GGAACCCGCA TCGCGGTGTG GAAGTGGACG ATAGAGTTCG CCAAGACCCA TCCCTTCGGC 
GGCGGCTTCG AGGCATATCG CCAGAACCGG CTGGAATACG ACACGGTCAA GGCCGACTAT 
GCCGGCGACA ACAACGCCGC GCTCGAATAC CAGCCCATTG TCGAAGAGGG GCGCGCCTAT 
CATTCCAGCT ACTTCGAGAT GCTGGGCGAA CAGGGCTATC CGGGCCTGGC CCTGTGGCTG 
GCGCTTCACC TGCTGGGCGT GTGGCAGATG GAACTGCTGA GGCGGCGCTA TCGCAAGGAG 
GCATCGAAGG AGTTCCGCTG GGTCGCCCCG CTGGCCGAAG CCTTGCAGCA GGCCCAGGTG 
ATCTACCTCG TCGGCTCAAC CTTCGTCGGC ATCGCGTTCC AGCCGTTCTG CTACATGCTG 
GTGGGCCTCC AATGCGGGCT CTGGGCCTAT ATCAAGCGGG TCCGCACAGC CACGCCTGAG 
CCGTTCCGCA AGGCTTCAAC CCCGGTGACG GCACCCGCTT AA

Protein sequence

MLDLFLLSFV LAFIGAGFRR PFIFVLAYSY IDIVAPQKVS WGILSHIPVS LIAFLCAFIS 
WFVAEDKNGI RFSMRQFLLL ALLVYCGLTT QTADFPAEAA DKWAWVWKAL LWALFLPLTL 
RTRLRIEAIT LILALSIGVI VIGGGIKTAA GGGGYGELRL LVNDNTGLYE GSIISAVAIA 
VIPLALWLSR FGTIFPPDWR VKTFAWALCF ACALMPIGTG ARTGLVCVVV LAAMILRTAK 
RRLLIVSVMA AGALIAVPLL PKEFTDRMGT IRNHQSDQSA GTRIAVWKWT IEFAKTHPFG 
GGFEAYRQNR LEYDTVKADY AGDNNAALEY QPIVEEGRAY HSSYFEMLGE QGYPGLALWL 
ALHLLGVWQM ELLRRRYRKE ASKEFRWVAP LAEALQQAQV IYLVGSTFVG IAFQPFCYML 
VGLQCGLWAY IKRVRTATPE PFRKASTPVT APA