Gene Saro_2544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2544
Symbol
ID	3916865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2748173
End bp	2749378
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	69%
IMG OID	640445301
Product	glycosyl transferase, group 1
Protein accession	YP_497814
Protein GI	87200557
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.434322
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCCG CGAAGACCGC CCCCGCCGTC CCATCGTTCC CGACCGAGGT CGCAGGCCTG 
CGGGTTGCGC TGTTCAGCGG CAACTACAAC TACGTGCGCG ACGGGGCGAA CCAGGCGCTC 
AACCGGCTGG TCGGCTACCT CCTGCGCCAG GGCGCGGACG TCCGGGTCTA TGCGCCCAAG 
GTGGAAGAGC CCGCCTTCCC CGCCACCGGG ACGCTTGTCG GCGTTCCCTC GTTCGCGATC 
CCCGGCCGGG CCGAATATCG CTTCCCCCTC GCGCTCAGCC CGCGTGTGCG CCGCGATCTG 
GCAGCGTTCG ATCCCCACGT CGTCCACGTA TCCTCGCCAG ACGTGGTGGC ACACCGGGCG 
GTGTCCTGGG CGCGTCGGCG CGGCCTGCCG ATCCTGGCCT CGGTCCACAC CCGGTTCGAA 
ACCTACTTCC GCTACTACAA CATGGCCTGG CTCGAACCGG TGATCGAGGC GCTGATGCGC 
CGCTTCTACC GCCGCTGCGA CGCACTGGTG GCCCCGTCGG AATCGATGGC GCAAGTGCTT 
CGCGACCAGC GCATGAACTA CGACATCGAT ATCTGGTCGC GCGGGGTAGA CCGCGACATC 
TTCCATCCCG GCGCGCGCAG CCTCGAATGG CGACGCGAGC TGGGCATTGC CGATGACGAA 
GTCGTGGTCG GCTTCCTTGG CCGACTGGTG ATGGAAAAGG GGCTCGACGT CTTCTCGGAC 
TCGATCGACC AGCTCGCGCG GCGCGGCGTC AGGCACCGGG TGCTGGTGGT GGGCGAAGGC 
CCCGCGCATG ACTGGTTCGC CGCGCGCCTG CCGCAGGCGG TCTTCGCCGG GTTCCAGGGC 
GGAGCAGACC TTGGCCGCGC GGTTGCCAGC ATGGACGTGC TGTTCAACCC TTCGGTCACC 
GAAACCTTCG GCAACGTCAC GCTCGAGGCG ATGGCCTGCC GCGTTCCGGT CGTTGCGGCG 
GCCGCCACCG GCAGCCAGAG CCTTGTCGAC GACAACGTTT CCGGCCGCCT CATCGCGCCG 
GGCGCGGTGC GGCAGTTTGC CGAGGCGCTG CGCTGCTATG TCGAGGACGC GGACTTGCGC 
GGCCGGCACG GTGCGGCGGG CGAGGAACGC AGCCTCGACT TCTCGTGGGA CCGCATAAAC 
CAGGCGGTTG CCGACACCTA CCTGCGGCTC GTCCGGCAGA AGGCGATCCG CAGCAGGCGC 
CGCTAG

Protein sequence

MSSAKTAPAV PSFPTEVAGL RVALFSGNYN YVRDGANQAL NRLVGYLLRQ GADVRVYAPK 
VEEPAFPATG TLVGVPSFAI PGRAEYRFPL ALSPRVRRDL AAFDPHVVHV SSPDVVAHRA 
VSWARRRGLP ILASVHTRFE TYFRYYNMAW LEPVIEALMR RFYRRCDALV APSESMAQVL 
RDQRMNYDID IWSRGVDRDI FHPGARSLEW RRELGIADDE VVVGFLGRLV MEKGLDVFSD 
SIDQLARRGV RHRVLVVGEG PAHDWFAARL PQAVFAGFQG GADLGRAVAS MDVLFNPSVT 
ETFGNVTLEA MACRVPVVAA AATGSQSLVD DNVSGRLIAP GAVRQFAEAL RCYVEDADLR 
GRHGAAGEER SLDFSWDRIN QAVADTYLRL VRQKAIRSRR R