Gene Saro_2329 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2329
Symbol
ID	3915674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2474901
End bp	2476133
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	71%
IMG OID	640445085
Product	glycosyl transferase, group 1
Protein accession	YP_497600
Protein GI	87200343
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR03087] sugar transferase, PEP-CTERM/EpsH1 system associated

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.285822
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGG TCCTGTTTCT CGCCCATCGC ATCCCGTTCC CGCCCGACCG GGGCGACAAG 
ATCCGTTCGT GCCACGTGCT GCGCCATATC GCCGGCCTCG CGCCCGTCCA CGTCGCCTGC 
TTTGCCGATG ACGAGGGCGA TATGGCGCAT GAGCCGGACC TTGCGGCGAT CGCGGCCAGC 
CACTGCCTGA CCCCACGAAC GCGCTCGCTG CCGCTGGCGG GGGTAGATGC CCTCGTGCGT 
GGCAAGCCCG TCAGCCTGAC CGCCTTTGCC GACAGGCGGC TGGCGGCCTA CGTCGCCCGC 
GTTCTCGACG AGCGACCGAT TGGCGCGATT TACGTCTTGT CCGGGCAAAT GGCGCAGTAC 
GTGCCCGCCC GGTTCGCGGG CCGCGTCGTC ATGGATTTCG TCGATGTCGA TTCCGCCAAG 
TTCGAAGCCT ATGCCGCTGC CGCGCGTTTC CCCGCCAGCC TGCTCTACGC CCGCGAGGCG 
CGCCTGCTTT CGCGCTTCGA GGATGCCGTG GCCCGCCGCG CGCACGCCAG CCTTCTGGTC 
ACGCCCGAGG AAGCCGCGCT CTTTCGCCAG CGCCTCGCGC CCGGTGCGGA GCCGGCGGTC 
ATTTCGCTGG GCAACGGCAT CGATACCGAT TTCTTCGACC CGGAAGGGAT GTCCCCCGCG 
CCCGAGACGG TGGGCGCGGG ACCGCAGCTC ACGTTCACCG GCCAGATGGA CTACCCGCCC 
AACGTAGCCG CCGTGGAGAT GTTTGCCCGG GCCGTCATGC CCCAGGTGCG CGCCGTGTTT 
CCCCAGGCGC GCTTCAACGT CGTCGGCCGT GCGCCGACCC TGGCGGTGCG TTCGCTCGAT 
GGCGTGAACG GGACTCGCGT GACCGGCGCC GTCCTCGACG TGCGCCCGTG GCTTGCCGGG 
GCCGACCTCG TCGTCGCACC GCTCACCATC GCGCGCGGGG TGCAGAACAA GGTGCTCGAG 
GCCATGGCCA TGGCCCGCCC GGTGCTTGCC ACGCCCGAAG CCGCAACAGG GATCCCGGCG 
CGCGAAGAAC ACGAGCTGGT CGTCGCCGAT GGCGCCGAGG CGCTGGCCAA GGCCGCGCTT 
TCCCTGCTCC ACGACAAGGT CCGCGCCGCC ACCATCGGGC ATTCCGCCCG CGCCATCGTG 
GTGGAGCGGT GCGGCTGGGC GGGCGTCCTC GCTCCGCTCG CCGGCCTGCT CGGCCTGCCC 
CGCCACCCGG AGGCGCCGCG TGTCGCCGCC TGA

Protein sequence

MSEVLFLAHR IPFPPDRGDK IRSCHVLRHI AGLAPVHVAC FADDEGDMAH EPDLAAIAAS 
HCLTPRTRSL PLAGVDALVR GKPVSLTAFA DRRLAAYVAR VLDERPIGAI YVLSGQMAQY 
VPARFAGRVV MDFVDVDSAK FEAYAAAARF PASLLYAREA RLLSRFEDAV ARRAHASLLV 
TPEEAALFRQ RLAPGAEPAV ISLGNGIDTD FFDPEGMSPA PETVGAGPQL TFTGQMDYPP 
NVAAVEMFAR AVMPQVRAVF PQARFNVVGR APTLAVRSLD GVNGTRVTGA VLDVRPWLAG 
ADLVVAPLTI ARGVQNKVLE AMAMARPVLA TPEAATGIPA REEHELVVAD GAEALAKAAL 
SLLHDKVRAA TIGHSARAIV VERCGWAGVL APLAGLLGLP RHPEAPRVAA