Gene Saro_3178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3178
Symbol
ID	3918220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3398543
End bp	3399751
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	69%
IMG OID	640445962
Product	glycosyl transferase, group 1
Protein accession	YP_498447
Protein GI	87201190
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCGCG TGCTTCATGT TCTCGACCAT TCGCTGCCGC TCCACAGCGG CTATACCTTC 
CGCACCCGCG CCATTCTGAA GGCGCAGGAG GCGATGGGCA TCGAGGTGCG TGGCGTCACC 
GGCCGGCGCC ATGTCGCCCC TCCCGCCGCG CAGGAGCCGG AAGAGAGCGA CGGCCTGCGC 
TTCTATCGCA CCCCTGGCGC AGCCGGGAAC CTGCCGCTTG TACGGGAATG GGCCGAAGTG 
TCGGCCCTTG CCCGGCGCAT CGTCGAGGTC GCCGGTGAAT GGCGACCCGA TATCCTCCAC 
GCGCACTCGC CCGCCTTGTG CGGCCTCGCG GCGGTAAAGG CCGGGCGCAA GCTCGGCATT 
CCGGTGGTCT ACGAAATCCG CGCCTTCTGG GAGGATGCGG CCGTCGGCAA CGGGACAGGC 
CGCGAAGGCA GCCTCAAGTA CCGCGTCACG CGGGCGATGG AGAACGACGT CGTCGGTGCC 
GCCGCCCGTG TCGTCACGAT CTGCGAGGGT CTTCGCCAGG ACCTGGTCGG ACGCGGATTC 
GCGCCCGAGA AGCTGTCGAT CATGCCCAAC GGCGTCGACC TCGATCTGTT CGGCGCGCCC 
CTGCCGCGCG ACCTTGGCCT CGCGCAGGAG CTTGGTCTCG GCGACGGACC CGTCATCGGC 
TTCCTGGGCA GCTTTTATCC CTACGAGGGG CTGGACGATC TTGTCGACGC AATGCCGGCG 
ATCGCCGGCG CGGTGCCTGG CGCCACGCTC CTGCTCGTCG GCGGAGGGCC GGCGGAAGCA 
GACCTTCGTG CCCGCGCCGC CGCTTCGCCG GCGGCCCCGG CGATCCGTTT CGTCGGCCGC 
GTGCCTCATC ACGAGGTGGA CCGCTATTAT TCGCTGGTCG ATGTCGTCTG CTATCCGCGC 
AAGGCCATGC GCCTTACCGA AATGGTGACC CCGCTCAAGC CGCTTGAGGC GATGGCTCAG 
GGCAAGCTCG TGGCGGCGTC CGACGTCGGC GGGCACCGCG AACTTGTCAC CGATGGCGAG 
ACCGGGGCGC TGTTCCCCCC GGACGACCCT GCGGGTCTCG CCGCCGCGCT TGTTTCGCTG 
CTCGCCGGGC GCGACGGCTG GGAGGAAAGG CGTGCGACGG CGAGGGCGTT CGTCCGGGAC 
CGGCACGATT GGGCGATCAA TGTGCGGCGT TATCAGGACG TTTACCAAGC CTTGTTACCG 
AGTCCTTGA

Protein sequence

MTRVLHVLDH SLPLHSGYTF RTRAILKAQE AMGIEVRGVT GRRHVAPPAA QEPEESDGLR 
FYRTPGAAGN LPLVREWAEV SALARRIVEV AGEWRPDILH AHSPALCGLA AVKAGRKLGI 
PVVYEIRAFW EDAAVGNGTG REGSLKYRVT RAMENDVVGA AARVVTICEG LRQDLVGRGF 
APEKLSIMPN GVDLDLFGAP LPRDLGLAQE LGLGDGPVIG FLGSFYPYEG LDDLVDAMPA 
IAGAVPGATL LLVGGGPAEA DLRARAAASP AAPAIRFVGR VPHHEVDRYY SLVDVVCYPR 
KAMRLTEMVT PLKPLEAMAQ GKLVAASDVG GHRELVTDGE TGALFPPDDP AGLAAALVSL 
LAGRDGWEER RATARAFVRD RHDWAINVRR YQDVYQALLP SP