Gene Saro_0942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0942
Symbol
ID	3918028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	989648
End bp	990808
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	68%
IMG OID	640443676
Product	glycosyl transferase, group 1
Protein accession	YP_496221
Protein GI	87198964
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGG CCGCCCCGCT CAGGATTCTC CACCTTCATT CCACGTTCGA TGCCGGGGGC 
AAGGAACGCC GCGCGGTGGC GCTGATGAAC CGCTGGGCAC GGCAAGGCGG GGCAAGGGCG 
ATCGAGCACC ACATCGTTTC GGCACAGCCC GGCTCGATGG GGGCAAGGAG CCTGATCGAC 
AAGCGCGTCG CCGTGTTCTT CCCTTTCGGG TTCCCGCCGC TTGCAGGCAA ATTGCGCCTT 
TCGCGCCTGC AACAGCTTGC ACGTGCGATG CGCGGCTTCG ACCTTGTTCT CACCTATAAC 
TGGGGCGCGA TGGACGCAGC GATGGCGCAT GCCGTCTTCG CCCCGTCGAT GGGCCTTGCG 
CCGCTGGTCC ATCACGAGGA CGGCTTCAAC GCCGATGAAG CGGGCGGCCT CAAGCGTGGC 
CGCAACTGGT ATCGCATGGT CGCGCTTTCT CGCGCCAGCG CGCTGGTAGT TCCGTCGCGC 
GGGCTGGAAG AGATCGCGCT GGGCTCCTGG CGCCAGCCGC GTGCCCGCGT ACATCGCATC 
CTCAACGGCA TCGATACCGC GGCCTATGCC CGCAAGCCCA GGCCCGACGT GTTGCCGCGC 
GTGGTCAAGC GGCCGGGCGA AAAATGGCTC GGCACCCTGG CCGGCCTGCG CGCGGTCAAG 
AACCTGCCGC GCATGGTTCG GGCGATGAAG GCGCTGCCGC CCGAATGGCA TCTCGTCATT 
CTTGGCGAAG GGCCGGAGCG GGAGGCCATC CTTGCCGAGG CCATGCGGCA GGAGGTCGGT 
CACCGCGTCC ACCTGCCGGG CCATGTCGCG GACCCCGCCG CAGCGATTGG CCTTTTCGAT 
CTTTTCGCGC TTTCCTCCGA CAGCGAGCAG GCACCGCTTT CCGTGATCGA GGCGATGGCC 
GCCGGGCTCG CCGTGGTCAG CCCCGCCGTG GGCGATGTGG CGGACATGGT TTCAGAGGCG 
AACCGCCCCT ACGTGATCCC GCCCGGAGAC GACGATGCGC TGGCGGCGGC AGTTCGCGCG 
CTGGCGGGCG ATGCGGCGCT TCGTGCGTCG ATCGGCAAAT CCAATCGCGC CCGCGCCCGG 
GCCGAGTTCG ACGAAGGCGT CATGGCCGAC CTCTACGCCA GGCTCTACGC GGGGGCGCTC 
GGCCGCGACA GCTTCTCGTG A

Protein sequence

MSKAAPLRIL HLHSTFDAGG KERRAVALMN RWARQGGARA IEHHIVSAQP GSMGARSLID 
KRVAVFFPFG FPPLAGKLRL SRLQQLARAM RGFDLVLTYN WGAMDAAMAH AVFAPSMGLA 
PLVHHEDGFN ADEAGGLKRG RNWYRMVALS RASALVVPSR GLEEIALGSW RQPRARVHRI 
LNGIDTAAYA RKPRPDVLPR VVKRPGEKWL GTLAGLRAVK NLPRMVRAMK ALPPEWHLVI 
LGEGPEREAI LAEAMRQEVG HRVHLPGHVA DPAAAIGLFD LFALSSDSEQ APLSVIEAMA 
AGLAVVSPAV GDVADMVSEA NRPYVIPPGD DDALAAAVRA LAGDAALRAS IGKSNRARAR 
AEFDEGVMAD LYARLYAGAL GRDSFS