Gene Saro_0744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0744
Symbol
ID	3918568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	788181
End bp	789335
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	62%
IMG OID	640443476
Product	glycosyl transferase, group 1
Protein accession	YP_496025
Protein GI	87198768
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.348162
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAACAG TTTGTATTGA TTGCAGGTAT ATAGGTCCTA GGCCCAGCGG TATCGCAAAG 
GTCGAGGCGG CATTGGTCGA GTTTGCGCCG GAGTTGGCGC CTGAACTTGA ATTTCTTTTG 
CTGAAGAGTC CTTCGGCGCC CCGGCGCCTC AGCCATGCGG CCAATGTGAC CGAAGTGGTG 
GTCGGCGCAG CGGCCAATAG TCCCGCGACC ATGTGGTGGT TGCCGAGGAT CGTCGATCTC 
TCAAGGGTCG ACTTGTTTCA TGCGACCTTC AACATCTTGC CGGCGGGCCT TGCCATGCCC 
TGCGTGACGA CGGTCCACGA CATCATGTGG CTGACCCGCC AGGAATGGTG CAATGCTCGT 
CTTTCGCGTC CGCTCGAACG CCGATTCTAC CGGCACGGCA TCGCACGCGC GCTCCGGAAT 
TCGGCGGCGG TTGCCACTGT CAGTGAAGCG AGCCGCTCAG AAATTGCGAC GCATTTTCCG 
GACGTTATTT CGCGTCTCCG CGTGACGTCG CCTGGCGTCG GGCCTGCCTA TAGCCCTGGG 
CAGGTAACCA AGGAGCAGCT TGCGGGCCTG GGAATACCCG AGGGCCGCAA GGTGGTGCTC 
ACCGTCGGTC AGTACGTGCC CTACAAGAAC CATGAAGGCG CATTGCGCAT CTTCGCCAAG 
GCTTTCGCCG GTCGTGACGA TGTCGTGATG GTCTTCGTGC AGCGGTTGTC CCGCAACGCG 
GAGCGACTGC GGGCGCAGGC GCGTCATCTT GGAATTGCCG ATCGCGTGCA TTTCCTCGGT 
GCGCTCGACG ACGACGAACT CACTGCGTTT TACCGCAGCG CTTCGGTTTT GTTGCATCCC 
TCGTTCTGCG AGGGCTTCGG CCTGCCCCTC GCCGAAGCGA TGGCCTGCGG TTGTCCCGTT 
GTTGCCTCCG ATTGCTCCGC GATGCCCGAA GTGCTTGGCG ACGCGGGTAT GCTGGCGCCG 
GTCAATGATG AGGGCGCTCT GGCGCAGGCA TTGCGGCGCG TGGTGGATGA CGCGGTCCTT 
GCCCGACGCC TCGGTCGCGC AGGCATGGCC CGCGCCGCGA ACATGCGTTG GCGCGAATTC 
GCGCGTGCGA ACGTGGACAT CTACCGCGAA GTGCTCAGGA ACGCTCAGCG GAGTTCCGAA 
TTTGCGCGGC CTTAA

Protein sequence

MPTVCIDCRY IGPRPSGIAK VEAALVEFAP ELAPELEFLL LKSPSAPRRL SHAANVTEVV 
VGAAANSPAT MWWLPRIVDL SRVDLFHATF NILPAGLAMP CVTTVHDIMW LTRQEWCNAR 
LSRPLERRFY RHGIARALRN SAAVATVSEA SRSEIATHFP DVISRLRVTS PGVGPAYSPG 
QVTKEQLAGL GIPEGRKVVL TVGQYVPYKN HEGALRIFAK AFAGRDDVVM VFVQRLSRNA 
ERLRAQARHL GIADRVHFLG ALDDDELTAF YRSASVLLHP SFCEGFGLPL AEAMACGCPV 
VASDCSAMPE VLGDAGMLAP VNDEGALAQA LRRVVDDAVL ARRLGRAGMA RAANMRWREF 
ARANVDIYRE VLRNAQRSSE FARP