Gene Saro_0752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0752
Symbol
ID	3918576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	797758
End bp	799029
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	62%
IMG OID	640443484
Product	glycosyl transferase, group 1
Protein accession	YP_496033
Protein GI	87198776
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGGTCG CCATCGACGC ATTCAACATC GCGCTTGCGC ACGGGACCGG GGTTGCAACC 
TATGGGCGCA CCCTGGCGTC CGCTGCCGCC GGACTGGGGC ATGAGGTGAA CGTCCTGTTC 
GGTGCCGGTG CCGGGTACTC GAAGGTTCCG CTCCTCAACG AGATTGCGCT TGCCGAAGTT 
GGTGCGGTTT CAGCACGGGG CCCTTCACGC GCGGCATTGG CTCGCGGGAT CGCGCGCGGT 
CTTGCCGGTG CGCGTCCGGC GCACGACTTG CCAATTTCTG GGCAGGTCAT TCTGCCTCCA 
GGCCTCAGGC TGGATGCCAG GCGTCACTCG AACGTACCGA ACCTCTTCAA GGCCGCAGAT 
CTCGGGTTTC GTGCGGCAGG CGCTTTCTCC AAGGTGAAGG TGCCCGGCAC CGATCTGGCG 
CACTGGACGT ATCCGCTGCC GCTGAAAATG GTCGGTGCCC GCAACGTGTA TACGCTGCAC 
GACCTTGTCC CGCTGCGTCT GCCCTACACC ACAGCGGATG TGAAACACGC CTATTACCGC 
TTGTGCCGAC GGATCGCGCG CGACGCGGAT CATATCCTTA CCGTGTCGGA ATGCTCGCGC 
CGCGACATCG TCCGGTTGCT GGGCGTCGAT GAAGATCGCG TTACCAACCT CTACCAGACG 
AGCGATATCG CCGATGCCAT CGCTGGTGTG AGCGAAGACT TCGTTGCTCG CTACGTCGAG 
GGTCTGCTTG GTGTCGGCAT GCGCGAATAC TTCCTCTTCT TCGGCGCAAT CGAACCAAAG 
AAGAACGTGG CACGCCTGAT CGAGGCATTT TTGGCAAGCG CAGTGCAATC CCCGCTGGTG 
ATCGTTGGCG GGGCGGGATG GGGCGGCGAA CAGGACGTGA AGCTGCTCAA ATCCTTGGCC 
GGGATGGACA CGCGCAAGCG CATCGTCTGG CTGGGGTATC TCCCGCGTCA GATGCTGGCC 
ATGTTGATCG CAGGCGCAAG AGCCACGGTG TTCCCGTCGC TCTACGAAGG CTTCGGGCTG 
CCCGTTCTTG AATCGATGGA ACTGGGCACA CCTGTCATCA CGAGCAATGT CTCGTCCCTG 
CCCGAAGTTG CCCAGGATGC GGGATTGCTT GTCGATCCGT ACGATGTTCG CTCGCTCGCG 
ACGGCTTTCC TGCAACTGGA TGCCGACCCG GGCCTGCGCA GTCAAATGTC CATGCGTGGG 
CGCGAAGTGG CTGCCGGCTT CAGTGCCGAA GCCTATCGGG GGCGGCTCGC GGACTTCTAT 
GCCAAGTTCT GA

Protein sequence

MRVAIDAFNI ALAHGTGVAT YGRTLASAAA GLGHEVNVLF GAGAGYSKVP LLNEIALAEV 
GAVSARGPSR AALARGIARG LAGARPAHDL PISGQVILPP GLRLDARRHS NVPNLFKAAD 
LGFRAAGAFS KVKVPGTDLA HWTYPLPLKM VGARNVYTLH DLVPLRLPYT TADVKHAYYR 
LCRRIARDAD HILTVSECSR RDIVRLLGVD EDRVTNLYQT SDIADAIAGV SEDFVARYVE 
GLLGVGMREY FLFFGAIEPK KNVARLIEAF LASAVQSPLV IVGGAGWGGE QDVKLLKSLA 
GMDTRKRIVW LGYLPRQMLA MLIAGARATV FPSLYEGFGL PVLESMELGT PVITSNVSSL 
PEVAQDAGLL VDPYDVRSLA TAFLQLDADP GLRSQMSMRG REVAAGFSAE AYRGRLADFY 
AKF