Gene Saro_0724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0724
Symbol
ID	3918548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	763254
End bp	765296
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	64%
IMG OID	640443456
Product	glycosyl transferase family protein
Protein accession	YP_496005
Protein GI	87198748
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.647901
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCAGG CGCACGCGAA TGCCGCCAGT CTGGAAGCCA GCGATCTGTT CGACGCCGAT 
TGGTATCTTG CCGAATACCC CGACGTGCAA AGCCTGCAGA TGCCGCCAGC GGTCCACTAC 
CTGTGGCTGG GAGCGCGGCT TGGCCGCAAC CCGTCTCCGC GCTTCAGTAC GCGCAGCTAC 
CTTGATGCTA ATCCGGATGT CGCGCAGGCC GGCATCAATC CGCTGCTTCA CTTCCTCCTG 
GCAGGACGCG ACGAAGGGCG GTCAGGCACG ATACTCGCCG CGCCGTCCAG AGGTTCGACA 
GAGACCGACG TCAACGCCAG CACCTTTGGC GAACATCGGC CCTATGTTTT CCTCCCGCCC 
GCCGATCTCG ATCGCATCGC AGCGCAATGG TCGAAGGACA GCGCGCGTCC CGACGCCCAG 
GGCCGGGGCA TCGCCATCTT CAGTGCGATC ACTGGCAGTT ACGACAGCAT CAACCACCAC 
GAGCACCTGA TTCCCGGGGC GGACTACCTG CTGTTCAGCG ACGCGCCCAA GCCTCGGTAT 
GTGTACCAAC CGCGACAGGC CCCCTGGTTC GATTGCGACA CCGTCCGGGC GGCACGCTTC 
ATCAAGACGC ACCCACACAT GCTGCTGGGC GGCTATCGCA TCGCCGTGTG GATCGATGGC 
AACATCCTGA TCAGGGGAGA TCTCCTTCCG CTCGTTCAGC GTTTCGAGGA GTCCGGGCTC 
GCGTTCGGAG CGGTGCCGCA CCCGTTGCGC CAATCGGTCT ACGCCGAAGC GGTCGAGTGC 
ATGAAACGCG GCAAGGATGA CGAAGCGACG ATCCGCCGCC AGATGCAGCG TTACCGCCGC 
GAAGAATTCG ACTGCGAGGA CCTGATCGAG AGCAATCTCC TGATGTTCCG GCTCGGCCAC 
CCATCACTCG CACCGCTGCT CGATACCTGG TGGGCGCAGA TCGAGAGTGG ATCGCGCCGG 
GATCAGTTGT CTCTGAACTA TGCCCTGCAC AAGACAGGCG TCGAGTGGCT CGCGCTGACC 
CAGCGCCCGC ACAGCGTCCG CGACCACCCG GCGCTCGCCT TGATGCATCA CCGGTCCCAG 
TTCAATCCGG CCGAGCCTGG CGTCTGCCTC CCTCGCCCGC GGGAACGGAC GTTCGCCGAA 
GTGCGCGCGG AGCGGATCGC TGCACAATCG GCGCGCCGGG CCGATGTCAT CGTCTGCGTG 
CACAACGCTC CCGAGATGGT GGCACGCTGC CTTGATTCCG TGCGCACCGG CCAGAACCCC 
GACCGTCATC GCATCATAAT AATCGACGAC GGTTCAGGCC GGGACACCGC GGAACTCGTT 
TCGCGCTTTG CGGCGGATAC CCCGAACACC GTGCTGATCC GCAACGCTGT GGCGGGAGGC 
TACACCCGTG CCGCCAACCA GGGCCTGAAA GCCATGGATG CCGACATGGC AATCCTTTTG 
AACAGCGATA CCGTGGTGGC ACCCGGCTGG ATCGAAAAGC TGCTCGACGC CGCGTTCTCC 
AATCCGGGCG TCGGTATTGT CGGTCCGATG TCCAGTGCCG CAAGTCATCA ATCCATTCCC 
GAACACCAGA GCCGGCACGA CCAGACGGCG ATCAACGATT TGCCGCCCGG TTGGTCCGCC 
GCCGACATGG ACGCCTGGTG CGAACGCATG GCGCCCGCCG ACTTCCTGCC CCGGGTTCCG 
CTCGTGCACG GGTTCTGCTT CGCCGTAACC CGAGAAGCCG TTGAGCGGAT TGGATACCTC 
GACGAAGACA GCTTTCCGGA CGGGTACGGC GAGGAAAACG ACTACTGCTT GCGCGCCACC 
GACGCCGGTG TCGGGCTGGC AATCGCCACG CACACGTACG TCTTCCACGA GAAGTCGCAG 
AGCTACCAAA GCGATCGCCG GATATCCCTC ATGAAGAGAG GCAACGGAAA GATCCGCGAG 
TTGCACGGCG ACGAGCGTGT CGCTCGCGCG GTTCGCTCCA TGCAGCAGAA CCCGCACCTG 
GGCCGCCTGC GCACTGCCGC GGCCCGCCTG TTCGCCGTCA CCACACCGGA GACACCTGCA 
TGA

Protein sequence

MDQAHANAAS LEASDLFDAD WYLAEYPDVQ SLQMPPAVHY LWLGARLGRN PSPRFSTRSY 
LDANPDVAQA GINPLLHFLL AGRDEGRSGT ILAAPSRGST ETDVNASTFG EHRPYVFLPP 
ADLDRIAAQW SKDSARPDAQ GRGIAIFSAI TGSYDSINHH EHLIPGADYL LFSDAPKPRY 
VYQPRQAPWF DCDTVRAARF IKTHPHMLLG GYRIAVWIDG NILIRGDLLP LVQRFEESGL 
AFGAVPHPLR QSVYAEAVEC MKRGKDDEAT IRRQMQRYRR EEFDCEDLIE SNLLMFRLGH 
PSLAPLLDTW WAQIESGSRR DQLSLNYALH KTGVEWLALT QRPHSVRDHP ALALMHHRSQ 
FNPAEPGVCL PRPRERTFAE VRAERIAAQS ARRADVIVCV HNAPEMVARC LDSVRTGQNP 
DRHRIIIIDD GSGRDTAELV SRFAADTPNT VLIRNAVAGG YTRAANQGLK AMDADMAILL 
NSDTVVAPGW IEKLLDAAFS NPGVGIVGPM SSAASHQSIP EHQSRHDQTA INDLPPGWSA 
ADMDAWCERM APADFLPRVP LVHGFCFAVT REAVERIGYL DEDSFPDGYG EENDYCLRAT 
DAGVGLAIAT HTYVFHEKSQ SYQSDRRISL MKRGNGKIRE LHGDERVARA VRSMQQNPHL 
GRLRTAAARL FAVTTPETPA