Gene Saro_2353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2353
Symbol
ID	3915698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2500513
End bp	2501571
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	68%
IMG OID	640445109
Product	hypothetical protein
Protein accession	YP_497624
Protein GI	87200367
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGGCA AGTCAATTTT CAGGACCAGT GCGCTCGCCG CACTTGCCGT CGCGATGTCG 
GCGGCGGCCA TTCCAACATC TGCAATGGCA GAGCCGCAGC GCAGCGAAGA GCGCGGCGGT 
CGCTGGGGCG GCGGTGACCG TGGTGGCGAT CGTGGGGGCG ACCGCGGCGG TGAATTCCGT 
GGCCGCGCGC AGGGCCAGGC CCAGACGCAG GCCCAGCCGC AGCAGCGCTC AGGCTGGGGC 
GGCGGTCAGC AACAGGCGCG TCCGGAACGC AGCGCACCTG CATGGCAGGG CCGGGGCAAC 
GCGGACAATG CGCCGCGCTG GGGTTCGCAG GATCGCAGCG GCGGCCAGCG CCCGGGCCGT 
GACTGGCAAT CGGGCACGGT GACGCGCCCT GCACCCTCAG CGCGTGCAGC AACTCCCGCC 
ACTCCGCAGC GCGGCTGGGA CGGCACCCGC TGGAACCCGA CCAATCCGGA TCGCAACACG 
GGCCGCGACT GGAATCGCAA CCGCGACCGC AATGACGGCC GCGAATGGTC CAACCGCGAC 
CGCGACAATC GCGATGGCCG CGGCACCACC TGGGGCGGCC GCAACGATGG CCGGCGCGAT 
TATCGCAACG GCGACAGCTG GCGCAGCGGA GATAGCTGGC GCAGCGGAGA TAGCTGGCGT 
AGCGGAGATA GCTGGCGGCG CGACAACGAT CGCCGGGATG GGCGGGATCG CCGGGATGGG 
TGGCGCGGCG ACCGACGCGA TGACCACCGC CGGTGGAGCA ACGACTGGCG CCGCGACAAC 
CGCTACAACT GGTACGGCTA TCGCGACAGC CACCGCCACG TCTACCGGAT GCCGCGCTAT 
TATGCGCCGT ACCGGGGCTA CAACTACAGC CGCCTGTCGA TCGGGATATT CCTGAATTCG 
GGCTTCTATG GCAGCAGCTA CTGGATCAAC GATCCATGGT CTTATCGCCT GCCCCCAGCC 
TACGGTCCGT ATCGCTGGGT GCGCTACTAC GATGACGTGC TGCTGGTCGA CACCTACTCC 
GGCGAAGTGG TGGACGTGAT CTACGACTTC TTCTGGTAA

Protein sequence

MSGKSIFRTS ALAALAVAMS AAAIPTSAMA EPQRSEERGG RWGGGDRGGD RGGDRGGEFR 
GRAQGQAQTQ AQPQQRSGWG GGQQQARPER SAPAWQGRGN ADNAPRWGSQ DRSGGQRPGR 
DWQSGTVTRP APSARAATPA TPQRGWDGTR WNPTNPDRNT GRDWNRNRDR NDGREWSNRD 
RDNRDGRGTT WGGRNDGRRD YRNGDSWRSG DSWRSGDSWR SGDSWRRDND RRDGRDRRDG 
WRGDRRDDHR RWSNDWRRDN RYNWYGYRDS HRHVYRMPRY YAPYRGYNYS RLSIGIFLNS 
GFYGSSYWIN DPWSYRLPPA YGPYRWVRYY DDVLLVDTYS GEVVDVIYDF FW