Gene Saro_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2100
Symbol
ID	3917748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2236438
End bp	2237667
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	65%
IMG OID	640444853
Product	tyrosyl-tRNA synthetase
Protein accession	YP_497373
Protein GI	87200116
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0674945
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAAT ACGCTTCTTC CCTGCTGCGC CTGCTCTCGG AGCGGGGCTA CATCCATCAG 
ATGACCGACG CCGACGCACT CGATGCGCTG GCGGCGAAGC AGGTCATACC CGGCTATATC 
GGCTTCGATC CGACCGCGCC ATCGCTGCAC GTCGGGTCGA TGGTGCAGAT CATGCTCCTG 
CGCCGCCTCC AGCAGGCCGG GCACAAGCCC ATCGTGCTGA TGGGCGGCGG CACCGGCAAG 
ATCGGCGACC CGAGCTTCAA GGACGAGGCA CGCAAGCTGA TGACCAACGA CGTCATCGCG 
GCCAACGTCG CCTCGATCAA GACCGTGTTC GAACGCTTCC TGACCTTCGG CGACGGCCCG 
ACCGACGCGG TCATGGTCGA CAATGCCGAC TGGCTCGACC GGCTTGAATA CATCCCGTTC 
CTGCGCGAGG TGGGCCAGCA CTTCTCGGTC AACCGCATGC TCAGCTTCGA TTCGGTGAAG 
CAGCGCCTTG ACCGCGAGCA ATCGCTCTCG TTCCTCGAAT TCAACTACAT GATCCTCCAG 
GCCTACGACT TCCGCGAGCT GTCGCAGCGC CACGCTTGCC GCCTGCAGAT GGGCGGGTCG 
GATCAGTGGG GGAACATCGT CAACGGCATC GAACTGACCC GCCGCATGGA CGGCGTGGAA 
GTGTTCGGCG TGACCACGCC GCTGCTCACC ACCGCCGACG GCTCCAAGAT GGGGAAGACC 
GCCGCTGGTG CTGTCTGGCT CAACGAGGAT GCGCTCCCGG CCTGGGACTT CTGGCAATAC 
TGGCGCAACA CCGATGACCG CGACGTGGGC AAGTTCCTGC GCCTGTTCAC CGACCTGCCG 
CTGGACGAGA TCGCCCGCCT CGAAGCGCTC GAGGGCAGCG AGATCAACGC CGCCAAGGTC 
GTTCTGGCCA ACGAGGTCAC CAGACTGGTG CGCGGCGAGG AAGCAGCAAA GGCTGCCGAA 
GCGACCGCGG CGGCGACCTT TGCGGGCGGC GGCCTCGGGC AGGATCTGCC GACCCTTTCC 
GTCGGCGAAT CCGAGATCGG CATCGTCGAT GCGCTCGTCG GTCTGGGCTT TGCCGCCAGC 
CGTGGCGAGG CCAAGCGGCT CGTCGCGGGC GGCGGCGCGC GCGTGGATGG CGAGCCAGTG 
ACCGACGAGG GTTTCCGCAT TCTTGTGAAT GACAAGGAAA TTCGCGTTTC TTCCGGCAAG 
AAGAAGCACG GCATCCTGCG CAAGGCCTGA

Protein sequence

MTEYASSLLR LLSERGYIHQ MTDADALDAL AAKQVIPGYI GFDPTAPSLH VGSMVQIMLL 
RRLQQAGHKP IVLMGGGTGK IGDPSFKDEA RKLMTNDVIA ANVASIKTVF ERFLTFGDGP 
TDAVMVDNAD WLDRLEYIPF LREVGQHFSV NRMLSFDSVK QRLDREQSLS FLEFNYMILQ 
AYDFRELSQR HACRLQMGGS DQWGNIVNGI ELTRRMDGVE VFGVTTPLLT TADGSKMGKT 
AAGAVWLNED ALPAWDFWQY WRNTDDRDVG KFLRLFTDLP LDEIARLEAL EGSEINAAKV 
VLANEVTRLV RGEEAAKAAE ATAAATFAGG GLGQDLPTLS VGESEIGIVD ALVGLGFAAS 
RGEAKRLVAG GGARVDGEPV TDEGFRILVN DKEIRVSSGK KKHGILRKA