Gene Saro_2681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2681
Symbol
ID	3918455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2920156
End bp	2921307
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	70%
IMG OID	640445458
Product	tRNA synthetase, class II (G, H, P and S)
Protein accession	YP_497951
Protein GI	87200694
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3705] ATP phosphoribosyltransferase involved in histidine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACCA GCGACCCCGA TCTGCTGCCG GAAGGCCTCG AAGACCGTCT GCCCCGCGAT 
GCGGCCACCG CCACGCGCGT CATGCGCGCG ATCCACGGCG TGATGCACGG CCACGGCTAC 
GACCGGGTCA TGCCCCCGTC CATCGAGTAC GAGCGCAGCT TCGCCGCGCG CATGGCCGGC 
ATCCAGTCGC GCCGCATGTT CCGCTTCGTC GATCCGTCGA GCCTGCGCAT GATGGCCCTG 
CGAAGCGACT TCACCCCGCA GATCGGCCGC CTTGCCGAAA CGCGCCTGGC CGAAGCGCCG 
CGTCCGTTGC GCCTGTGCTA TGCGGGCCAG GTCGTCACGA TCAAGGCTGA CGGCCTCAAC 
CCCTCGCGCG AAAAGCTCCA GTGCGGCGCC GAACTCGTCG GTGCCGACAA TGTCGCCGCC 
GCCGCCGAAG TCGTCGCCAT CGCCATCGAG GCACTTCAGG CCGCGGGCGC CACGGGCGTC 
AGCGTCGATT TCACGCTGCC CGACCTGGTC GATACGCTGG CCGAAAAGGC CCTCCCCCTG 
GCCCCCGGCC AGATCGAGGC CGTCCGCCGC GAACTCGACA CCAAGGACGC AGGCGGCCTG 
CGCGATGTCG GCGGCGAAGC CTACGTGCCG TTGCTCTACG CCACCGGCGA ATTCGACACG 
GCGATCGACA AGCTTGCCGC GATCGATGCC GGCGGCGCGC TTGCCAGCCG CATCGACGCG 
CTCCGGCAGA TCGCCGCTCG CCTCGGCGGC GCAGCGCGCC TGACGCTGGA CCCGAGCGAG 
CGCCATGGCT TCGAATACCA GACCTGGTTC GGCTTCACCC TCTATGCCGA AGGGGTGCGC 
GGCATCGTCG GGCGCGGCGG CACCTATCGC ATCGCGGGTT CCGATGCCGA TGCACGTCAG 
GCCAATGCAC GACAGCAAGG CGAAGCCGCC ACCGGCTTCT CGCTCTATCC CAACGCCCTG 
ATCGATCTCC TGGCCGCGAA CGAGCCCGCC GAAGATACCG TCTTCCTCCC GCTCGGCCAT 
GACCGCGACG AAGCCGCCCG CCTGCGCGCC ATCGGCTGGC GAACGGTCGC GGCGCTCAGC 
GAAGCGGACA GCGCGGACGC TCTCCGCTGC ACGCACATGC TCGGCGCGAA CGGACCGGAA 
AAGCTGGCAT AA

Protein sequence

MDTSDPDLLP EGLEDRLPRD AATATRVMRA IHGVMHGHGY DRVMPPSIEY ERSFAARMAG 
IQSRRMFRFV DPSSLRMMAL RSDFTPQIGR LAETRLAEAP RPLRLCYAGQ VVTIKADGLN 
PSREKLQCGA ELVGADNVAA AAEVVAIAIE ALQAAGATGV SVDFTLPDLV DTLAEKALPL 
APGQIEAVRR ELDTKDAGGL RDVGGEAYVP LLYATGEFDT AIDKLAAIDA GGALASRIDA 
LRQIAARLGG AARLTLDPSE RHGFEYQTWF GFTLYAEGVR GIVGRGGTYR IAGSDADARQ 
ANARQQGEAA TGFSLYPNAL IDLLAANEPA EDTVFLPLGH DRDEAARLRA IGWRTVAALS 
EADSADALRC THMLGANGPE KLA