Gene Saro_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1089
Symbol	argS
ID	3916385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1131811
End bp	1133559
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	65%
IMG OID	640443824
Product	arginyl-tRNA synthetase
Protein accession	YP_496368
Protein GI	87199111
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGACG CCACGATCAA TCTTCACGCC GACTTCGCTC GGGTCATCGA CGCTGCGCTT 
GATGCGCTGG AAGCTGCGGG CACGCTGCCT GGCACCCTGT CGCGAAGCGC CGTCACCTGC 
GAACCGCCCC GCGATCCGAG CCATGGCGAT CTGGCGACCA ACGCGGCCAT GGTCCTGGCC 
AAGCCCGCGG GCACCAATCC GCGCGCATTG GCGACGGCGC TGGCGGCAGA GCTTGAAAAG 
GAGCCGCGCG TCGTTTCCGC CGAGATCGCC GGTCCGGGGT TCATCAACCT GCGCCTGACC 
GACGACGCCT GGCGCGGCGA GCTTGCGCTG ATCGGCTCGG CGGGCGCGGA CTACGGGCGT 
TCGACGATGG GCGGCAGCAA GGTCGTGAAC GTCGAATACG TCTCGGCCAA TCCCACGGGG 
CCGATGCACA TGGGCCATTG CCGGGGCGCG GTGGTGGGCG ATGCCCTGGC CGATCTGCTG 
GCCTTCAGCG GACACCAGGT CATCAAGGAA TACTACGTCA ACGATGCTGG TGCGCAGGTC 
GACGTGCTCG CCCGCTCGGT CCACATGCGC TACCGCGAGG CGCTGGGCGA AACGGTCGAG 
ATTCCCGAAG GTCTTTATCC TGGCGACTAT CTCGTTCCTG TGGGCAAGGC GCTCGCCGAG 
GAATTTGGCG ACAAGTATGC CAAGGCGGCC GAAGCCGACT GGCTGATCCT GTTCCGCACG 
CGCGCCGTTG CGGCGATGAT GGACATGATC CGCTCCGACC TTGCGACGCT GGGGATCCAC 
CACGACCTTT TCTCCTCCGA AGCGGAGCTT CAGGCATCGG GCAAGGTGGA CGCCGCCGAG 
CAGTGGCTGC GGGCACATGA CCTGGTATAC GATGGCCTGC TCGAAGCGCC CAAGGGCAAG 
ACCCCCGAGG ACTGGGAGCC GGTGGTGCTG CCGTTGTTCC GCTCCACGAA GTTCGGTGAC 
GATCAGGACC GCCCGATCAA GAAGTCGAAC GGAGCGTGGA CCTATTTCGG CGCGGACCTC 
GCCTACCACT TTCAGAAGGC GCAGACTGCC GATGCCCTCG TCGACATCTG GGGCGCGGAC 
CACGCTGGCA CTGTCAAGCG GATCAAGGCC GCAGTTGCGG CGTTGACCAG CGCGGACGGC 
GGCACGCCCA AGCCCTTCGA GGTCAAGCTG GTACAGATGG TCCAGTTGCT GCGCGACGGC 
GAGCCGGTGA AAATGTCCAA GCGTTCCGGC AACTTCGTTA CGCTTTCTGA CGTGGTCGAA 
GAAGTCGGCA AGGATGTGGT GCGCTTCACC ATGCTCACCC GCAAGCCCGA CGCGCAGATG 
GATTTCGACT TCGCCAAGGT GGTCGAGGCG TCGAAGGACA ACCCGGTGTT CTACGTGCAG 
TATGCCCATG CCCGCATCTG CCGGAACCTG CGCAAGGGCG CTGACGAGGG CTTTGCGCCT 
TCATCCGCCA ATCTCGACCT GCTGGGTGAT GAGGAACTGG CGCTGGTCAA GCTTGCCGCG 
CAGTTCCCGC GCACGATCGA GGCCGCCGCG GCGGCGCGCG AACCGCACCG GATCGCATTC 
TTCCTGCACG ACCTCGCGTC GGCCTTCCAC TCGTTCTACA ATCTGGGGAA CGACCGTCCG 
GACAAACGCT TCATTGTGGC ACAAGACTCC GCAATGACCG CAGCCCGCCT TTTCCTTGCC 
GCGCAAATCG GGCAGGTAAT CCGCAATGGC CTCGCTGTCC TTGGCGTCGA GGCCGCGCAA 
GAGCTTTGA

Protein sequence

MTDATINLHA DFARVIDAAL DALEAAGTLP GTLSRSAVTC EPPRDPSHGD LATNAAMVLA 
KPAGTNPRAL ATALAAELEK EPRVVSAEIA GPGFINLRLT DDAWRGELAL IGSAGADYGR 
STMGGSKVVN VEYVSANPTG PMHMGHCRGA VVGDALADLL AFSGHQVIKE YYVNDAGAQV 
DVLARSVHMR YREALGETVE IPEGLYPGDY LVPVGKALAE EFGDKYAKAA EADWLILFRT 
RAVAAMMDMI RSDLATLGIH HDLFSSEAEL QASGKVDAAE QWLRAHDLVY DGLLEAPKGK 
TPEDWEPVVL PLFRSTKFGD DQDRPIKKSN GAWTYFGADL AYHFQKAQTA DALVDIWGAD 
HAGTVKRIKA AVAALTSADG GTPKPFEVKL VQMVQLLRDG EPVKMSKRSG NFVTLSDVVE 
EVGKDVVRFT MLTRKPDAQM DFDFAKVVEA SKDNPVFYVQ YAHARICRNL RKGADEGFAP 
SSANLDLLGD EELALVKLAA QFPRTIEAAA AAREPHRIAF FLHDLASAFH SFYNLGNDRP 
DKRFIVAQDS AMTAARLFLA AQIGQVIRNG LAVLGVEAAQ EL