Gene Dole_3215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3215
Symbol	argS
ID	5696077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3852698
End bp	3854368
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	62%
IMG OID	641265834
Product	arginyl-tRNA synthetase
Protein accession	YP_001531095
Protein GI	158523225
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAGA CCTTGCAGGC CATGATTCGG GCCGCGGCCA CGGCCGCCTT TGAAAAAGGC 
GCGCTGACCG CCTCCCGTTT TCCCGACATT GAGCTGGAAG CACCCCGGTT CAGGGATCAC 
GGTGATTTTG CCACCAACCT GGCCATGGTG TCGGCATCCA CCCAGAAAAT GGCGCCCCGT 
AAAATCGCCG AGGCCATCGT GGCCCACTTG GCCGATTCCG CCGGGATTTT GCTCAAGACC 
GAGATCGCCG GGCCGGGGTT TATCAATTTT TTTATTTGCC CGGAAGCCTG GCTGCCGGTG 
CTGCACCGGA TTCACGAGGA CCAGGAGCGG TTCGGGGCCT GCGACCTGGG TGGCGGGAAA 
CGCGTCCAGG TGGAGTTTGT CAGCGCCAAT CCCACCGGCC CCCTGCACGT GGGCCATGGC 
CGGGGCGCCG CCGTGGGCGA CAGCGTGGCC CGCATTCTGG CGTTCTGCGG CTGGCAAGTG 
CACCGGGAAT ACTACGTCAA TGACGCGGGC AACCAAATTC TGACACTGGG CCGGTCTGTG 
CTGCTGCGGT GGCGCGAACT TTCCGGCCAG GCGGTTGATT TTCCGGAAGA CTGCTACCAG 
GGCGACTATA TCCGCTCCAT TGCCCGGCAG ATCGACGCCG AACACCGCCA GGCCTTAGAA 
AAAATGGAAT CGGCCGAAGC CGTGGCCTTC TGCGCCCGGG TGGCCGCCGA CCAGATTCTG 
GACGGGATTC GCCGGGATCT TGCCGATTTT TCCATCACCT TTGATCAGTG GTTTTCGGAA 
AAATCCCTGG TGGAAACAGG GGCCGTGGAA ACCACCCTGG CCCGGCTCAA AGAAACGGGC 
GTGGTCTATG AATCCGAAGG AGCCCTGTGG TTTGCCACCT CCCGGTTCGG AGACGAAAAA 
GACCGGGTAG TGGTGCGCAA CAACGGCGAG GCGACCTATT TCGCGTCAGA CATCGCCTAT 
CACAAGAACA AGTTTGACCG GGGATTTAAC CGGGTCATTG ATGTATGGGG CGCGGACCAC 
CACGGCTATA TTCCCCGGGT AAAGGCCGCC ATCGGCGCCG TGGGCAGAAG CCAGGACGAT 
CTGGATGTGA TCCTGGTCCA GCTGGTGGCC CTGTTGCGGG AGGGGCAGCC CGTGTCCATG 
TCCACCCGGT CCGGCGAGTT TGTCACCTTA AAGGAGGTGA CAAACGAGGT GGGCGCCGAC 
GCGGCCCGGT TCATCTTTCT TTCCCGCCAC TACGACAGCC CCCTGGACTT TGACCTGGAG 
CTGGCCAAGA AAAAAAGCAA CGACAACCCG GTGTATTATG TGCAGTACGT GCATGCCCGC 
ATCGCCAGCA TGCTGAAAAA GGCCGCTGAA GAAAAGGGCA TTGGCCGCGT CACCGCCGTT 
GACGACAAAA CCCTGCGACG CCTGGCGGAA CCCGAGGAGA TCGACCTGGT CAAGCTGCTG 
GCCCGGTACC CGGAAGCGGT CAGCCACGCG GCCCGGTTCC TGGAGCCCCA CCGCATCACC 
TTCTACCTGC TTGACCTGGC CGCCGGGTTT CACGGATATT ACAGCCGGCA CAAGGTACTC 
ACGGAAGACG ACGGCCTGAC CATGGCCCGG CTCTACCTGG TGTGCGCCGT CAAGCAGGTC 
ATCAAAAACG GACTGGCCCT GCTGGGGGTG TCGGCTCCGG AATCCATGTA G

Protein sequence

MKETLQAMIR AAATAAFEKG ALTASRFPDI ELEAPRFRDH GDFATNLAMV SASTQKMAPR 
KIAEAIVAHL ADSAGILLKT EIAGPGFINF FICPEAWLPV LHRIHEDQER FGACDLGGGK 
RVQVEFVSAN PTGPLHVGHG RGAAVGDSVA RILAFCGWQV HREYYVNDAG NQILTLGRSV 
LLRWRELSGQ AVDFPEDCYQ GDYIRSIARQ IDAEHRQALE KMESAEAVAF CARVAADQIL 
DGIRRDLADF SITFDQWFSE KSLVETGAVE TTLARLKETG VVYESEGALW FATSRFGDEK 
DRVVVRNNGE ATYFASDIAY HKNKFDRGFN RVIDVWGADH HGYIPRVKAA IGAVGRSQDD 
LDVILVQLVA LLREGQPVSM STRSGEFVTL KEVTNEVGAD AARFIFLSRH YDSPLDFDLE 
LAKKKSNDNP VYYVQYVHAR IASMLKKAAE EKGIGRVTAV DDKTLRRLAE PEEIDLVKLL 
ARYPEAVSHA ARFLEPHRIT FYLLDLAAGF HGYYSRHKVL TEDDGLTMAR LYLVCAVKQV 
IKNGLALLGV SAPESM