Gene Haur_4135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4135
Symbol	argS
ID	5735996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5280847
End bp	5282622
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	50%
IMG OID	641281289
Product	arginyl-tRNA synthetase
Protein accession	YP_001546895
Protein GI	159900648
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATACCT TTGCTCGCTT CGAGCAAGCC ATTCGCGAGG CCTTGCTTGC CACCAATTTA 
ATTAGCGCCG CCGATATTGA TTTAGGCGCA CCCAAAGCTG CTGGCGTACA GGCCGATTTA 
GCCTTGCCTT GTTTTCGTGC TGCCAAAAGC CGTGGCAGCA CCCCTGCTCA AGTTGCCCAA 
GAATTAGTTG CCGCGCTGCA ATTTGCCCCC GATAGTTTGG TTGCCAGTGC GACTATTTCT 
GGCCCCTATG TTAATTTCAA TCTCAACCCT CAAACCTTTG CTAAAGCCGT TTTGGCCGAT 
ATTCAGGCTG GCGGCGCAAC CTATGGCAGT AGCACCAAGG GCAACAATCG CAAAGTAATT 
GTCGAATATT CATCGCCCAA TATTGCCAAG CGTATGCACG TTGGTCATAT TCGCTCAACG 
ATCATCGGCC AAGCGATTGC CAATCTCTAC CAACGCTTGG GCTACGAAGT GATTCGCGAT 
AATCACTTAG GCGATTATGG CAAACAATTC GGGGTCAATA TTGCCGCCAC CTTGCGTTTT 
GGCAAGCCCG AAGGCGAAGG TGAGGCCGTG CTCGCAGCGA TTGAAGAACA ATACAAACGC 
TATAATTTGT TGATGAAGGG CGCAGTTGCC GAAGATACCG AGTATGACCC TGATTCAGAT 
GCTGGCTTGG ATGATGAAGC CCGCGCTTGG TCGTTGAAAT TAGAACAGGG CGATCCCCAA 
GCAGTTGAAA TTTGGCAATG GATGGTTGAT TTGACCAAAA CTGCCAATCA GCCCAATTAT 
GATCGTTTGG GCGTGCATTT CGATCTGCAA CATGGCGAAA GTTTTTACAA AGATATGTTG 
GCCGAAATCA TCAGCGATGC TGGCGAGAGT GAGCTGGCAG AACGTGATGG CAATGCTATT 
ATTGTCAAAG ATTTACCCGA CCATCGCGGC AAAAAATTAC CAACCTTTTT GATTCAGCGC 
TCGGATGGCG GCACGCTCTA CATGACCCGC GATATTGCCA CCATCAAATA TCGTGAGCAA 
ACTTACAATC CCGATGCGAT GATTTACATT GTGGGTCAGC CACAAGAATT GCACTTCCGC 
CAAACCTTTG CCATCAGCAA GGCCTTGGGC TACACCGATG CCGAGTTGAT TCATATTTCG 
TTTGGTACGG TGTTTGATGC CAAGGGCCAG CCACTTTCAA CCCGCAAGGG CAATATGATC 
TATCTCGAAA CCTTGCTGGA TGAAGCCCGT AATCGCGCCA AAGCCTTGAT TGAACAAAAA 
ATGGCTGAAG GCAAAACTCA ACTTACCGCC GAATTGATCG ATCAAGTTGC CGAGCAAGTT 
GGGGTTGGCG CGGTGATGTA CAACGATTTG TACCAAGATA CCAAGCGCAA TATCACCGTC 
GATTGGGATC GCATGTTGGC ATTCGAGGGC AATAGCTCGC CCTATTTGCA ATATATGCAT 
GCTCGTTGCT GCTCGATTCT GCGCGATTTT GGCAAATTAC CCGCTAGCTA CGATGGCAGT 
TTGTTGAGCC ATTCAGCTGA AACTGGCTTG TTGAAAGAGC TTGCCCGTTT GCCACAAATT 
ATTGAAGAAG CAGCGGCACG GTATGCGCCG TTCGTGGTCG CCGATTGGCT GTATGCCACG 
GCGCGGGCCT TCTCGGCTTT CTACGATGCC TGTTCAGTGC TCAAAGCCGA AACGCCAGAG 
TTACGGGTTG CACGTGGTCA TGTAGTTGCC GCCACCGCCC AAGCGCTCCG CAATGGTTTA 
GCGTTGCTCT CAATTGCTGC TCCTGAACGC ATGTAA

Protein sequence

MYTFARFEQA IREALLATNL ISAADIDLGA PKAAGVQADL ALPCFRAAKS RGSTPAQVAQ 
ELVAALQFAP DSLVASATIS GPYVNFNLNP QTFAKAVLAD IQAGGATYGS STKGNNRKVI 
VEYSSPNIAK RMHVGHIRST IIGQAIANLY QRLGYEVIRD NHLGDYGKQF GVNIAATLRF 
GKPEGEGEAV LAAIEEQYKR YNLLMKGAVA EDTEYDPDSD AGLDDEARAW SLKLEQGDPQ 
AVEIWQWMVD LTKTANQPNY DRLGVHFDLQ HGESFYKDML AEIISDAGES ELAERDGNAI 
IVKDLPDHRG KKLPTFLIQR SDGGTLYMTR DIATIKYREQ TYNPDAMIYI VGQPQELHFR 
QTFAISKALG YTDAELIHIS FGTVFDAKGQ PLSTRKGNMI YLETLLDEAR NRAKALIEQK 
MAEGKTQLTA ELIDQVAEQV GVGAVMYNDL YQDTKRNITV DWDRMLAFEG NSSPYLQYMH 
ARCCSILRDF GKLPASYDGS LLSHSAETGL LKELARLPQI IEEAAARYAP FVVADWLYAT 
ARAFSAFYDA CSVLKAETPE LRVARGHVVA ATAQALRNGL ALLSIAAPER M