Gene Franean1_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1004
Symbol	argS
ID	5669418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1183802
End bp	1185514
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	72%
IMG OID	641239933
Product	arginyl-tRNA synthetase
Protein accession	YP_001505366
Protein GI	158312858
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCCG CCGAGCTCGC CGACACCATC GTCGCGGCCG TTCGGGCTGC CGTCGCGAAC 
GGCGACCTGG AAGTGGCCGT GCCCGACTCG GTCACCGTCG AGCGACCGAG GCAGCCCGAG 
CACGGAGACT ACGCGTCTCC GGTCGCCCTG CAGCTCGCGA AGGCGGCGCG CCGCCGGCCC 
CGGGAGGTGG CCGAGCTGCT CGCCGCCCGC CTGCGGGCCG AGGCGGGTGT GGCGGAGGTG 
GAGGTCGCCG GCCCGGGCTT CCTGAACATC CGGCTGGCCG GTGCGGCCCT GGGCGGCATC 
GCCCGCCGGA TCGTCCGGGA CGGCGAGTCC TACGGCCGCG CCGCGGTGTC CCAGGGCGTC 
CGGGTGAACC TCGAGTTCGT CAGCGCGAAC CCGACCGGCC CGGTGACACT GGCGTCCGCG 
CGCTGGGCGG CGGTGGGCGA CGCGCTTTCC CGGGTGTTCG CCGCGGCGGG CTACGAGGTC 
GGCACCGAGT ACTACGTCAA TGACGCCGGT GTGCAGGTCG AGCGGTTCGG CGCGTCGGTG 
CTGGCCGCGC TGCGCGGCCA GCCGGCTCCC GCCGACGGCT ACCAGGGCGC CTACGTCGCC 
GAGATCGCCG CGAAGGTCCT GGCGGCGAAC CCGGCTCTGG AGCAGCTCCT GGCCGCCTCC 
GGCGGCGAGC AGGACAGCGG CGCCGAGCAG GACAAGGCGC TCGCGGTCTG CGCCCGCGAC 
GGCGTGGAGC TGATGCTTGC CGAGATCCGC GCGACGCTTT CGGGGTTCGG GGTCGAGTAC 
GACCTGTGGA AGTCCGAGCG CAGCCTGCAC GAGGCGGGGG AGCTCATCGC CGCGATCGAC 
GAGCTGCGCA CCCAGGGCCA CGTCTACGAG GCTGGCGGTG CGGTCTGGCT GCGCACCACC 
GACTTCGGCG ACGACAAGGA CCGCGCTCTG ATCAAGAGTG ACGGTCGGCC CACCTACTTC 
TGTGCCGACG CGGCCTACTA CCGCGACAAG CGGCGCCGTG GCTTCGACCG GCTCTGCTAC 
CTGCTCGGAG CCGACCACCA CGGCTACATC GGCCGGCTGA AGGCGATCTC GGCCTGTTTC 
GGCGACGATC CCGACCACAA CCTCGACGTG CTCATCGGCC AGATGGTGAC GCTGTCGCGG 
GGCGGCGTGG CGGTGAAGAT GTCCAAGCGG GCAGGTAACT TCCTGACCCT GCACGACCTT 
GTCGACGCGG TGGGGGTCGA CGCGGCCCGC TACTCGCTGG TGCGCGCGTC GATGGACTCC 
GCCCTCGACC TCGACCTGGA CGCGATCGCG CGGCAGACGA ACGACAACCC GGTGTTCTAT 
GTCCAGTACG CCCACGCCCG GATCAGTTCG CTCATCCGGA ACGCCGCCGC CCTGGGTCTG 
GCGACCTCCG CGGATCCCGC GTTCGACGTC GACGGGGTCG ACGTGTCGCT GCTGACCCAC 
CCACGCGAGG TCGACCTGCT GGGCGCGCTC GGCGAGCTGC CGCGGGTGGT CGAGTCGGCG 
GCGGAGCTGC GCGCGCCGCA CCGTATCGCG AGGTACCTGG AGGAGTTGGC CGGGACGTAC 
CACCGCTTCT ACGACTCCTG TCGCGTGCTT CCGCAGGGCG ACGAGGAGCC CACGGCGATC 
ACCGCGGCTC GACTGCTGCT GGCCGAGGCC ACCCGGACCG TCCTGGCGAA CGGCCTTCGG 
CTGCTGGGCG TCAGCGCGCC GGAACGGATG TGA

Protein sequence

MTPAELADTI VAAVRAAVAN GDLEVAVPDS VTVERPRQPE HGDYASPVAL QLAKAARRRP 
REVAELLAAR LRAEAGVAEV EVAGPGFLNI RLAGAALGGI ARRIVRDGES YGRAAVSQGV 
RVNLEFVSAN PTGPVTLASA RWAAVGDALS RVFAAAGYEV GTEYYVNDAG VQVERFGASV 
LAALRGQPAP ADGYQGAYVA EIAAKVLAAN PALEQLLAAS GGEQDSGAEQ DKALAVCARD 
GVELMLAEIR ATLSGFGVEY DLWKSERSLH EAGELIAAID ELRTQGHVYE AGGAVWLRTT 
DFGDDKDRAL IKSDGRPTYF CADAAYYRDK RRRGFDRLCY LLGADHHGYI GRLKAISACF 
GDDPDHNLDV LIGQMVTLSR GGVAVKMSKR AGNFLTLHDL VDAVGVDAAR YSLVRASMDS 
ALDLDLDAIA RQTNDNPVFY VQYAHARISS LIRNAAALGL ATSADPAFDV DGVDVSLLTH 
PREVDLLGAL GELPRVVESA AELRAPHRIA RYLEELAGTY HRFYDSCRVL PQGDEEPTAI 
TAARLLLAEA TRTVLANGLR LLGVSAPERM