Gene Pars_1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1821
Symbol
ID	5056075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1633283
End bp	1635040
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	58%
IMG OID	640469367
Product	glycyl-tRNA synthetase
Protein accession	YP_001154024
Protein GI	145592022
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0423] Glycyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00389] glycyl-tRNA synthetase, dimeric type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.651121
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCGAG CTGAGCTACT GGAAGAAATT ATAAAACGCC GCTTGCTCTA CTGGCCCTCA 
TCTGAGATTT ACGGCGGCGT GGGCGGCTTC TACGACTATG GCCCGCTGGG GGTTCAGCTG 
AGGCGGAACA TAGTGGAGAA GTGGCGCCGA ACCTTCGTCT TGCCCTTCCA AGACCTCATA 
ATTGAGGTGG AGACGCCCAT AATTATGCCG GAGCCCGTCT TCAAGGCGTC GGGCCACCTT 
GACCACTTCA CCGACTACGT GGTGGGGTGC ACCAAGTGCG GGAGGAAATA CAGAGCCGAC 
CACCTTGTGG AGGAGGAGCT GGCCAAGAGG GGCCTCAAGA TATCCACAGA GGGTCTCTCG 
GCGGCTGAGC TGGAGCGCTT AATAGTGGAG CACAGAATTG TCTGCCCCAA CTGCGGCGGC 
CCTCTCGGGA GGGTTGAGTC TTTTAACCTC CTCTTCAAGA CGACGATTGG GCCCTACAGC 
GAAAACGCAG GCTATCTAAG ACCCGAAACG GCTCAGGGAA TATTCGTAGC TTTTCCCCGC 
CTCGCGGAGT ACGTGGGGCG ACGCCACCCC TTCGGCGTTG CGCAGATAGG GAGGGTGGCG 
CGCAACGAGA TCTCGCCTCG GGGCGGACTC ATGAGGCTGA GGGAATTCAC ACAGATGGAG 
ATAGAGCTCT TCTTCGACCC TCAGAACCCC AAGTGTCCCT ACTTCGCCGA GGTGGAGGGG 
CTTGAAATCC CTATCGTGCC GGAGGAGTTC GTGGCTAAGG GTCAGACAGA GCCCCTTTTC 
CTAACGGCGA GGGAAGTAGC GGCGAGGGGA TACGCAAACG AGTGGATGGC CTTCTTCATG 
GCCCTAGCCG CCAAGTTCCT CAAAGAGCTG GGAGTTCCCC TGGAGAGGCA GAAGTTCTTG 
GGTAAGCTCC CACACGAGAG GGCCCACTAC TCGGCTAAGT CCTACGACCA GATGGTGTTG 
ACAGAGCGCT TCGGCTGGGT GGAGGTATCG GGCCACGCCT ACCGCACCGA CTACGACCTC 
TCCGGCCATA TGAGGCACAG CGGCCGTGAG ATGTACCTAG AGAGGCGTCT TCCAGCCCCT 
AAGGAGGTAG AAGTGGTGAG GATCTATCCC AACCCCAACG CCATAAGGGA GAAGTACGGG 
GATAGAATAG GAGAGGTCAT AAAGGCAATA AAAGAAAACG AGGCGTATGT AGCTAAGACA 
TTCGGCGAGG GGAAGCAAGA GGTGACCGTT GGCGAGTACA TCGTAACTCG TGACATGGTA 
TTTATAAAGA CAGAGAAGCG CAAAACCGAC CTCGAGAAGT TTATCCCGCA TGTGGTGGAG 
CCTTCTTTTG GCCTCGATAG GATTATGTAC GCGGTTTTGG AATACGCAGT GGCGGAAGAG 
GGTGGGCGCG TCTACTTGAG GCTCCCGGCA GACGTCGCGC CTATCAACGT GTGTATCCTG 
CCCATTGTCA AAAGGCAGGA CTACGTGGAG ATAGGCCGGT CTCTGCGGAA GGAACTGGCG 
ACGGAGGGCT TTTTAGCATG GTACGACGAC GAGGGAACAA TCGGCAGTCG ATACGCGGCG 
TGTGACGAAA TCGGTGTGCC GCTTGCGGTG ACGATTGACG AGAGGACCCC AACAGACGGC 
ACCGTCACCA TACGCGACAG GGATACCCGC AAGCAGGTGC GGATAGGGCT GAGGGACGTG 
GCGAAATTCT TGGCGGCGGT TAGGAAAGGC ACCTCTTTTG ACGAGGCGGC TAAGGCCCTC 
GGCGCCACGC CTGTCTAA

Protein sequence

MRRAELLEEI IKRRLLYWPS SEIYGGVGGF YDYGPLGVQL RRNIVEKWRR TFVLPFQDLI 
IEVETPIIMP EPVFKASGHL DHFTDYVVGC TKCGRKYRAD HLVEEELAKR GLKISTEGLS 
AAELERLIVE HRIVCPNCGG PLGRVESFNL LFKTTIGPYS ENAGYLRPET AQGIFVAFPR 
LAEYVGRRHP FGVAQIGRVA RNEISPRGGL MRLREFTQME IELFFDPQNP KCPYFAEVEG 
LEIPIVPEEF VAKGQTEPLF LTAREVAARG YANEWMAFFM ALAAKFLKEL GVPLERQKFL 
GKLPHERAHY SAKSYDQMVL TERFGWVEVS GHAYRTDYDL SGHMRHSGRE MYLERRLPAP 
KEVEVVRIYP NPNAIREKYG DRIGEVIKAI KENEAYVAKT FGEGKQEVTV GEYIVTRDMV 
FIKTEKRKTD LEKFIPHVVE PSFGLDRIMY AVLEYAVAEE GGRVYLRLPA DVAPINVCIL 
PIVKRQDYVE IGRSLRKELA TEGFLAWYDD EGTIGSRYAA CDEIGVPLAV TIDERTPTDG 
TVTIRDRDTR KQVRIGLRDV AKFLAAVRKG TSFDEAAKAL GATPV