Gene Dole_2058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2058
Symbol
ID	5694901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2508682
End bp	2510208
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	60%
IMG OID	641264659
Product	prolyl-tRNA synthetase
Protein accession	YP_001529939
Protein GI	158522069
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAC AGGAACAGGC GGCGATTTCG CCCACCCGTG CGGAAAATTA TTCGGAGTGG 
TATCAGCAGG TGGTCAAGGC GGCGGACCTG GCGGAAACAT CGCCGGTGCG CGGGTGCATG 
GTGATCAAGC CCTGGGGCTA TGCCATATGG GAAAACATCC GGCAGGCACT TGACGGCATG 
TTCAAGGCCG CGGGCGTGAA AAACGCCTAC TTTCCCCTGT TTATTCCGCT GGAGTTTCTG 
GAGCGGGAAG CCGAGCACGT GGAGGGGTTT GCCAAGGAGT GCGCCGTGGT GACCCATCAC 
CGGCTGGAGG CCAAAGACGG CCGCCTGGTG CCCGCCGGTG AGCTGACTGA GCCCCTGGTG 
GTGCGGCCCA CATCAGAGAC CATCATCGGC GAGTCCTTTT CCCGGTGGGT GAAAAGTTAC 
CGGGACCTTC CCGTGCTGAT CAACCAGTGG GCCAACGTGG TGCGGTGGGA GATGCGCACC 
CGCATTTTTC TGCGCACCAG CGAGTTCCTG TGGCAGGAGG GCCATACGGT TCACGCCGAC 
GCCGCCGAAG CCATGGAACT GGCCCGCCAC ATGCTCAACC TGTATGAAAA ACTGGCCACC 
GACTACCTGG CCATTCCGGT AATCAAAGGC AACAAGAGCG ATTCCGAGCG GTTTCCCGGC 
GCCGTGGAAA CCTTCTGCAT TGAAGCCATG ATGCAGGACA GAAAGGCCCT TCAGGCCGGC 
ACCTCCCATT TTCTGGGCCA GAATTTTGCC CGGGCCTCAA AAATACTTTT TCAGTCCGAG 
CAGGGCAAAG AAGAGCTGGC CTGGACCACC TCCTGGGGGG TCTCCACCCG GCTGATCGGC 
GGGCTGATCA TGTGTCATGC CGATGACGAC GGCATGATCA TGCCGCCGGC CATCGCCCCG 
GCCCACGTGG TGCTGCTGCC GATTTTCAAA AAGGATTCAG ACAGGGAAAC GGTGATGGCT 
TATACCGATA CCCTGGCCGC ACGGCTTCGT GAAAAACAGT ACATGGGCCG GCCCGTGGGC 
GTGGAGATCG ACACCCGGGA CATCGGCGGG GCCCGAGGCT GGGAGTGGAT CAAAAAGGGC 
ATTCCGTTGC GCGTGGAGAT CGGCCCCAAG GACATTGAAA AACAGTCGGT GTTCGTGGGC 
CGCAGGGACA TGGGTCACCG GGAAAAGATG TCGGTTCCCA CCGACCGTTT TGTTGAAGAC 
ATTGCCGATA CCCTGGCCGC GGTGCAGCAC ACCCTTTACC AGCGGGCCCT TGAGTTCCGC 
GCGGCCCACA CCGTGACCAT TGATGACAAA AAAGCCTTTT ACGATTTTTT CACTCCGCAA 
AACACGGACA TGCCGGAGAT TCACGGCGGG TTTGCCCTGT CCCCCTGGTG CAGGGACCCG 
GCCTGTGAGG CGGCTATCAA AGACGATCTG TCGGTTACCA TCCGGTGCCT TCCCCATGAT 
GAAGCGTTAC GGGGTGCGGA TGCCGGTTCC TGTGTCTGCT GCGGGAAAAC GGCCAAAGGC 
CGGGCCGTGT TTGCAAAGGC GTATTGA

Protein sequence

MGKQEQAAIS PTRAENYSEW YQQVVKAADL AETSPVRGCM VIKPWGYAIW ENIRQALDGM 
FKAAGVKNAY FPLFIPLEFL EREAEHVEGF AKECAVVTHH RLEAKDGRLV PAGELTEPLV 
VRPTSETIIG ESFSRWVKSY RDLPVLINQW ANVVRWEMRT RIFLRTSEFL WQEGHTVHAD 
AAEAMELARH MLNLYEKLAT DYLAIPVIKG NKSDSERFPG AVETFCIEAM MQDRKALQAG 
TSHFLGQNFA RASKILFQSE QGKEELAWTT SWGVSTRLIG GLIMCHADDD GMIMPPAIAP 
AHVVLLPIFK KDSDRETVMA YTDTLAARLR EKQYMGRPVG VEIDTRDIGG ARGWEWIKKG 
IPLRVEIGPK DIEKQSVFVG RRDMGHREKM SVPTDRFVED IADTLAAVQH TLYQRALEFR 
AAHTVTIDDK KAFYDFFTPQ NTDMPEIHGG FALSPWCRDP ACEAAIKDDL SVTIRCLPHD 
EALRGADAGS CVCCGKTAKG RAVFAKAY