Gene Hhal_0701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0701
Symbol
ID	4710810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	785255
End bp	786961
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	72%
IMG OID	639855164
Product	prolyl-tRNA synthetase
Protein accession	YP_001002285
Protein GI	121997498
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00409] prolyl-tRNA synthetase, family II

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.269166
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGTCA CCCGTTTTCC ACTATCCACC ACCCGTGAGA CCCCGGCCGA CGCCGAGATC 
GTCAGCCACC AGCTGATGCT GCGCGCCGGC ATGATCCGCC GCCTCTCCTC GGGGCTCTAC 
ACCTGGCTGC CCCTGGGCCT GCGCGTGCTG CAGAAGGTGG AGCGCATCGT GCGCGAGGAG 
ATGAACCGCG CCGGGGCGCT GGAGGTGCTG ATGCCGGCGG TGCAGCCGGC GGAGCTCTGG 
CAGGAGTCCG GCCGCTGGGA GAAGTACGGC CCGGAGCTGC TGCGCATCCG CGACCGGCAC 
GACCGCGAGG GCTGCTTCGG CCCCACCCAC GAGGAGGTGA TCACCGACCT CTTCCGCCGG 
GAGATCCGCA GCTACCGCCA GCTGCCGGTG AACTACTACC AGATCCAGAC CAAGTTCCGG 
GACGAGATCC GGCCGCGCTT CGGGGTCATG CGCGCCCGCG AGTTCCTGAT GAAGGACGCC 
TACTCCTTCC ACCTCGACGA CGACGACCTG CGCGCCGAGT ACCAGCGCAT GCACGAGGCC 
TACTGCCGGA TCTTCCAGCG CACCGGCCTG GCCTTCCGCC CGGTGGAGGC CGACACCGGG 
GCGATCGGCG GCAGCGTCTC CCACGAGTTC ATGGTCCTGG CCGACTCCGG CGAGGACGCC 
ATCGCCGTCT GCGAAGCCAG CGGCTACGCC GCCAACGTCG AGCTGGCCCC GGCGGTGGCA 
CCCACCGAGC CGCGCCCGGC CCCCCAGGCG GAGCGGGCGG AGGTGGCTAC CCCGGGGCAG 
CGGACCATCG CCGAGGTGGC CGCCTACCTG GGTCTGCCCG AGGCCCGCAA CCTCAAGACC 
CTGCTGGTCG AGGGGGCCGA CGGCGGCCTG GTGGCGCTGC TGCTGCGCGG CGACCACGAG 
CTCAACGAGC TCAAGGCCGA GAAGCATCCG GCGGTGAAGG CGCCGCTGAC CTTCGCCGAG 
GCCGAGCGCG TCGAGCGCCA GCTCGGCTGC CCCTTCGGCT CCCTGGGGCC GGTGGGGCTG 
ACGGGGGTGA CGCTGATCGC CGATCACGCC GCCGCCCACC TGGCCGACTT CGCCTGCGGC 
GCCAACCGCG AGGGCTACCA CCTCACCGGC GTCAACTGGG GCCGCGACCT GCCCGAGCCG 
GAGACCGCCG ACCTGCGCGA GGTGACCGCC GGCGACCCGA GCCCCGACGG CGAGGGCACG 
CTGACCCTGC GCCGCGGCAT CGAGGTCGGC CACATCTTCC AGCTCGGCAC CACCTACAGC 
GAGGCCATGG GCGCCAGCGT CCTCGACGAG CAGGGCCAGG AGCGCACGGT GACCATGGGC 
TGCTACGGCA TCGGCGTCTC GCGCGTGGTG GCCGCGGCCA TCGAGCAGAA CCACGACGAC 
CGGGGCATCT GCTGGCCGGC GCCCATCGCG CCGTTCCAGG TGGCCCTGGT GGCGATCAAG 
GCCGAGGACC CGGCGGTGGC CGAGGCCGCC GAGGCGCTCT ATGCGGACCT GACCGCCAGC 
GGCATCGACG TCCTCTACGA CGACCGCGAC GCCCGCCCCG GGGTGAAGTT CGCCGACATG 
GAGCTCATCG GCATCCCCCA CCGGGTGGTG GTCAGCCCCC GGGCCATCCA GGAGGGCAGC 
GTCGAATACA AGGGGCGCCA GGATGCGGAC CCGACCCACG TCCCCCGAGC GGAGATCGTG 
ACATGGCTGA AGAACCGTCT GACGTAA

Protein sequence

MRVTRFPLST TRETPADAEI VSHQLMLRAG MIRRLSSGLY TWLPLGLRVL QKVERIVREE 
MNRAGALEVL MPAVQPAELW QESGRWEKYG PELLRIRDRH DREGCFGPTH EEVITDLFRR 
EIRSYRQLPV NYYQIQTKFR DEIRPRFGVM RAREFLMKDA YSFHLDDDDL RAEYQRMHEA 
YCRIFQRTGL AFRPVEADTG AIGGSVSHEF MVLADSGEDA IAVCEASGYA ANVELAPAVA 
PTEPRPAPQA ERAEVATPGQ RTIAEVAAYL GLPEARNLKT LLVEGADGGL VALLLRGDHE 
LNELKAEKHP AVKAPLTFAE AERVERQLGC PFGSLGPVGL TGVTLIADHA AAHLADFACG 
ANREGYHLTG VNWGRDLPEP ETADLREVTA GDPSPDGEGT LTLRRGIEVG HIFQLGTTYS 
EAMGASVLDE QGQERTVTMG CYGIGVSRVV AAAIEQNHDD RGICWPAPIA PFQVALVAIK 
AEDPAVAEAA EALYADLTAS GIDVLYDDRD ARPGVKFADM ELIGIPHRVV VSPRAIQEGS 
VEYKGRQDAD PTHVPRAEIV TWLKNRLT