Gene Hlac_0777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0777
Symbol
ID	7400252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	781313
End bp	782788
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	67%
IMG OID	643707843
Product	prolyl-tRNA synthetase
Protein accession	YP_002565447
Protein GI	222479210
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.941817
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG ACGACCAGGA GCTCGGAATC ACCGAGTCCA AGTCACACAA CACCGGCGAG 
TGGTACGCCG AGGTCGTACA GAAGGCGGGG CTCGCCGACT ACGGCCCCGA GGGTATGAGT 
GGGTTCATCG TCACCCGACC GCGCGCGTAC GCGGTGTGGG AGCGACTGCA GGGCTTTCTC 
GACGCGAAGT TCAAAGACAC CGGAGTCCAG AACGCGTACT TCCCCCTCTT CATCCCCGAG 
TCGTACCTCG AACGGGAGAA GGACATCGTC GAGGGATTCG ACCCCGAGGT CGCGTGGGTG 
ACCGAGGCGG GCAACAAAGA ACTCGAAGAG CGACTCGCGG TCCGGCCCAC CTCCGAGTCG 
ATCATCACTC CGTACATCAG CCAGTGGGTG CGGAGCCACC GCGACCTCCC GCTGCGCGTG 
AACCAGTGGT GTTCGGTCGT GCGCTGGGAG GCGACTGAGA CGAAGCCGTT CTTCCGCACG 
AAGGAGTTCC TCTGGCAGGA GGGCCACACC GCCCACGCTA CCCACGAGGG CGCCTGGGAG 
GAAACGATGA CGCGGCTCGA CCAGTACGCG TCCGTCTACG AGGACCTGCT GGCGATGCCC 
GTGTTGAAGG GCCAAAAGCC CGACCACGAC AAGTTCCCGG GCGCAGAGAC GACCACGACC 
GTCGAGGCGC TGATGCCGGA CGGGAAGTCG GTGCAGGCAG GCACCTCCCA CCACCTCGGA 
CAGTCGTTCG CGGAGGCGTT CGACATCACG TTCTCCGACG AGGACGAGGA AGAGCGGATC 
GCGCACACCA CCTCGTGGGG GCTCTCGTGG CGCGCACTCG GCGCGCTCAT CATGACTCAC 
TCCGACGAGC AGGGGCTCGT GCTCCCGCCC GGCGTCGCCC CCGAGCAGGT CGTCGTCGTC 
CCCATCTGGC AGGAGGACAC GAAAGACGAA GTGCTCGAGT ACGCCGAGGG CGTCGCCGAC 
GACCTCGACG ACGCGGGGAT CCGCGTCGAG CTCGACGACC GCGACGGGCG CAACCCCGGA 
TTCAAGTTCA ACGAACACGA GCTCAACGGC GTTCCCCTCC GGATCGAGAT CGGCCCCCAC 
GAGGTCGAGG ACGGCGAGCT CACCCTCGTC CACCGGCCCG ACGGCGAGAG CGTCGTCGAG 
GACCGAGAGG GCGTCGTTGC GACCGTCCAA GACCACTTCG ACGAGGTGTA CGCGAAGCTG 
TACGCGACCG CCGAGGAGAC CCTCGACGGC GCGGTTCGCG AGGCCGACGA CCGTGCCGAC 
ATCCTCGGCA CGCTCGGCCA GCACGGCGGC TACGTGACGG CTCCGTGGTG CGGCGACGAG 
GCGTGCGAGG AGCCGATCAA AGAACCGATG GCCGCCGAAA TCGTGATGGT CCCGTTCGAA 
GACGACGACC CTCTCGCCGA GGCGGACCAC GGCGAGACCT GCGCGATCTG CGACGACGAC 
GCCGAGCGGA CGGCGTACTT CGCGAAGTCG TACTGA

Protein sequence

MSDDDQELGI TESKSHNTGE WYAEVVQKAG LADYGPEGMS GFIVTRPRAY AVWERLQGFL 
DAKFKDTGVQ NAYFPLFIPE SYLEREKDIV EGFDPEVAWV TEAGNKELEE RLAVRPTSES 
IITPYISQWV RSHRDLPLRV NQWCSVVRWE ATETKPFFRT KEFLWQEGHT AHATHEGAWE 
ETMTRLDQYA SVYEDLLAMP VLKGQKPDHD KFPGAETTTT VEALMPDGKS VQAGTSHHLG 
QSFAEAFDIT FSDEDEEERI AHTTSWGLSW RALGALIMTH SDEQGLVLPP GVAPEQVVVV 
PIWQEDTKDE VLEYAEGVAD DLDDAGIRVE LDDRDGRNPG FKFNEHELNG VPLRIEIGPH 
EVEDGELTLV HRPDGESVVE DREGVVATVQ DHFDEVYAKL YATAEETLDG AVREADDRAD 
ILGTLGQHGG YVTAPWCGDE ACEEPIKEPM AAEIVMVPFE DDDPLAEADH GETCAICDDD 
AERTAYFAKS Y