Gene Hhal_1143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1143
Symbol
ID	4709391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1242815
End bp	1244053
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	67%
IMG OID	639855617
Product	phage integrase family protein
Protein accession	YP_001002721
Protein GI	121997934
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTCGCG GAACCAACAA GCTGACGGAT CGCCAGTGCC GAACGGCGAA GCCTCCCGAG 
GGCAAGCAGC AGCTGAAGCT CACTGATGGC GGCGGACTGG TCCTCCTGGT CAAGAGCAAC 
GGCGGCAAGC AGTGGCAGTT CCGCTACCGG CGACCCTCAG GGCGCGAGGC GACGATGGGA 
CTGGGGGTCT ACCCCGACGT TCCGCTGTCC AAGGCGCGGG AGCGCCGTGA TGAGGCGCGC 
GCGCTACTTG CCGACGGTAT CGACCCGATT GACCAACGCA AGGCGCAGCG TTCGGCAGCC 
GCCTCCGCCG ACACCCATTC GTTCGAGGCC GTCGCACGTG AGTGGTGGGA CGCTGTCCAC 
CGGCACAAGG TGGTTGCGTC CCACGCGAAC CGGAATCTTC GTCGCCTGGA GCAATACGCC 
TTCCCGAAGC TTGGCCGCCG GCCAGTGAGC GCGATTGAAC CACCCGACGT CCTGGAAGCA 
CTTCGGCGTA TCGAGGCGCT GGAGCACGTT GAGACCGCGC ACCGCGTGAA GACCCTCATT 
GGGCAGGTAT GCCGATATGC CATCGCTACC GGACGAGGCA GCCGCGACCC CACTGCAGAT 
CTGCGGGGGA TGCTGCGCTC GCCAAAGACG CGCCACCTCC CCGCGATCAC GGAGCCAGCG 
GAACTTGGGC CGTTGCTGCG GGCTATCGAC GGGTATCGCG GGCAGCCCAC GACCCGCGCC 
GCGTTGCAGC TTGCGCCCAT CGTGTTTTGC CGGCCCGGCG AGCTAAGAGC CGCGGAGTGG 
CAGGCGTTCG ATCTGAGTAG CGGCACCTGG GACTACCAGC CAAGCAAAGA CGGTGACCCC 
CTGGTGACAC CGCTGCCAAG GCAGGCCATT TCCATACTCC GCGAGCTGGA GCCGATCAGT 
CGCAGCAGCC GTTATCTGTT CCCCTCAGGA CGGACCCCGG ATCGGCCGAT TAGCGACAAC 
ACCCTCACGG CCGCGCTCAA GCGCCTGGAT TATGGCGGGC GCATGGTGGC GCACGGCTTC 
CGCGCAGCCG CCCGCACCAT CCTGGTCGAA CGGCTTGGCT GGGGGATCGA AATCGTCGAG 
ATGCAGCTGG GCCACCGGGT TCGCGACGCC CACGGCCGCG CCTACAACCG CACTCAATGG 
ATCGAGCAAC GTGGCGTCAT GCTGCAGCAG TGGGCCGATT ACCTGGACGA GCTTCGGGAG 
GCAAGCGACA CAGAGCCAAC GGCTGACCGG GACCGTTAG

Protein sequence

MGRGTNKLTD RQCRTAKPPE GKQQLKLTDG GGLVLLVKSN GGKQWQFRYR RPSGREATMG 
LGVYPDVPLS KARERRDEAR ALLADGIDPI DQRKAQRSAA ASADTHSFEA VAREWWDAVH 
RHKVVASHAN RNLRRLEQYA FPKLGRRPVS AIEPPDVLEA LRRIEALEHV ETAHRVKTLI 
GQVCRYAIAT GRGSRDPTAD LRGMLRSPKT RHLPAITEPA ELGPLLRAID GYRGQPTTRA 
ALQLAPIVFC RPGELRAAEW QAFDLSSGTW DYQPSKDGDP LVTPLPRQAI SILRELEPIS 
RSSRYLFPSG RTPDRPISDN TLTAALKRLD YGGRMVAHGF RAAARTILVE RLGWGIEIVE 
MQLGHRVRDA HGRAYNRTQW IEQRGVMLQQ WADYLDELRE ASDTEPTADR DR