Gene Hhal_0117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0117
Symbol
ID	4710748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	132233
End bp	133363
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	69%
IMG OID	639854575
Product	hypothetical protein
Protein accession	YP_001001713
Protein GI	121996926
COG category	[S] Function unknown
COG ID	[COG3016] Uncharacterized iron-regulated protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCACC CCCTGCCGCG CACCACCGTC TTGTTCGCCG GCCTGTTACT CGCCGGGAGC 
GCCCTCGCCA GCCCCTGCGC CGATCCGGGC CAGTGGTACG AACCGGCCGC CGAACGGACC 
CTCAACACCC AGGAAGTCCT CGACGCCCTC GACGGCGCTG AGTTCATCCT GCTTGGCGAG 
CGCCACGACG ACGCCGCCCA CCACCGCTGG CAACTCCATA CCCTGGCAGC CCTGCAAGGG 
CGCGGCGAGC TGGCGGCGAT CGGCTTCGAG ATGTTCCCAC GCAGCAAGCA GGCCCCCCTG 
GAGGACTGGC GTGCAGGCAA GCTGACGCGC GAGGCGTTTT TGGAAGCGAG CGAATGGCAG 
CGCGTCTGGG GCTACGATGC CGGACTCTAT ATGCCGCTGT TCGATTTCGT TCGCACCCAC 
CGCGTACCCG CCCAGGCCCT CAATGTCGAC CGAGCCACCG TGCGGGCGGT CCGTGAGCAG 
GGCTTCGACG CCCTGGATGA AGCCGAGCGG GAATCCGTCA GCAAGCCGGC CGAGGCCAGC 
GATGGCTATC GGGATCGTCT ACAGCGGGTA TTTCGCCACC ATCCCGGGGC GGAGGACGAC 
GATACGGCCG TCGATCGATT TATCGAGGCG CAGACCTTCT GGGATCGGGC CATGGCCGAG 
TCGATGGCCG CCGCCTACGA ACAGCACGGT GGGGCGGTGG TCGGTATCGT CGGCCGAGGC 
CACGCCGAGT ACGGCGACGG GATCGCCCAC CAGCTCCAGG ACCTCGGCTA CGAACGGGTT 
CGCATCCTGC TGCCGCTCGA CCACACCGCC GAGTGCCCGG ACGCCGGGCA GGCGGACTTC 
CTCTTCGCCC TCGAGCCGGA GCGCCGCGGA ACCGAGCCGC CACGCCTGGG CATCGCCATG 
GGGCACGAGG ACTCGAAAGT GACCATCGTC GACGTCATGG CCGACACCCC GGCCGAGGAG 
GCCGGACTGG CCGCCGGTGA CCGCATCCTC AAGGCGGCGG AAACCAAGAT CGAGCACCCG 
AGCGACCTGC AACGGATCGT TGGCCGACAG GCGCCGGGCA CCTGGCTGCC GATACGGATC 
GAGCGCGGTG GGGATGAACT GGAGAAGGTC GCACGCTTCC CTGCCGAGTG A

Protein sequence

MPHPLPRTTV LFAGLLLAGS ALASPCADPG QWYEPAAERT LNTQEVLDAL DGAEFILLGE 
RHDDAAHHRW QLHTLAALQG RGELAAIGFE MFPRSKQAPL EDWRAGKLTR EAFLEASEWQ 
RVWGYDAGLY MPLFDFVRTH RVPAQALNVD RATVRAVREQ GFDALDEAER ESVSKPAEAS 
DGYRDRLQRV FRHHPGAEDD DTAVDRFIEA QTFWDRAMAE SMAAAYEQHG GAVVGIVGRG 
HAEYGDGIAH QLQDLGYERV RILLPLDHTA ECPDAGQADF LFALEPERRG TEPPRLGIAM 
GHEDSKVTIV DVMADTPAEE AGLAAGDRIL KAAETKIEHP SDLQRIVGRQ APGTWLPIRI 
ERGGDELEKV ARFPAE