Gene Haur_4786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4786
Symbol
ID	5736630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	6102162
End bp	6103262
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	45%
IMG OID	641281951
Product	heat domain-containing protein
Protein accession	YP_001547545
Protein GI	159901298
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATGG ATGTTGCGAT TGAGTATTTG CTGGGACGAC TAGCCAAAGA CACTCCAACG 
GAATCTTTTT CTGGTCTATT GCTGCAATTG ACTTGGCTTA TGGATGATCA GGGCGCAGAT 
ATTCATCGAA TCATGCGCAA CTGGCTTGAC GCTGATCAGA TTGAAAAAGT CAAAGTTGCG 
CTCGCGATCG ATGAAGTTTT TTTACTTGAA TCGGATGCAG AATATCAAGC AAGTATCACT 
CGGATTGTTA ATCGTTGGCC CGAACTTGAG CCAATGTGTC GCAAATTTTA TCAGCGTTGG 
GATGGTAGCA AACGTGGTAT CCCCTTACCG AATCGGCGTA AAGCGGCTCC CGTGCAATCG 
CTCACCGACT GGCTACCGAT TCTTGCTATC TATCAGCATC CAGAGATGGA GAAGGCAAAA 
GATGCTTTTT GGGCGGCTGG CTCAGCGAGT TTGCCTTATC TCTTGCCTCT GATTGATGAT 
GGAACGACAT GGGCAGCCAG TGAGGCTTGT GAATTGGTTG GCATTCTTGG CGATCCAGTT 
GCGATTCCAG TCCTGCGCAA CGCATTGGGA CGTGATTCCA ATATTCCTGA GCTTGATATT 
GATATTTTGA CTGCGTTGCG TCAATTGCAT GATTCTGGCG GCCCATGGAT TTATCCGATG 
CTCAATGATC CTTCGCCAAA ACGCCGCGGA TTTGCGTGTC AATATGTCGG CATAACCCAA 
GATTATGAGG CGCTGCCTTT AATTATCAGC TTACTTAATG ATCCTGATCC TCGGGTTCGC 
AGTTTTGCGG TGGATACATT AGCTGTGTTC AAAGATGGCA AACCATCAGC AGTAATCGAT 
CCGATTTTCT ATAAACTTGT CATGGATCAT CAATCGGGGA TTCGATTGGA AGTACTACGA 
TCATTTATGA AATGTTGTGA CCCATTCTAT ATTCCATTTT TTATCACAGC GTTACGCGAT 
CCATACTATC TCTGTCGAAG TGTCGCAATA CAATCCTTGG GCAAAGTTGA TCCGATTAAT 
TTAGGTTGTT ATCTTGATTC TATGGTAGAC GAGACAGATA GCGATGTTCA AAGGACAATT 
AAGGCTTGGC GTGATTTTTG A

Protein sequence

MRMDVAIEYL LGRLAKDTPT ESFSGLLLQL TWLMDDQGAD IHRIMRNWLD ADQIEKVKVA 
LAIDEVFLLE SDAEYQASIT RIVNRWPELE PMCRKFYQRW DGSKRGIPLP NRRKAAPVQS 
LTDWLPILAI YQHPEMEKAK DAFWAAGSAS LPYLLPLIDD GTTWAASEAC ELVGILGDPV 
AIPVLRNALG RDSNIPELDI DILTALRQLH DSGGPWIYPM LNDPSPKRRG FACQYVGITQ 
DYEALPLIIS LLNDPDPRVR SFAVDTLAVF KDGKPSAVID PIFYKLVMDH QSGIRLEVLR 
SFMKCCDPFY IPFFITALRD PYYLCRSVAI QSLGKVDPIN LGCYLDSMVD ETDSDVQRTI 
KAWRDF