Gene Haur_1479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1479
Symbol
ID	5733364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1728072
End bp	1729160
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	55%
IMG OID	641278617
Product	LacI family transcription regulator
Protein accession	YP_001544251
Protein GI	159898004
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCACATG ATCACGAACC CGCAAAGCCC CATCGGATCA CCATTAGCAC CGTTGCCGCT 
GCTTTAGGGG TCGCTGTCTC GACCGTTTCT AACGCCTACA ATCGACCCGA CCAACTTTCA 
GCAGAGCTGC GTGAACGAGT GCTGGCAGTC GCTACCGAGC TTGGTTACCC TGGGCCAAAC 
CCAGTTGCTC GCAGTTTACG CCAACAACGG GCTGGCGCGG TCGGGGTGCT GTTTGCCGAG 
CGCCTGCCCT ATGCCTTTCG CGATCCGGCG GTGTTGATGG TGCTTGAAGG GATTGCTACC 
ACGCTCGAAC AGGCTGGTCT CGGCTTATTA CTCGTGCCAG GTCGCGACGA CGACACCACC 
ACCGTTCAAC AAGCCTTGGT CGATGGCTTT ATTGTCTATT CGATGATGGA AACTGATCCC 
TTGGTTCAGG CTGCTCTGAA ACGTCGGCTA CCGACAGTGC TGCTTGACCA ACCGCCCCGC 
CCTGATGTAC CGTCGATTAT CGTTGATGAT GAGGCTGGCG CACGTATGGC CACCGAGCAT 
CTATTAAGCC TCGGCCATCG CCAATTTGCA ATTATCACCG ATCGCTTGGT CGAAACCAAT 
CTACGACCAT CGAGTGCGCC AATAAACGTT CATGATCAGA GCAAACCAAC CTTTTTCGTC 
ACCCAATTAC GCTTGCAAGG CTATCGCCAG CCACTTGAAG CAGCAGGCAT CGATTGGCGC 
AGCGTGCCAA TTTACGATTG CAACGATAAC AACGAAGCCG ATGGTGCAGC AGCCATCCAA 
ATTTTACTCG CCCACAACCC ACGTCCAACT GCCATTCTCT GTTTAACCGA TCGTTTGGCG 
TTGGGGGCAA TCGCTGGAGC GCAACAAGCG GGCTATCAGG TTCCGCAACA GCTTTCAATC 
GTGGGCTTTG ATGATATTCC TCAAGCCAGT CAAAGCGTGC CGAGCTTAAC CACCATTCGC 
CAAGATCATC GCCAAAAAGG CTTATCAGCA GGCCAAGCCT TGATTGAACT GCTGGCTGGC 
CAAAGCCCAA CCAGCTATCA ACGGCTGGCA GTCGAGTTGG TAGTCCGCGA TTCGACCGCA 
GCAATTTAA

Protein sequence

MAHDHEPAKP HRITISTVAA ALGVAVSTVS NAYNRPDQLS AELRERVLAV ATELGYPGPN 
PVARSLRQQR AGAVGVLFAE RLPYAFRDPA VLMVLEGIAT TLEQAGLGLL LVPGRDDDTT 
TVQQALVDGF IVYSMMETDP LVQAALKRRL PTVLLDQPPR PDVPSIIVDD EAGARMATEH 
LLSLGHRQFA IITDRLVETN LRPSSAPINV HDQSKPTFFV TQLRLQGYRQ PLEAAGIDWR 
SVPIYDCNDN NEADGAAAIQ ILLAHNPRPT AILCLTDRLA LGAIAGAQQA GYQVPQQLSI 
VGFDDIPQAS QSVPSLTTIR QDHRQKGLSA GQALIELLAG QSPTSYQRLA VELVVRDSTA 
AI