Gene Haur_2366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2366
Symbol
ID	5734247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3013766
End bp	3014923
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	54%
IMG OID	641279507
Product	two component, sigma54 specific, Fis family transcriptional regulator
Protein accession	YP_001545134
Protein GI	159898887
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000342445
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAAAC GCCTCTTAGT TATCGACGAT GAAGCCAATT TACGCTGGGT GCTTAGCGAG 
GCCTTGAGCG ACCAAGGCTA CGACGTAGTG GTGGCCGCGA ATGCCAACGA TGGCTTGGCT 
GCGATGAGCC GCCAACCTGC CGATGTGGTC ATTCTCGATC TCAAGTTGAA GGGCATGGAT 
GGCTTGGCAA CCTTGGCCCG CTTGCGCGAA CGCTGGCCTG AAGTCGTTGT CTTGATCTTG 
ACGGCGTATG GCACAGTGGC CAGCGCGGTT GAGGCTATGC AACTGGGCGC TGCTGATTAT 
TTGCGCAAGC CCTTTGATTT GGAAGAAATT GGTTTCAAAT TGCAACGAGC CTTGGAACGA 
GCTGCGCTAC AACAAGAACT ACGGCGTTTA CGCCAACAAC AGCAACAGCG CATGGTCAAC 
GATTTGATCG GCAGTCATCC AGCATGGGTG GCTTGTCGTC AACAGCTTGA ACGCATGATC 
GATCGCTTGC CCGTGTTGGT TTTGGTGGGA GATGCGGGCG TGGGCAAGGC CCAATTGGCG 
CGGTATGCCC ATGCTATCAG CCAGCGCCAG CAGGCACCGC TGATTGAGCT TGATGCTGGC 
TTATTGAACG AATCGATGCT TGAGGCGGCG CTGGACGAGG CGGGCCAAGG CAGTATCATT 
ATTCGCCGTG GTTTAGGGTG GTTGGATTGG TTACTCGCTC GAAAACTTGC GGCATGTGTA 
CTCTTGACTA GCCTTGAAGC GCCGAATCAA ACGGTTCCAA CGCTGCATCT CCCCACGCTT 
AATCAGCGCC GTAGCGACAT TGGCTTGTTA GCGGATTATT GGCTTGGACA GCAGATGCTT 
AGTCCTCAGG CGCTCCAAAA ACTAGAGCAA AGTCAATGGA ACGCCAATCT GCCCGAATTG 
CGCCATGTCC TTGAACGTGC AGCTGTCGCG GCTAATGGTC AGCTAATTCA GTCCGAGCAT 
TTGCCACACG ATTTGCCTAG TGCTACTGCC GAACCAATCA CACTGCCCGC AAGCGGCTTG 
CAACTTGAGG TGGTCGAACG CAGTTTATTG CAACAGGCCT TGCAACAAGC CAATGGTAAT 
AAAACCCGCG CCGCTGAATT ATTGGGCTTA TCGCGCCATC AATTACTCTA TCGGCTAGAA 
AAACATGGCC TTAGCTAG

Protein sequence

MTKRLLVIDD EANLRWVLSE ALSDQGYDVV VAANANDGLA AMSRQPADVV ILDLKLKGMD 
GLATLARLRE RWPEVVVLIL TAYGTVASAV EAMQLGAADY LRKPFDLEEI GFKLQRALER 
AALQQELRRL RQQQQQRMVN DLIGSHPAWV ACRQQLERMI DRLPVLVLVG DAGVGKAQLA 
RYAHAISQRQ QAPLIELDAG LLNESMLEAA LDEAGQGSII IRRGLGWLDW LLARKLAACV 
LLTSLEAPNQ TVPTLHLPTL NQRRSDIGLL ADYWLGQQML SPQALQKLEQ SQWNANLPEL 
RHVLERAAVA ANGQLIQSEH LPHDLPSATA EPITLPASGL QLEVVERSLL QQALQQANGN 
KTRAAELLGL SRHQLLYRLE KHGLS