Gene Hoch_1431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1431
Symbol
ID	8543813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	1928574
End bp	1929605
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	72%
IMG OID	646386143
Product	transcriptional regulator, AraC family
Protein accession	YP_003265878
Protein GI	262194669
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCGCA CTCACCGAGG ACGCCAAGCG ACCAACCCAG GGCGCCGCTC CGCGCGAGCG 
CGCGAGCGCC GGCTGCCGCG CGGGCTGCTG GTGGCGCTGC GCGAGGCCGG CGTGGATGTC 
GAGCGGGTGG CGACCCGCGC CGGCCTCGAC CCGAGAGCGC TGAATGAGTT CGTCCGATCG 
GACGAGAGCG GTGCGTTTCT GCGCGAGGCG CTCGCTCAGG TGCCGCCGTG GTTCGGTCTG 
AGCGCGGGTG CCGAGGTGCG TCCCGAGCTG TGGGGCGTGG TCGGCCTGGC GGCGATGAGC 
AGCGCGAGCT TCGGTGCGGC CCTGGCGCGG GTCGCGCGCT ACAAGCGCAT TATGAGCAGC 
GACGAGTTGC TGATCGACGA CCGCGGTGAC GAGGTCGCGG TGTGTTTTCG CCTGGGCAAC 
GCCGCGGCGC CGTACGCGCG CCAGCAGCTC GACTCGGAGC TCGCGTTTCT GGTGTCGCTG 
GGTCGTCGGC TGAGCGGAGC GCCGCTGCAG CCGCTGCGCA TCGCCATCGA GCTGTCGCGG 
CCCAGCTATC ACGAGCGCTA CCGCGCGCTG TTCGCGTGCC CGCTGGCGTT CGAGCAGCCG 
GCCACCGAGC TGGTGTTTCG CGCGCGCGAC CTGGCGCGCC CGCTGCTGAG CGCCGACGCC 
GAGCTGGCCG AGGAGTTCTC GGCCCGCGCC GCGCGGCTCA TGCCGGCCGA GTGCACGCTC 
GCGGTGGCCG AACAGGTTCG CCTGGCCCTG CGCGGTGCGC TGCGCGGCGA GGTTCCGAGC 
CTGGCCGAGA TCGCGCGCCG CATGCACCTG AGCGAGCGCA CGCTGCAGCG CCAGCTACGC 
GGCAACGGCA CCTCGTTCAC GCGCCTGGTG GACGAGGTCC GTCAGGAGCT GGCCCGCCGC 
TATCTGGGCG GCGACGAGCT GCACGCCGCC GAGGTCTCGT ATCTGCTCGG GTTTGCGCAT 
CCCAACTCGT TTTTCCGCGC TTTCAAGCGC TGGACCGGGC TCACGCCCGA GGAGTATCGC 
GAATCGCATT GA

Protein sequence

MERTHRGRQA TNPGRRSARA RERRLPRGLL VALREAGVDV ERVATRAGLD PRALNEFVRS 
DESGAFLREA LAQVPPWFGL SAGAEVRPEL WGVVGLAAMS SASFGAALAR VARYKRIMSS 
DELLIDDRGD EVAVCFRLGN AAAPYARQQL DSELAFLVSL GRRLSGAPLQ PLRIAIELSR 
PSYHERYRAL FACPLAFEQP ATELVFRARD LARPLLSADA ELAEEFSARA ARLMPAECTL 
AVAEQVRLAL RGALRGEVPS LAEIARRMHL SERTLQRQLR GNGTSFTRLV DEVRQELARR 
YLGGDELHAA EVSYLLGFAH PNSFFRAFKR WTGLTPEEYR ESH