Gene Hoch_3095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3095
Symbol
ID	8545483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4265772
End bp	4267499
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	73%
IMG OID	646387765
Product	sigma54 specific transcriptional regulator, Fis family
Protein accession	YP_003267493
Protein GI	262196284
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR02019] bacteriochlorophyll 4-vinyl reductase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.458911
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCCA TCGATCTTCG CATCGCCGAC CTGCTCGAGC TCGACCCGGG CGGCGGCGTG 
TACCGCTTTG GCGGCCAGCG GGTGCTGCTG CTCGACGCCG TGGCCCTGGG GCTGCTGCGC 
AAACAGCTCG TCGAGGCCTT TGGCCAACAC GCCGCGCGCG GGCTGCTCAC GCGGCTGGGC 
TATTCGCACG GCTGGCGCGC GGCCGAGGCG CTGCGCGACA CCATCGCCTG GGACGACGAG 
CGCGAGTGGC GCATCGCCGG CGGGCGCATC CACCGCCTGC AGGGGCTGGT GCGCTTCGAG 
CCGGTGCCCG GAGACCGCGC CAACACGCTG GCGCAGGCGG TGTGGCACGA CTCCTACGAA 
GCTGAGCAAC ACCTGCTGCA TGTGGGACGC TCGTCCGAAC CCGTGTGCTG GTCGCTGTGC 
GGCTACGCCA GCGGCTACCT GAGCCGCGTG GTCGGACAGT CGGTCTACGC GGTCGAGGAG 
AGCTGCGCCG GCTGCGGCGA CGCGGTGTGC CGCATGGTCG CCCGCACCGA GGCGCAGTGG 
GGCGCGGACA TCGAGCCGCA CCTGGCCTAC TACGAGCGCG ATTGTCTCGA CGCCTCGCTG 
CACAGCCTGC GCGACGCGGT GCGCAAGCTC GAGCGCCGGC TGCGCTCCCA GCGGCGCGCG 
CTCGGCGCCG ACGCCGAGGT GCTCGAGAGC GGCGGCGTGG TCGCCCGCAG CCGCGCCATG 
CGCCGGGTGC TCGAGCTCTG CCGCCGGGTC GCCGCGGTCG ACGCCACCGC CCTGGTCCAC 
GGCGAGAGCG GCGTCGGCAA GGAGCGCGTG GCCCGCTACA TCCACGATCA CTCGCAGCGC 
GCGGCCGGGC CCTTTATCGC CATCAACTGC GGCGCCATCC CCGAGCCGCT GCTCGAGAGC 
GAGCTCTTCG GCCACGCCAA GGGCGCGTTC TCGGGCGCCA GCTCGGACCG CGTGGGCCTG 
TTCGAGGCCG CCACCGGCGG CACCCTGCTG CTCGACGAGA TCGGCGACGT GCCCGCCGCC 
ATGCAGGTGC GCCTGCTGCG GGTGCTGCAG GAACGCGAGG TCCGGCGCGT GGGCGAGAGC 
CGGCCGCGGC CCATCGACGT GCGCGTGCTC GCAGCCACCC ACCGCGATCT GCGCGCCGAA 
GTCGCCGCCG GACGCTTTCG CGAAGATCTC TTGTTCCGCC TGTGTGTACT CGAGATCGAG 
ATTCCGCCGC TGCGCGAGCG CCCCGATGAC ATCCTGCCGC TGGCGCGCAT GAAGCTGCTC 
GACACCGCCA CCCGCTACCG GCGCGAGGTC CGCGACTTCA CCCCCGAGGT CGCCAAATGG 
CTCATCGCTC ATCCCTGGCC CGGCAACGTG CGCGACCTGC ACAACGTCAT CGAGCGCGCG 
GTGGTGTTCG CTGAATCCGC GTGTATCGAG CTCGCCGACC TGCAGCTCGG CGCCGGCGCG 
GCCAGCGCAG ATTCGCCCGC AGACCCCGGC CCGGACTCTC CGATCGCCGC TGGCGGCCCC 
CAGGCGAGCG CGCGCACGGA CGCCGAGGCT GACGCGGCAA TCGCGACGCC CGCGGGCGCG 
ACCCTGGCCG AGGTCGAGCG CGCCCACATC CTGGCCACGC TCGCGGCCTG CGGCGGCAAC 
CGCTCGGAAG CCGCGCGCCG CCTGGGCATC GGCGCCGCGA CCTTGTTTCG CAAGCTCAAG 
CGCTACGGCG TGCCGGGCCC GCGCCAGGAC CACGCCAAAC CCGCCTGA

Protein sequence

MRAIDLRIAD LLELDPGGGV YRFGGQRVLL LDAVALGLLR KQLVEAFGQH AARGLLTRLG 
YSHGWRAAEA LRDTIAWDDE REWRIAGGRI HRLQGLVRFE PVPGDRANTL AQAVWHDSYE 
AEQHLLHVGR SSEPVCWSLC GYASGYLSRV VGQSVYAVEE SCAGCGDAVC RMVARTEAQW 
GADIEPHLAY YERDCLDASL HSLRDAVRKL ERRLRSQRRA LGADAEVLES GGVVARSRAM 
RRVLELCRRV AAVDATALVH GESGVGKERV ARYIHDHSQR AAGPFIAINC GAIPEPLLES 
ELFGHAKGAF SGASSDRVGL FEAATGGTLL LDEIGDVPAA MQVRLLRVLQ EREVRRVGES 
RPRPIDVRVL AATHRDLRAE VAAGRFREDL LFRLCVLEIE IPPLRERPDD ILPLARMKLL 
DTATRYRREV RDFTPEVAKW LIAHPWPGNV RDLHNVIERA VVFAESACIE LADLQLGAGA 
ASADSPADPG PDSPIAAGGP QASARTDAEA DAAIATPAGA TLAEVERAHI LATLAACGGN 
RSEAARRLGI GAATLFRKLK RYGVPGPRQD HAKPA