Gene Hoch_4557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4557
Symbol
ID	8546962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6222213
End bp	6224033
Gene Length	1821 bp
Protein Length	606 aa
Translation table	11
GC content	68%
IMG OID	646389230
Product	protein serine phosphatase with GAF(s) sensor(s)
Protein accession	YP_003268941
Protein GI	262197732
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCAA GGAAGAACGT CTCGGATCCC CCACCCCCCA CAGCGTTGAT CTTCCTCGCT 
GGACCCAACG CGGGGCGCCG CTACAAGCTC CACCGAGAGG GCGATTACAT CATCGGCCGG 
CGCTCGGACT GCCAGATCTT CATCCCCGAT ATGCGGGTGT CGCGGCAGCA CGCGCGCATT 
CACGAGGAGC AAGGCGCCTG GGTGCTCGAG GACCTGGGCT CGAACAACGG CACCTTCCTC 
AACGGCGAGC GGGTGCAGTC GGCCAAGCTC AAGAACCAGG ACGAGATCAG CATCGCCACC 
AACAGCATCC GCGTGGAGGT GCCGAAGGGG ACGAAGCCGC TGGCGCAGCA GGATTCGCAC 
GTGACCATCG TCGACGTGAA GAATCCGGCC ATCTATGTGA GCACCGAGGA TGCCGAGGCG 
GCGATGACCA ACTCGGCCTC GTTCCCGTGG GATCCGCGCA ACAAAGAGCG CCTGCTCACG 
CGCAAACTGC ACGCGGTGCA GACCATCCTC GAGACCGCGG CCAACATCGC CGATCCCGAC 
CTGCTGCTCG AGTCGGTGGT GGCCCAGCTC CTCGAGGTCT TCCCGCAGGC CGACTCGGTG 
GGCGTGCTGG TCGAGGACGA GGACTCGCAC GAGCTGCTGG TCAAGTGCCA CAAGACCCGC 
AAAAAGCAGG GCTTCAGCGC CGACTTGAAG GTGCCGGGCA CGATCATCGA CCACGTGGTC 
CACGACCGCC GCGGCATCCT GCTCAGCGAG AGCGGCCACG ACGCCCGCGA AGACGGCGAT 
CTCGCCGGCC GCACGAGCGT GCCGCCCAAC GGCTCGCGCA TGGGCGCGCC TCTGCAGGCG 
CGCAACGTGC ATTACGGCGT GATCTACGTC GAGTGCACGA CCGGCACCTT CCAGCAGGAA 
GATCTCGACC TGCTCACCAG CATCGCGGCC CAGACCGGCC TGGCCATCTA CACCGCGCGC 
ATGCACAACC AGATGCAGCA TCGGCAGCGG CTGGAGCGCG ACCTGCGGGT GGCGCGGCAG 
ATTCAGCGCT CGCTGATGCG CAGCCCGCCG CGCGTGCTCG GGCTCGACTT CGCCATCCAC 
TACGAGCCGG CGTATCAGAT CGGCGGCGAC TTCTTCGACT TCATCTGGAA GGACGACAAT 
CACCTCACGC TGATCGTCGG CGACGTGGCC GGCAAAGCCA TCAGCGCGGC GCTGTACATG 
GCGCGGCTCA CCAGCGAGCT GCGCGGGCGC GCCGGCATCG CGCGGTCGCC GCAGCGGCTG 
ATCAAGCGGG TCAACGAGGA GATGGTCAAG CTCGGCGACG ACGGCATGTT CGCGACCCTG 
GTGTGCGCGG TGTTCGAGCT GTCGACGCGC AGCTTGCTGT TCACCAACGC CGGCCACTGC 
GTGCCGCTTT TGCGCCGCGG TGAGCAGGTC TTCCCGCTGG AGTCGGAGCG GGCGCACATT 
CCGCCGATCG GCATCCTGCC CGACCTCGAG GTCGGCGAGG CGCGCGTGCA ACTGCACACC 
GGCGACCTGC TGGTGATCGT CTCGGACGGC ATCGTCGAGG CCCGCGACCC CAACGGCAAC 
GAGTACGGCG AGCGCCGCCT GATCCGCCGC ATCCGCACGG CCCGCGGCGG CGCCGAGGAC 
CTGGTCAAGT CGATCCTGCA GGACGTCGAC AGCCACGTCG GCAGCGCCAC CCAGGCCGAC 
GACATGACCA TCCTGGTGAT GCACGTGGCC GAGCGGCGCA CGCGGCGGCA GACGACCACG 
GTGCCGGGCG GCGTGCCGCA TGTCGGCGGC GAGATCGCCG GCGGCGACAG CGCGGACGAC 
GAAGAGGCCG AGGAGAAGTA G

Protein sequence

MSARKNVSDP PPPTALIFLA GPNAGRRYKL HREGDYIIGR RSDCQIFIPD MRVSRQHARI 
HEEQGAWVLE DLGSNNGTFL NGERVQSAKL KNQDEISIAT NSIRVEVPKG TKPLAQQDSH 
VTIVDVKNPA IYVSTEDAEA AMTNSASFPW DPRNKERLLT RKLHAVQTIL ETAANIADPD 
LLLESVVAQL LEVFPQADSV GVLVEDEDSH ELLVKCHKTR KKQGFSADLK VPGTIIDHVV 
HDRRGILLSE SGHDAREDGD LAGRTSVPPN GSRMGAPLQA RNVHYGVIYV ECTTGTFQQE 
DLDLLTSIAA QTGLAIYTAR MHNQMQHRQR LERDLRVARQ IQRSLMRSPP RVLGLDFAIH 
YEPAYQIGGD FFDFIWKDDN HLTLIVGDVA GKAISAALYM ARLTSELRGR AGIARSPQRL 
IKRVNEEMVK LGDDGMFATL VCAVFELSTR SLLFTNAGHC VPLLRRGEQV FPLESERAHI 
PPIGILPDLE VGEARVQLHT GDLLVIVSDG IVEARDPNGN EYGERRLIRR IRTARGGAED 
LVKSILQDVD SHVGSATQAD DMTILVMHVA ERRTRRQTTT VPGGVPHVGG EIAGGDSADD 
EEAEEK