Gene Hoch_5042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5042
Symbol
ID	8547453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	6957393
End bp	6958901
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	71%
IMG OID	646389718
Product	protein serine/threonine phosphatase
Protein accession	YP_003269423
Protein GI	262198214
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.384072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCCGC TCCCCAAGCT CATCGTCACC GTCGCGCTCT CGGTCGCCCT TGGCGTCGGA 
TTGATCATCT GGCAGGCCCA CTACCAGGCC AACCAGATCG CCGAGCAGGG CACCAAGGTG 
CTGCTCGACG TGCTCACGCG CGAGCAGCAC GCGCGCTGGC AACGGGAGAC CGTGCAGCTG 
GCCACCGCGC TCGGCGACGG CCGCGCCGAG CTCGCGCCCG GGCCCCGGCT GCGGCGTATC 
CTCGACCTGC CGTCCGAATT CAAGCACGCG CGCATCCTCG ACGCCGAGGG CGACGACCTC 
GCGGTCGCCC ACGCGTCCAT GGAGAGCTCG TTCACCGACA ACGAGCTCGA CAAGGACGCG 
CTGCTGGCCG CCTGGCGCGA GCGCGCCGAC CCCGAGCTGC CGCTGGCCGA GATCGAAGAC 
CCCGAAGATC AGCGCGTGTA CATGATCACC TCGCTGAGCG ACGCTGGCGA GGGCGCCTAT 
TTCGTCACCG GGTATTCGGG CGCACCGCTC GCCGCGATCG CCGCCGACCT CGAGCGCCAT 
CACCACACCG AGGCGCGCAC ATCGCTCGAG CTGCTGGTGT TGATCGGCAT CGGCGCCGAG 
TTGCTCGCCG TCATCGGTCT GTTCCTCATC CTGCGCCGCC GCGCCGAGCC CGACGACGCG 
ATTCCCCAGT TCGCGCCCGC GGCCACCGCG CGCTCGGGCC CGGCCCTGCA CGACATGGCC 
GGCGAGCTGG CCGTGCTGCT GCAGGAGACC GCGGCCAAGT CGCGTATGGA TAAGGATCTG 
GAGATCGTCC AGACCGTCCA GAATACGCTG CTGCCGGCCG ACGAGTTCGT CGAGCGCGGG 
CGCCTGTCCT TCGCCGGCAA GCTGCACTCG GCCGGCACCT GCGGCGGCGA CTGGTGGACC 
TACCACGACC TCGCCGACGG CACCGTGCTG CTGGTGCTCG GCGACGTCAC CGGCCACGGC 
CCCAGCGCCG CCATGCTGAC CGCGGCGGCC AAGGCGGCCT GCGACCTCGC CTGCGACATG 
CACGACCACC TCCCGAGCCC GGCCGCGGTG CTCAACCTGA TGAACCAGGC GGTGTTCCAC 
GCTGGCGGCC GGCGCCTGCT CATGACCTGC TTTGCCATCA TCATCGACCC GCGCACGGGC 
GCGGCGCAGT TCGCCAACGC CGGCCACAAC TTCCCCCTGC TGGCGCACCA GGAGCCCGGC 
CAGGACGAGG TGCAACTGAC CTCGCTGATC GCGCGCGGCA ACCGCCTCGG CGACTCGCGC 
GAGTCGCACT TCGAAATGGT CAGCGCCACC CTGGAGCCTG GTGATCGCCT GCTGCTGTAC 
ACCGACGGCA TCATCGAGTG CGAGAACTCG CAGGGCTCGG CCTACGGCGC GCGCCGCATG 
CGCGAGCTGA TCGCCGGCGC CGCGTCCGAG CCCGTCGCTC TGCGCGACGA GCTCATCCGC 
AGCGCGCTCG AGTTCGCCGA AGGCAAACTC GACGACGACC TCACCCTGGT CGCCGTGCGC 
TTCGCCTAG

Protein sequence

MLPLPKLIVT VALSVALGVG LIIWQAHYQA NQIAEQGTKV LLDVLTREQH ARWQRETVQL 
ATALGDGRAE LAPGPRLRRI LDLPSEFKHA RILDAEGDDL AVAHASMESS FTDNELDKDA 
LLAAWRERAD PELPLAEIED PEDQRVYMIT SLSDAGEGAY FVTGYSGAPL AAIAADLERH 
HHTEARTSLE LLVLIGIGAE LLAVIGLFLI LRRRAEPDDA IPQFAPAATA RSGPALHDMA 
GELAVLLQET AAKSRMDKDL EIVQTVQNTL LPADEFVERG RLSFAGKLHS AGTCGGDWWT 
YHDLADGTVL LVLGDVTGHG PSAAMLTAAA KAACDLACDM HDHLPSPAAV LNLMNQAVFH 
AGGRRLLMTC FAIIIDPRTG AAQFANAGHN FPLLAHQEPG QDEVQLTSLI ARGNRLGDSR 
ESHFEMVSAT LEPGDRLLLY TDGIIECENS QGSAYGARRM RELIAGAASE PVALRDELIR 
SALEFAEGKL DDDLTLVAVR FA