Gene Hoch_5541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5541
Symbol
ID	8547955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	7601603
End bp	7602676
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	58%
IMG OID	646390215
Product	Appr-1-p processing domain protein
Protein accession	YP_003269917
Protein GI	262198708
COG category	[R] General function prediction only
COG ID	[COG2110] Predicted phosphatase homologous to the C-terminal domain of histone macroH2A1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0616045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGGTGGG CGTTCACACT CTCCAACGCC GGTGCCTACT ATTTCGCCGA AGATTGTGAA 
GCGATCGTCA ACACGGTCAA CTGTGTCGGC GTCATGGGTC GAGGCATCGC ATTGCAGTTC 
AAGAAGGCCT ACCCTGAAAA TTTCAAGGTC TACGCCGCTG CCTGCAAGCG AAAGGAAGTC 
CAGCCGGGCC AGATGCTGGT GTTCAGGACG GGGCGATTGA TGAACCCACG GTACATCATC 
AACTTTCCAA CCAAGCGACA CTGGCGCGGT AAGAGTAGAA TAGAGGATAT CGAGTCGGGT 
CTTGTAGCAT TGGCCGATGT GCTCGGCGCT TGTAGAATAA GGTCGATCGC TATCCCGCCG 
CTTGGGGCAG GCTTGGGCGG CCTTGACTGG ATGCAGGTTC GTGAGCGGAT CGAAGCAGCT 
TTAGGCGGCT TGGAAGATGT CCAGATCGTG GTCTTCGAGC CGCGAGCGGC AACTGCGAGC 
GAACGACCGA ACCGTTCTCG CGAGGTGCCC GGGATGACGC CAGGACGTGC GGCGCTGCTC 
ATGCTGATAG ATCGGTATCT CGCCGGACTA CTCGATCCCT CCGTGACCCT ATTGGAACTC 
CACAAGTTAA TGTACTTTCT TCAAGAAGCG GGAGAACCGC TCAAGCTTAA GTACCAAAAA 
GCCCACTATG GGCCCTATGC CGAGAACCTT CGGCACGTGC TTCATGCGAT CGAGGGGCAC 
ATGGTGTCGG GCTACGCGGA TGGTGGCGAC GCTCCCGACA AACAACTCGA ACTCGTTCCT 
AAGGCTCTTC GCGATGCTGA GACCTTCTTG AAGAGCAAGG AGACGACGCG ATCGCACATG 
CAGAGGGTCT TCGAACTCGT GGACGGTTTT GAGTCGCCGT TCGGGCTGGA GTTGCTGACG 
ACCGTGCACT GGGTGGCAAC CAGGGAGCGG CCGCAGTCCG CGGACGAGGT CGTCTCGGCG 
ATCCACGGCT GGAACGCTCG CAAGATGCAG TTCTCCAGAC GCCAGATTCT GCTCGCGCTC 
GACGTTCTCT CGCGCAAAGG CTGGTACACA CCGGCGTGGG AGGCGAACGC ATGA

Protein sequence

MRWAFTLSNA GAYYFAEDCE AIVNTVNCVG VMGRGIALQF KKAYPENFKV YAAACKRKEV 
QPGQMLVFRT GRLMNPRYII NFPTKRHWRG KSRIEDIESG LVALADVLGA CRIRSIAIPP 
LGAGLGGLDW MQVRERIEAA LGGLEDVQIV VFEPRAATAS ERPNRSREVP GMTPGRAALL 
MLIDRYLAGL LDPSVTLLEL HKLMYFLQEA GEPLKLKYQK AHYGPYAENL RHVLHAIEGH 
MVSGYADGGD APDKQLELVP KALRDAETFL KSKETTRSHM QRVFELVDGF ESPFGLELLT 
TVHWVATRER PQSADEVVSA IHGWNARKMQ FSRRQILLAL DVLSRKGWYT PAWEANA