Gene Hoch_3976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3976
Symbol
ID	8546372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5480716
End bp	5482239
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	75%
IMG OID	646388648
Product	hypothetical protein
Protein accession	YP_003268368
Protein GI	262197159
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG3118] Thioredoxin domain-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACCA GCATCCCCCG CATGTTCTCG CCATCGCGGC CGCGCCCGCG GCGGCGCTCA 
TCGACTGGCC GCGAGCGCGG CGCCCTGCTG GCCAGCGCCC TGCTGCTGGC CGCGTGCAGC 
CGCTCGAGCG AGGAGGCCAA GCCGCCCGCC GAGACCCCGC CGGTCGCAGA CCAGGACCAG 
ACCCAGACGG GCGCGGCTGC CGCCGGCGAC GCCGCGGCCT GCGCCAAGGC CAAACGCGAA 
GGTCCGCTGC GCTGGTTCCG CGACGACTAC GCGGCCGCCC TGGCCTGCGC GCGCGCCCAG 
GGCAAGCCGC TGTTCATCGA CGACTGGGCG CCGTGGTGCC ACACCTGCCT GTCCATGAAG 
CACACGGTGT TCATCGATCC CGCGCTGGCG CCGTATGCCG AGCGCTTCGT GTGGCTGGCC 
GTGGACACCG ACAAGCCGGA CAACGCCGAG GTCGTCGGCA AGTTCCCGCC GCAGGTGTGG 
CCGACCTTCT TCGTGATCGC GCCGGCCGAC GAGTCCATCC AGGCGCGCTA TCTCGGCGCC 
GCCTCGCTGG CGCAGTTCCG CGAGTTCCTC GACGAGGGTG AGCGCGCCTA CCGCGAGAGC 
CAGGGCGACG CCCTGCCCGC CGACTCGCCG CTCGGCAAGC TGCGCGACGG CGATCGCGCG 
GTCGTCGCCG GCGACTGGAG CGCGGCGGCC ACCGCGTACG CCGACGCCGT GGCCAGCGCC 
CGGGCCGACT GGCCGCGTCG CCCGGCGGCG CTGGTGTCGC TGATCAGCGC TTACTACAAG 
GCCGGCGACA GCGAGCGCTG CGCGGCCCTG GCCGAGGTCG AGCACGCGGC CACCGGGAAC 
AGCGTGAGCG CCGCCGATTT CGCCTACTAC GCCGCGCGCT GCGCCGAACG GCTCGCCGAA 
CAAGGCGCCG ACGCCGCGCG CGTGCGCGCC CTGCGCGAGC AGCTCCTCGC GCACCTGGGA 
CAGGTGGCCG ACGACGCCGG GGCGCCGCTG GCGACCGACG ACCGCTCCGA GGCGCTGCGC 
GTGATGCGCG AGCTGGCCCT GGCGCTGGGC GACAAGACCC GAGCCGACGC GCTGGCCGAG 
CGCCAGCGCG CGCTCCTCGA CCAGGCCTGG CAGTCGGCGG AGACGCCGCT GGAGGCCATG 
ACCTTCGCGT GGCCGGCGGC CGAGGTCTAC GACTACCTGG GCGCGGGCGC CGAGCTGGTG 
CCCAAGCTCG AGAAGCTCGA GGCCGAGCTG CCCTCGCAAT ACGATCCGCC CTACCGTCTG 
GCCTGGGTGC AGCATCGCCT GGGGCAACAC GAGCAGGCGC TGGCCGCGGC CGAGCGCGCG 
CGCGACAAGC TCTACGGGCC GCGCAAAGCC AACGCCCTGC GCCTCATCGC CGACATCCAC 
GCCGCCCGCG GCGAGCGCGA GGCAGTGGTC GCCGCGCGCC AGGCCGTCGT CGAGCTGTAC 
GAGAGCCTGC CCGAGGGCCA GGCGCGGCCG AGCGCGCTCG AAGACGCGCG CGCCGCGCTG 
GAGCAGGCCC AGGCGGCCGA GTAG

Protein sequence

MDTSIPRMFS PSRPRPRRRS STGRERGALL ASALLLAACS RSSEEAKPPA ETPPVADQDQ 
TQTGAAAAGD AAACAKAKRE GPLRWFRDDY AAALACARAQ GKPLFIDDWA PWCHTCLSMK 
HTVFIDPALA PYAERFVWLA VDTDKPDNAE VVGKFPPQVW PTFFVIAPAD ESIQARYLGA 
ASLAQFREFL DEGERAYRES QGDALPADSP LGKLRDGDRA VVAGDWSAAA TAYADAVASA 
RADWPRRPAA LVSLISAYYK AGDSERCAAL AEVEHAATGN SVSAADFAYY AARCAERLAE 
QGADAARVRA LREQLLAHLG QVADDAGAPL ATDDRSEALR VMRELALALG DKTRADALAE 
RQRALLDQAW QSAETPLEAM TFAWPAAEVY DYLGAGAELV PKLEKLEAEL PSQYDPPYRL 
AWVQHRLGQH EQALAAAERA RDKLYGPRKA NALRLIADIH AARGEREAVV AARQAVVELY 
ESLPEGQARP SALEDARAAL EQAQAAE