Gene Hoch_3885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3885
Symbol
ID	8546281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5351743
End bp	5352978
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	70%
IMG OID	646388557
Product	protein of unknown function DUF482
Protein accession	YP_003268277
Protein GI	262197068
COG category	[S] Function unknown
COG ID	[COG3146] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.854025
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACAG ACGAGCGCGC CCCCGGGTCC GGTAGGCGGC CGTCGCTGCG CGTCCGCTGC 
GTCACCAGTA TCGATGACGT CCCGCGGGCG GCCTGGGACG GACTCGAGCA TGGGCCGTCG 
CCCTTCCTCT CGCACGGGTT CTTGCGAGCG CTCGAGGTCT CGGGGTCGGT GGGGCGGGGC 
ACTGGATGGC ATCCGTTTTA TCTGCTCGCC GAAGCCGACG CTGACGCGGC GGCCGAGGGG 
CCCCCTGAGG AGCCGACGAT CCCTCAGGGA ACCTTAATAG GGGCCATGCC TGCGTTCGTC 
AAGTCGCACA GTTACGGCGA ATATATCTTC GACTGGGGCT GGGCGGGCGC GGCCGAACGC 
GGCGGTCTCT CGTACTATCC CAAGCTGGTG GTGGCCGCGC CGGCGACCCC GGCCACGGGT 
CAGCGCCTGC TCATCGACGC CGACGCCGAC GCCGAGTACG TCACCGCCGC GCTGGTGGCT 
GGCGCGCGCG AGATCGCCGA CCAGGCCGAG TGCTCGTCCA TCCACGTGCT GTTCTGCACC 
GCCGAGGAGC AGGCGCGGCT GGCCGAGCTG GGCTTCGCCA GCCGCATGAC CTTCCAGTTT 
CACTGGCACA ACCGCGGCTA CGAGGGCTTC GACGACTTCC TGGCCCAGCT CAGCTCGCGC 
AAGCGCAAGC AGCTCCGCAA GGAGCGCGCG CGCGCGCTGG CCGCGCTCGA CTGCCCCATC 
CACTTCGTCC CCGGCGGCGA GCTGAGCGCG GGCGATCTCG AGGCCCTGGA CGGCTACTAC 
CGCTCGACGG TGTTTGCGCA CGGCGGCATG GACTATCTCC AGCCCGGCTT CTTCGAGGCC 
GTGGCCCGCG AGCTGCCCGA GCAGATGCTG TTCGCCCAGG CGCAGCGCGG CGGCGAGCTG 
ATCGCCGGGG CGCTGTTCTT CGAGACCGCG CGCGGGCTTT TCGGGCGCTA CTGGGGCTGC 
GAGCGCGAGG TCGAATTCCT GCACTTCGAG ACCGCGTATT ACGCTGGTAT CGAGCGCTGC 
ATCGAGCGCG GCACGCCGCT CTTCGAGGCC GGCGCGCAGG GCGAGCACAA GCTCCTGCGC 
GGGTTTCTGC CCTCGCTCAC GTACAGCAGC CACTGGATGC GGCACCGCGG TCTGCACGAG 
GCCATCTGCG AGTTCGTCCA CCGCGAGGCC CGGCAGGTGC GCGCGCGCAT GGCCGAGCTG 
GCGGAGGCGG GGCCGTACCG CCGCGAGGAT GGTTGA

Protein sequence

MSTDERAPGS GRRPSLRVRC VTSIDDVPRA AWDGLEHGPS PFLSHGFLRA LEVSGSVGRG 
TGWHPFYLLA EADADAAAEG PPEEPTIPQG TLIGAMPAFV KSHSYGEYIF DWGWAGAAER 
GGLSYYPKLV VAAPATPATG QRLLIDADAD AEYVTAALVA GAREIADQAE CSSIHVLFCT 
AEEQARLAEL GFASRMTFQF HWHNRGYEGF DDFLAQLSSR KRKQLRKERA RALAALDCPI 
HFVPGGELSA GDLEALDGYY RSTVFAHGGM DYLQPGFFEA VARELPEQML FAQAQRGGEL 
IAGALFFETA RGLFGRYWGC EREVEFLHFE TAYYAGIERC IERGTPLFEA GAQGEHKLLR 
GFLPSLTYSS HWMRHRGLHE AICEFVHREA RQVRARMAEL AEAGPYRRED G