Gene Hoch_4948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4948
Symbol
ID	8547356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	6823331
End bp	6824380
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	73%
IMG OID	646389622
Product	protein of unknown function DUF323
Protein accession	YP_003269330
Protein GI	262198121
COG category	[S] Function unknown
COG ID	[COG1262] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.864459
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCAC CGTCTCGCCT TTCTCCGGCC CTGCTGGGCG CCGCCTTGCT CGCGCTCGCC 
GCCGCGCCCT GGCTCAGCTC TGCGGCCCGC GCCGGCGCCC CCGATGGCGC CCCCGATGAC 
GCCCACGACA GCGCCGATAC CCAAGCGCGC GCGCGCGTCC CGGACGCCGC CGCTCGCGCC 
CAGATCGCGC GCATCGAACA CCGCGACCCG AGCATGGTGC CGGTGCCGGC CGGGCCCTTC 
CGCATGGGCC CCGACCTGGC CGAGCTCGAG TCGCTGCTGC GCGTGTGCCA CGTGCAGTTC 
GGGGCCGCCC AGGAGAACTG CGACAACGAC ATCAATCGCG CCCTGCGCGA GCGCGAGGTG 
TTTCTCGACG CCTTCGCCAT CGACCGCCAC GAGGTCGCCG CCGCCGCCTA CCGCGCCTGC 
GTGGACGCGG GCGCGTGTTC GGTGTCGGCG CTGGTGGCGG GCGACGAGCG CTTCATCCGC 
CCCGAGTGGC CCATGGTCAA CGTCACCTGG CAGGACGCGG CCGACTACTG CGCCTGGGCC 
GGCAAGCGCC TGCCCTCGGA GGCGGAGTGG GAAAAGGCCG CGCGCGGCAG CGACGGCAAG 
CGCTGGCCGT GGGGCGATCA CGAGCGCCGC GACGGCGCCA ATCACGGCCG CAGCGAGAGC 
GACATGATGA TGCTCTCGCG CAGCGACCTG TCGGGCCCGA TGAGCGGACC CGCGGTGCTG 
CTGTTTGCAC CCGACGACAG CGACGGCTAC CCGGCCCTGG CGCCGCCGGG GGCCCTGCGC 
TGGGGCGAGA GCCCCTACGG CGCGTTTGAT ATGGCCGGCA ACGCGGCCGA GTGGGTGCAG 
GACTTCTACG CCGATGAGGG CTACGAGGAC CTGCCGCGCT TCAACCCCCT GCGCTCGATG 
CCGAGCGAGA AAAACCACGG CGTGCGCGTG GTCCGCGGCG GCTCGTGGAT GGATCCGGGC 
TTTTTCGGAC GCACCTACTA CCGCCGCTGG GCCAACGAGC GCGCGCGCTC CGAGCGCATC 
GGTTTCCGCT GCGCCCGCGA TCTCGATTAA

Protein sequence

MSSPSRLSPA LLGAALLALA AAPWLSSAAR AGAPDGAPDD AHDSADTQAR ARVPDAAARA 
QIARIEHRDP SMVPVPAGPF RMGPDLAELE SLLRVCHVQF GAAQENCDND INRALREREV 
FLDAFAIDRH EVAAAAYRAC VDAGACSVSA LVAGDERFIR PEWPMVNVTW QDAADYCAWA 
GKRLPSEAEW EKAARGSDGK RWPWGDHERR DGANHGRSES DMMMLSRSDL SGPMSGPAVL 
LFAPDDSDGY PALAPPGALR WGESPYGAFD MAGNAAEWVQ DFYADEGYED LPRFNPLRSM 
PSEKNHGVRV VRGGSWMDPG FFGRTYYRRW ANERARSERI GFRCARDLD