Gene Hoch_3359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3359
Symbol
ID	8545747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4649604
End bp	4651361
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	70%
IMG OID	646388026
Product	hypothetical protein
Protein accession	YP_003267754
Protein GI	262196545
COG category	[S] Function unknown
COG ID	[COG4402] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03382] Myxococcales GC_trans_RRR domain

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0360212
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.191754
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCCC GTCTCGGCTC ACTCCTATGC GCCTCGCTGG GCCTCGCCAG CGCGCTCGCC 
CTCGCCGCCA CCAGCGGCCT CACCCCGGTC CAGAGCGCCC ACGCCTGCGG CTGCTTCGCC 
CCGCCCGATC CCTCGGTCCC CGTGGTCCAG GGCGGCGAGC GCATCCTGTT CGCCATGGAA 
GACGGCGTGG TCACCGCCCA CGTGCAGATC CAGTACAGCG GCGCCGCCGA CGAGTTCGCC 
TGGCTGGTGC CGCTGCCGGC CGAGCCCACG CTCGGCATCG GCACCGACGA GCTGTTCACC 
CGCATCCTGT CGAACACCCA GCCGCGCTAC CAGTTCACGG TCCTCAACGC CGAGGAGTGC 
AACCCGCTGC CGACCCCGAC CGCGCCGCCC AACGCCGGCG GCGATGCCGG CGCCGACGAC 
GGCGTGGTCG TGAGCCGCGA GGTGGTCGGC CCCTTCGAGA CCGCGGTGCT GCGCGCCGAT 
GACAAGCAGC CCATGCTCGA CTGGCTGTCC GAGAACCGCT TCTTCGTGCC CGCCGGCACC 
GATGAGGCCG TCGATCCCTA CATCAAGGAG GGCGCCTACT TCCTGGCGCT CAAGCTGGCG 
GCCGGCAACG ACGTCGGCGA TCTCCAGCCC ATCGTCATCT CGTACGCCTC GGAGCTGCCC 
CAGATCCCGA TCGTGCTCAC CAGCGTCGCC GCCGACCCGG ATATGCCGGT GCTGGTCTGG 
GTCCTGGGCG AGCACCGCGC CATCCCGCGC AACTTCTTCC ACACCGAGCT CAACGACGCC 
CGCATCGACT GGATCAATAA CGGCAGCAAC TACATCGAGG TGGTCACCGA GGCCGTGGAC 
GAGGCCGACG GCCACCACTC CTTCGTCACC GAGTACGCGG GCTCGTCGTC GGTCATGCGC 
GACGTGCTCG ACTTCGCGGG GCGCTTCGGC GACCTCGACC TGCTGCGGCA GCTCAGCGAC 
CCGGCCGAAT ACCTCGACTA CCTGTTCCTG TACGGATACG CCCAGACCTC GTTCTTCGGC 
CCGCCCAGCT TCAGCACCCA GATGCTGTCG CAGCTCGACG GCCACCTGCC CCTGCCCCTG 
GAGCTGGTCG ATGCGGTCGC GGCCGACAAC GGCTACGAGC TCACGGCCGA CGAGTTCTAC 
TTCCGCTACC GCGACTATCG CTCGGACTAC CCGGACATCG TCGAGGCGGC GCACGAGGGC 
TTCGACCCGG CCGCGCTCAC CGACCTGCTC GACGAGCGCA TCGTCGTGCC CACCCTGGCC 
GCCGGCCAGC TCTTCCGCGA CTACGAGTAC CTCACCCGCC TGTTCACCAC GCTCTCGCCC 
GAGGAGATGA CCAAGGACCC GGTGTTCAGC TTCAACCCCG ACCTGCCCGA GGTGTCCAAC 
CGGCACACCG CCACGGTCGA GGTGCTCGAG TGCGGCTCGG GCAACTTCCC GGACACCAAC 
GGCCCCGCCA TCCTCACCAC CGAGCAGGGC CGGCGGGTGT ATCTGCCGGG CGGCCTGGGC 
GACAGCGGCT GGCTGAATAC GCCCATGCCG GCCAGCTTGC GCATCGAGAT GCTGCGCGAG 
GAGGGCGCCC CGAGCGTGGT CACCGACAAC GAGGCGACCA TCGCCGACAG CATCGATGAG 
AATCACGCGG TGCCGCCGAA GGCCGACGAC GGCGGCTGCT CGACCCGCAC CGGCACCGCG 
CCCGGCGCCG GCGCGCTGCT GCTCGGCGGC CTGGTGCTGC TGACGCTGCG CCGCCGCCGC 
GTCAGCGTCC GCGCCTGA

Protein sequence

MSSRLGSLLC ASLGLASALA LAATSGLTPV QSAHACGCFA PPDPSVPVVQ GGERILFAME 
DGVVTAHVQI QYSGAADEFA WLVPLPAEPT LGIGTDELFT RILSNTQPRY QFTVLNAEEC 
NPLPTPTAPP NAGGDAGADD GVVVSREVVG PFETAVLRAD DKQPMLDWLS ENRFFVPAGT 
DEAVDPYIKE GAYFLALKLA AGNDVGDLQP IVISYASELP QIPIVLTSVA ADPDMPVLVW 
VLGEHRAIPR NFFHTELNDA RIDWINNGSN YIEVVTEAVD EADGHHSFVT EYAGSSSVMR 
DVLDFAGRFG DLDLLRQLSD PAEYLDYLFL YGYAQTSFFG PPSFSTQMLS QLDGHLPLPL 
ELVDAVAADN GYELTADEFY FRYRDYRSDY PDIVEAAHEG FDPAALTDLL DERIVVPTLA 
AGQLFRDYEY LTRLFTTLSP EEMTKDPVFS FNPDLPEVSN RHTATVEVLE CGSGNFPDTN 
GPAILTTEQG RRVYLPGGLG DSGWLNTPMP ASLRIEMLRE EGAPSVVTDN EATIADSIDE 
NHAVPPKADD GGCSTRTGTA PGAGALLLGG LVLLTLRRRR VSVRA