Gene Hoch_3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3520
Symbol
ID	8545909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4853946
End bp	4855196
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	68%
IMG OID	646388188
Product	protein of unknown function DUF214
Protein accession	YP_003267915
Protein GI	262196706
COG category	[V] Defense mechanisms
COG ID	[COG0577] ABC-type antimicrobial peptide transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0642417
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.207368
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACAGCC TCGGCATCTT CAGTCTCGAC CGCTGGCACG AGATCTTCGA CACCATCCGG 
CGCAACAAGC TGCGCACCCT GCTCACGGCG CTGAGCGTGG CCTGGGGCAT CTTCATGCTG 
GTGATCCTGC TGGCCGCCGG CACCGGCGTG CGCAAGAGCA CCGAGTACGA CTTCCGCGAC 
GACGCCATCA ACAGCCTGTG GCTGTGGGCC GGGCAGACAT CGATTCCGTA CGAGGGCCAC 
GCCGTCAATC GCAGCATCGA GTTCACCAAC GCCGACCTCG AGCGCCTGCG CGCGACCATC 
CCCGAGGTCG AGTACCTCAC CGGCCGCTTC TACCTGCGCG GCGACCGGCT GGTGAGCCGC 
GGCAGCAAGA GCTCGGCCTT CGACGTGCGG GCCTGCCACC CCGACCACCA GCACATCGAG 
AAGACCATCA TCATCGCCGG CCGCTTTCTC GACGATCTCG ACATCGACGA GCGCCGCAAG 
GTGGCCGTCA TCGGCATCGA GGTCGCCGAG TTCCTGTTCG CCGAGGGCGA GCAGCCGCTG 
GGCCAGTGGA TCGCCATCAA CGGCATCCAG TACCGCGTGG TCGGCGTGTT CGAGGACGAG 
GGTGGCGAGG GCGAGCTGCG CAAGATCTAC ATCCCCATCT CGACCGCGCA GATGGCCTAC 
GGCGGCGCCG AGACCATTCA TCAGCTCATG TTCACGGTCG GCGACGCCAC GGCCGAGGAG 
AGCCGGGCCA TCGAGGAGGC CGTGCGCGCC AGCCTGGCCG AGCGCCACCA CTTCGACCCC 
GAGGACCAGC GCGCGCTGCG CATCCGCAAC AGCGTCGAGA ACTTCGAGCA GATCAGCGGC 
ATCTTCCGCG CCATCGAGCT GTTCGTGTGG TTCATCGGCG CCGGCACCAT CGGCGCCGGC 
ATCGTCGGCG TGAGCAATAT CATGCTCATC TCGGTCAAGG AGCGCACCAA GGAGATCGGC 
GTGCGCAAGG CCCTGGGCGC CAGCTCGGGC GACATCATCG GCCAGATCCT GCAGGAGTCG 
ATCTTCCTCA CCGCGGTCGC CGGCTACCTG GGTCTGCTCG CCGGCATCGG CCTGGTCGAG 
CTGTTCCGCC GCTACGCGCC CGCGCTCGAC TCGCTGCGCG ACCCCGAGGT CGATCTCGGC 
GTCGCGCTCG CGGCCACGCT CATCCTCATC GTCGCCGGCG GCATCGCCGG CTACTTCCCC 
GCTCGCCGCG CCGCCCGGGT CGATCCGGTG GTGGCGCTGA GGGACGCCTG A

Protein sequence

MYSLGIFSLD RWHEIFDTIR RNKLRTLLTA LSVAWGIFML VILLAAGTGV RKSTEYDFRD 
DAINSLWLWA GQTSIPYEGH AVNRSIEFTN ADLERLRATI PEVEYLTGRF YLRGDRLVSR 
GSKSSAFDVR ACHPDHQHIE KTIIIAGRFL DDLDIDERRK VAVIGIEVAE FLFAEGEQPL 
GQWIAINGIQ YRVVGVFEDE GGEGELRKIY IPISTAQMAY GGAETIHQLM FTVGDATAEE 
SRAIEEAVRA SLAERHHFDP EDQRALRIRN SVENFEQISG IFRAIELFVW FIGAGTIGAG 
IVGVSNIMLI SVKERTKEIG VRKALGASSG DIIGQILQES IFLTAVAGYL GLLAGIGLVE 
LFRRYAPALD SLRDPEVDLG VALAATLILI VAGGIAGYFP ARRAARVDPV VALRDA