Gene Hoch_3609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3609
Symbol
ID	8545999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4966400
End bp	4967746
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	70%
IMG OID	646388278
Product	phage tail protein
Protein accession	YP_003268004
Protein GI	262196795
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3064] Membrane protein involved in colicin uptake
TIGRFAM ID	[TIGR02242] phage tail protein domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00405055
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAACGTGG TGGCAGACCT TCATAATCGC CAAGTCGTGC GCGTGCCCGA CGTCGCCGGC 
ATGCCGCTCA AAAAGGCCCG TATCGTGGTC GAAGACGCGG GGCTGGCGCT CGACGCCGTG 
CTGTTTCAAG AGAGCTACGA GGAGCGCGAC GTGGTCCTCG ATCAGCAGCC CGCGCGCGGG 
CAGATGATCT ACGAGGGCAG CCCGGTGACC CTGTGGGTCG CGCGCCGCGG CTACATGGAG 
CACTTGCCCG CGATCTACCG CCGCTCCGAC GCGGTCGGGC GCAACGTGGT GCGCGACATC 
TGCTTCTTGT TCGAGCACAT GTTCGCCTCG GTGGACGAGA TCCTCGACGA GGGGCATCGC 
TACTACGATC CCCACGAGTG CCCGCCCGAG TTCCTCGACT GGCTGGCCTC GTGGACGGCC 
ATGGTCCTCG ACATGGACTG GGCCGAGGAG AAGAAGCGCG CGATCCTCAA GCGCGGCGTC 
GATCTCTACC GGATCCGCGG CACCAAGCGC GGCCTCACCC TGTTCCTGCG CCTGTTCACC 
GGCCACGAGC CCGACATCGG CGAGAACGAG TGGCCGTTCA AGGGCTTCCG CGTGGGCGAA 
GAGGCGCGCG TCGGCCTCGA CACGGTGGTG CTGCCGCCGG TCGATCGCGC GCACTGTTTC 
GTGGTCAACA TGCCCATCCG TTTCACCGAT GTGACGCCCG AGATGGTCAT CCGCATTCAC 
CGCATCATCC AGATGGAGAA GCCGGCGCAC ACGCACTACT ACTTGCGCTT CTCCTCGGAC 
GTCGGCGACG TCGAGCTGCG CGAGTTCTTC TCCATCGGCC TGCGCTCGGG CATCGGCATC 
GGCGCCGAGG TCGTCAAGGA GCTGGCGCCC GAGGAGCTGG CCGCGCTCGA GGCCGAGGCC 
CTGGACGAGG CCGCGCGCCA GGCGGTGGCC GACGCCGACG CCGAGGCCGC GGCCGCAGCC 
TCCGAGGCCG CCATCGAAGC ACAGGCAGAA GCAGAGCAGG GCGGCGGTGC GGCCGCCGAG 
ACAACAGACA CCAGCGCAGA CGGAGACGCG GAGTTCGCCG CCGACGCCGG CTCGGGCGGC 
CCCGCGGCCA GCCCCGAGCG GGCCGACGCG GTCGAGGCCA GCGAGGCCGC CGAACGCGCC 
GTGGCCGCGG AGACGCCGGC GGCGCCCGAT ATCGGGGCCG AGAACGCGTC GGCCGAACTG 
GCCGAGATGG CCGAAGATGC CGGCGGCGAT TCCTCGGGCG CCGCGTCGGC CGCCACATCC 
TCCGAGACCG GGACCGGGAC AGCGTCCGAG CCGGCGGAGG GCTCTGAGTC CTCAGAGTCG 
CCGTCAAATT CGGGAGACGA GAAATGA

Protein sequence

MNVVADLHNR QVVRVPDVAG MPLKKARIVV EDAGLALDAV LFQESYEERD VVLDQQPARG 
QMIYEGSPVT LWVARRGYME HLPAIYRRSD AVGRNVVRDI CFLFEHMFAS VDEILDEGHR 
YYDPHECPPE FLDWLASWTA MVLDMDWAEE KKRAILKRGV DLYRIRGTKR GLTLFLRLFT 
GHEPDIGENE WPFKGFRVGE EARVGLDTVV LPPVDRAHCF VVNMPIRFTD VTPEMVIRIH 
RIIQMEKPAH THYYLRFSSD VGDVELREFF SIGLRSGIGI GAEVVKELAP EELAALEAEA 
LDEAARQAVA DADAEAAAAA SEAAIEAQAE AEQGGGAAAE TTDTSADGDA EFAADAGSGG 
PAASPERADA VEASEAAERA VAAETPAAPD IGAENASAEL AEMAEDAGGD SSGAASAATS 
SETGTGTASE PAEGSESSES PSNSGDEK