Gene Hoch_3297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3297
Symbol
ID	8545685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4549647
End bp	4551059
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	75%
IMG OID	646387964
Product	TonB family protein
Protein accession	YP_003267692
Protein GI	262196483
COG category
COG ID
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.158532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.575713
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCGA ATACCCCCAG GAGCCGTCGC AAGAGAGCCG CCAGCCGGCC GCTCGTCGTC 
ATCGAGACGG CGCTGGTGTC GCTGGCCGTG CACGCCGGCG TGCTGGCGAT GGCCGGCGGC 
TTCGACGGGC TGCGCGCGCC AGGTGGGCTC GAGGCGGCGG CCGCGAGCGC CGAGGCCGCG 
GCCGCCGCCC AGCGCGAGCG CGGCCCGCTG CCCTCGTGCG AGGCCGACGA GGCCCTGGCC 
ACGGCCGCCG AATTGCTCGC CTGCTCGCTG CCCGGCGGCC GCGCGCAGGG CTGTCTCGAG 
CGCGCGCTCG GCGATCTGCG CGGCGCCAGT GATCGCTGCA CCGCGCGCAC GCTGCCCTCG 
GCCGTGACCC TGCTCGACCC GGCCGTGGTC GACGAGATCG AGCCCGAGCC GCTGGCCGAG 
CTGATCGAAC CCGAGGTGCT CGAGCAGATC GCCCAGGCGC AGCAGCAGCA GCAGCAGCAG 
CAACAACAGC AACCGCCGCC GCCGCCGCCG CAGCCGGCCC AGCTCGTCGA GATCACGCCG 
AGCAACGACC AGGCGCCGGA CAACGCCCGC TTCCTGGCCG AGTTCGACAG CCGCGTGGAC 
GAGCAGACCG TGGCCCGCGG CACCACCGAG GAGATGGTGG CCAGGCCGCA GCCCTCGCCC 
GAGCAGCCCG ACGAGATCCC GCAGCCCAAG CGCGAGGCGC CGCTCGACGA CAAGGCCGGC 
GCGAACGCGG ACGCGCCCGA GGGCCCCGGA CAGCTCGCGA TGCGCGCGCT GGGCGTGCCG 
ACGCCGTCGC GCGAGGCCCG CGAGGCGGTG GAGGCGGGCG CGCTAGACGG CAGCGACGCG 
CCGGTGAGCG AGCGCGGCCT GGAGACGCGG CGCGGCGCGG GCGAGCGCTA CGAGGCCGCG 
CGCGAGCGTC TGGACCCGCG ACGCGGCGAG GGCGGCGGCG GCGGCGGCGG GCGCAATCTG 
CCCAACCTGC GGCCCTCGGA AGAGCTGCTC GAGCGCGTGG TCGGCGGCGG CTCGGTCGAC 
CACCTCGACA ACGTGGCCGA GGGCGATAGC ACCGCGCTCA ACGCCCGGCA GTGGAAGTTC 
GCCAGCTTCT TCAATCGCAG CAAGCGCCAG GTCGCCCAGA ACTGGAACCC CAACCGCGTG 
ATCGCGGCCA CCGACCCCAA GGGCAACGTG CTCGGGGTCA AGGACCGCGT GACCGTCCTG 
CGCATCACGC TCGACCCCAG CGGCGCGCTC AAGGACGCCA TCGTGCTGCG CAGCTCGGGG 
GCCGAGTTCC TCGACGCCGA GGCCGTGCGC GCGTTCCGCG CGGCGCAGCC GTTCCCCAAT 
CCGCCCCCGG GTCTGGTCGA CGCCTCGGGC GAGATCTCGT TCACCTTCAA TTTCCACCTG 
CAGATGGTCG CGCGCAGCAC CTTCAAGTGG TGA

Protein sequence

MVANTPRSRR KRAASRPLVV IETALVSLAV HAGVLAMAGG FDGLRAPGGL EAAAASAEAA 
AAAQRERGPL PSCEADEALA TAAELLACSL PGGRAQGCLE RALGDLRGAS DRCTARTLPS 
AVTLLDPAVV DEIEPEPLAE LIEPEVLEQI AQAQQQQQQQ QQQQPPPPPP QPAQLVEITP 
SNDQAPDNAR FLAEFDSRVD EQTVARGTTE EMVARPQPSP EQPDEIPQPK REAPLDDKAG 
ANADAPEGPG QLAMRALGVP TPSREAREAV EAGALDGSDA PVSERGLETR RGAGERYEAA 
RERLDPRRGE GGGGGGGRNL PNLRPSEELL ERVVGGGSVD HLDNVAEGDS TALNARQWKF 
ASFFNRSKRQ VAQNWNPNRV IAATDPKGNV LGVKDRVTVL RITLDPSGAL KDAIVLRSSG 
AEFLDAEAVR AFRAAQPFPN PPPGLVDASG EISFTFNFHL QMVARSTFKW