Gene Hoch_3146 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3146
Symbol
ID	8545534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	4324878
End bp	4326197
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	66%
IMG OID	646387813
Product	extracellular solute-binding protein family 1
Protein accession	YP_003267541
Protein GI	262196332
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.654082
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.268339
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAC TCTTTTCTGT GTTGCTCGCC TGCGCCACGA TCGGCGCCTG GGGCTGCGAT 
AAAAAAGACG AGGCCGCGGG AACGGAAACC GCAGCGACCA CCGAAGAGGC CAAGGAAGTC 
ACGATCTCGC TGTCATGCGG CGCGGTCGGC CAGGAGCTCG AGCTGTGCAA GAAGAGCGCA 
GAGGAGTGGT CGAAGAAGAC CGGTAACAAG GTCAACATCA TCTCGACGCC CAACGGCTCC 
ACCGATCGCC TGGCTCTCTA CCAGCAGATC CTGGGCGCGG CCTCCAATGA CATCGATGTG 
TTCCAGATCG ACGTGGTCTG GCCGGGCGTG CTCGCCAGCC ACTTCCTCGA CCTCAAGCCG 
CACCTGGGCG GCGCCGAGAG CGAGTTCTTC CCCGCGCTGA TCGAGAACAA CACGGTCGGC 
GACAAGCTGG TCGCCCTGCC CTGGTTCACC GACGCGGGCG TGCTCTACTA CCGCAAGGAC 
CTGCTCGAGA AGTACGGCGC CGAGCCGCCC ACGACCTGGG CCGAGATGGC CGAGACCGCC 
AAGAAGATCC AGGACGGCGA GCGCGAGGCC GGCAACGACG GCATGTGGGG CTACGTGTTC 
CAGGGCAAGG CCTACGAGGG CCTCACCTGC AACGGCCTCG AGTGGGTGCA CAGCTTCGGC 
GGCGGCACCA TCGTCGACGA GTCGGGCAAG GTCACCATCA ACAACCCGCA GGCCGCGCAG 
GCGCTCGACA CCGCCGCCGG CTGGATCGGC ACCATCGCGC CCGAGGGCGT GCTCAACTAC 
GCCGAGGAAG AGGCCCGCAG CCTGTTCCAG TCGGGCAACG CGGTGTTCAT GCGCAACTGG 
CCCTACGCCT GGGGCATGGC GCAGGCCGAC GACAACATGA AGGACAAGGT CGGCGTGATC 
GCGCTGCCCA AGGGCGGCGA CGGCGGCACG CACGCGGCCA CGCTCGGCGG CTGGGGCCTC 
GCGGTGTCCA AGTACACCAA GAACGAGGCC GCGGCGGCCG ACCTGGTCAA GCACCTCACC 
AGCGCCGAGG TGCAGAAGAT GCGCGCCATC GAGGGTTCCT TCAACCCGAC CATCGACTCG 
CTGTACAAAG ACCAGCAGGT TCTCGAGGCC ACGCCGTTTT TCGGCACGCT GTACGAAACC 
TTCGCCAACG CTGCGGTGCC GCGCCCGGCG GCGCAGACCG GCTCGAAGTA CAACCAGGTG 
TCGAACGCGT TCTGGAACGC GAGCTACGAC GTGCTCTCGG GCAAGACCAA GGCCGCCGAC 
AGCCTGGCCG AGCTCGAGAC CAAGCTCAAC GACCTGAGCC GCGGCGGCAG CGCCTGGTAA

Protein sequence

MKKLFSVLLA CATIGAWGCD KKDEAAGTET AATTEEAKEV TISLSCGAVG QELELCKKSA 
EEWSKKTGNK VNIISTPNGS TDRLALYQQI LGAASNDIDV FQIDVVWPGV LASHFLDLKP 
HLGGAESEFF PALIENNTVG DKLVALPWFT DAGVLYYRKD LLEKYGAEPP TTWAEMAETA 
KKIQDGEREA GNDGMWGYVF QGKAYEGLTC NGLEWVHSFG GGTIVDESGK VTINNPQAAQ 
ALDTAAGWIG TIAPEGVLNY AEEEARSLFQ SGNAVFMRNW PYAWGMAQAD DNMKDKVGVI 
ALPKGGDGGT HAATLGGWGL AVSKYTKNEA AAADLVKHLT SAEVQKMRAI EGSFNPTIDS 
LYKDQQVLEA TPFFGTLYET FANAAVPRPA AQTGSKYNQV SNAFWNASYD VLSGKTKAAD 
SLAELETKLN DLSRGGSAW