Gene Hoch_5117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5117
Symbol
ID	8547528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	7049948
End bp	7052353
Gene Length	2406 bp
Protein Length	801 aa
Translation table	11
GC content	68%
IMG OID	646389793
Product	TonB-dependent receptor
Protein accession	YP_003269498
Protein GI	262198289
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4771] Outer membrane receptor for ferrienterochelin and colicins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.820743
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACGCA TCGGCAAGGG CGCTTTGCGC GCCCTCTTGA GTGGGCTCAC GGCCTGTTTG 
ACACTCGCCC CCATGGCGGC GCTTGCCCAG GTCGAGGCGC CAGCGCCGAC TGCGGCGGGC 
GCGCAATCGG CCACGCTTCG CGGCGTGGTT CTCGACCCGG AGACCGGCGT ACCCATCGAG 
GGCGCCACCG TGATCGTGCT GGGCACCGAT CTGGCCACCG TGACCGAGGC CGACGGTTCC 
TATGAGATCG TCGGCGTCCC GGCCGGCACC CAGCAGGTGC AGGTGGTGCT CGATGATCAC 
GTCGAGGAGC CGGTGACCGT CGAGCTCAGC GCCGGCCAGA CCCTGGTGAG CGAGCTGGCG 
GCCAAGCCCA GCTCGCTGGC GGGCGAGGTC ATCGTGGTCA CGGGTACGCG CTCGCCGGAG 
AAGATCTTCG ACGCGCCGGT GACCGTCGAG GCCGTGGGCG AAGAGGTCAT CGCGCGCACC 
GCGGGCCCGA CCTATCTGTC GTCGCTGTCC AACGTCAAAG GCATCGACTT CGCCAACGCC 
GGCCTCAACG ACCAGCGCAT CTCGATGCGC GGGTTCACCA CGCAGTTCAA CTCGCGGCTC 
ATCACCATGG TCGACGGCCG CCTGGCGCAG AGCCCGGGCA ACGGTCTGCC GCAGGCCAAC 
CTGCTGCCGG CGACCACGCT CGACATGAAG GCGATGGAGG TGGTCGTGGG CCCGGCCTCG 
GCGCTCTACG GACCCAACGC GCACACCGGC GTCATCAACG TGCTCACCAA GACGCCGTGG 
GACGAGTCGG GCGCGGCGCT GTCGCTGCGC GGCGGCACCC AGGACATGAT CGACGGCGCC 
GTGCGCCTGG CCGGCACGGT CGGCGAGGAT TTCGGCTGGA AGCTCAACGC GCAGTACATG 
CGCGCCGAGG ACTTCGAGAC CGACTGCTCG GCGGGCTCGC CCTTCCGCTA TGGCACCGAC 
CTGTGCGAGG CCGACGTGCT CGAGGACTTC CACGTCGACT CGTTCAAGAC CGACGGCAGC 
CTGTACTATC GCTTCGGCGA CTGGATGGCC AAGGTCGCGG CCGGCATGTC CGAAAACACC 
AGCTTCGGCG CCACCAACGC CGGCCGCAAC CACATCCGCG ACTGGCAGAT CTCGTACCAG 
GCGGCGCAGC TCAGCCATCC CAACTGGTAC GCGCAGGTGA CGCGCACGGC CAGCGACGCC 
GGCAACACCT ATCAGCTCCA CGGCCTGGTG CAGCAGGCAG CCACGCGCCA GGACGAGGGC 
GGCTCGATCG CGCCCGAGGA CCTCGGCGAT CTGCGCTACG CCACGCGCTT CGAAGACGCC 
AGCCAGATGC TCGACGGCGA GCTGCAGTAC CGCGAGGAGT TCGTCGGCAT CGAGACCAGC 
GTCGGTCTGC AGGCGCGCGC GTACATGCCC GACTCGGGTG GCACCTACCT GGCCGACGCC 
GTGGGCACCG ATATCGACGC CCAGGAGGTC GGCGGCTACG TGCAGGCCGA CTACGACCCC 
ATCCCCGACA AGCTGCGCGT GGTCGGCGCG CTGCGCGTGG ACACGCACTC GAACTACGAC 
CCGCAGGTGA GCCCAAAGCT GGCCGCGGTG CTCGACCTGG CGCCCGGCAG CAAGCTGCGC 
GTCGGCTACA ACCGCGCCTT CAAGAGCCCG ACCATCCTCG AGAACTACCT GCTCATCGGC 
GGTAACCTGC GCGGCAACCG CGACGGCTAC GTCATCCGCG ACAGCGCCGA CGGTGGCGGC 
GGCGTGGTGC AGACCATCGA CCCGCTGGAG CCCGAGCTCG TCAACTCCTT CGAGATTGGC 
TACAAGGGCT ACATCGGCCG CACGGTGTTC ATCGACGCCG TGGTCTACGA CTCGTTCTAC 
CGCAACTTCA TCGGACCGCT GTCCCAGGTC GCCGACGGCC AGGACACCTT CGGCTACACC 
AGCGACGGCC AGCTCGTCGA GAACGGCAGG CTGCTCACCT ATCAGAACTT CGGCGCGGCC 
GAAGTCCGCG GCGCCGATAT CGGTGTGTCG GTGCACGCCA ACGAGTATCT GTCGCTGTCG 
GCGAGCACCT CGTTCATCGG CATGGTGTCG AACGGCGAGG AGGCGCCGCC GCTCAACGTG 
TCGCCGGCGA AGTTCAAGTT CTCGGTCACG GGGGAAAATC TGTTTCTCGA CAACACCTTC 
GTCCGCCTGG CCGGCCGCTA CAGCAGCGCC TACGACTTCG CCTCGGGCGT GTGGGTGGCC 
GAGGTGCCGC CGATCTTCGT CGCCGACATC ACCGCCGGCT ACACCTTCAC CGACCTGGGC 
GTGTCGCTCA CCGGCGGCGT GATGAACCTG TTCGACAACG ACATCGCCGA GGTCCCGGGC 
GCGCCCGTGG CCACGCCCAT GGCGTTTTTG CAGATGAGCT ACGCCTACCA GGGCCTGAAC 
TACTGA

Protein sequence

MSRIGKGALR ALLSGLTACL TLAPMAALAQ VEAPAPTAAG AQSATLRGVV LDPETGVPIE 
GATVIVLGTD LATVTEADGS YEIVGVPAGT QQVQVVLDDH VEEPVTVELS AGQTLVSELA 
AKPSSLAGEV IVVTGTRSPE KIFDAPVTVE AVGEEVIART AGPTYLSSLS NVKGIDFANA 
GLNDQRISMR GFTTQFNSRL ITMVDGRLAQ SPGNGLPQAN LLPATTLDMK AMEVVVGPAS 
ALYGPNAHTG VINVLTKTPW DESGAALSLR GGTQDMIDGA VRLAGTVGED FGWKLNAQYM 
RAEDFETDCS AGSPFRYGTD LCEADVLEDF HVDSFKTDGS LYYRFGDWMA KVAAGMSENT 
SFGATNAGRN HIRDWQISYQ AAQLSHPNWY AQVTRTASDA GNTYQLHGLV QQAATRQDEG 
GSIAPEDLGD LRYATRFEDA SQMLDGELQY REEFVGIETS VGLQARAYMP DSGGTYLADA 
VGTDIDAQEV GGYVQADYDP IPDKLRVVGA LRVDTHSNYD PQVSPKLAAV LDLAPGSKLR 
VGYNRAFKSP TILENYLLIG GNLRGNRDGY VIRDSADGGG GVVQTIDPLE PELVNSFEIG 
YKGYIGRTVF IDAVVYDSFY RNFIGPLSQV ADGQDTFGYT SDGQLVENGR LLTYQNFGAA 
EVRGADIGVS VHANEYLSLS ASTSFIGMVS NGEEAPPLNV SPAKFKFSVT GENLFLDNTF 
VRLAGRYSSA YDFASGVWVA EVPPIFVADI TAGYTFTDLG VSLTGGVMNL FDNDIAEVPG 
APVATPMAFL QMSYAYQGLN Y