Gene Hoch_3017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3017
Symbol
ID	8545405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4174317
End bp	4175564
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	68%
IMG OID	646387689
Product	cobalamin synthesis protein P47K
Protein accession	YP_003267417
Protein GI	262196208
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.168872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.358971
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCCA CTCTCGATTC CCGTTCCGCG CCGCGCCTGC CGGTCACCGT GCTCTCGGGC 
TTTCTCGGCG CCGGCAAGAC CACGCTGCTG CGACACATCT TGCACAACCA GGCAGGCCGA 
CGCGTGGCCG TGATCGTCAA CGACATGAGC GAGCTGAACA TCGACGCCGC GCTGGTGCGC 
GGGGGCCCGG TGCGGGTCGA GCGCGTCGAG GAGAAGCTCA TCGAGATGAG CAACGGCTGC 
ATCTGCTGCA CCCTGCGCGA GGATCTGCTG AGCGAGGTGT CGGCGCTCGC GCGCGCCGGC 
CGCTTCGACT ACCTGCTCAT CGAATCCACC GGCATCTCCG AGCCGATTCC CGTGGCCCAG 
ACCTTTACCT TTGCCGATGA AGACGGCGCC AGTCTCGCCG AGGTATCGCG CCTCGATACC 
ATGGTGACGG TCGTGGACGC GGTGCATTTC CTCCGCGATT ACACCGACGC CGATGCGCTC 
GTCGAGCGCG GCCAGGCGGC GGGCGAGCAG GATGAGCGCA CGGTCTCGGA TCTGCTCGTG 
GAGCAGGTGG AGTTCGCCGA CCTCATCGTC ATCAGCAAGA TCGATCTGGT CGCCGCCGAT 
GTGCTCGCCG AGCTCGAGGC GGTGCTGCAT CATCTCAACC CGGGCGCGCG TATCGTGCGC 
GCCGAGCGCG GTCAGGTGCC GCTCGACGAG CTGCTCGACA CCGGCCGCTT CGACTACGAG 
CGCGCCGCGG CCTCGGCCGG CTGGATCCGC GAGCTGGCCG GTGAGCACGT GCCCGAGACC 
GAAGAGTACG GCATCTCGAG CTTTGTCTAT CGCGCCCGAC GTCCGTTCCA TCCGCAGCGG 
CTGTGGCAGC TCATGAACGG TGATTGGACA GGTGTCCTGC GCTCCAAGGG CTTCTTCTGG 
CTGGCTACGC GTCCGGCGCA CGCGTATGAG TGGTCGCAGG CTGGCGGCGT TAGCAACTGT 
CACGCGGCCG GGCACTGGTG GGCCGCGATG CCGCGCGAGT ACTGGGGCCA TCCCGAGGAC 
GAGCGGCCCG ATCGCCAGCC GAGCTGGCAT CCGCGTTACG GTGACCGCTG CCAGGAGCTG 
GTGTTCATCG GCATCGGCAT CGAGCGCGAG CGCTGGAGCG CGGCTCTCGA TGCCTGCCTG 
CTCGACGACG AGCAGGCGGC GCGCGCCATG GCCGGGACGC TGAGCCTGCC CGATCCCTTC 
CCGGTCGTCG AGCTTGTCGC CGATAGCGAG CCCGCCGAGC TAGCCTGA

Protein sequence

MEPTLDSRSA PRLPVTVLSG FLGAGKTTLL RHILHNQAGR RVAVIVNDMS ELNIDAALVR 
GGPVRVERVE EKLIEMSNGC ICCTLREDLL SEVSALARAG RFDYLLIEST GISEPIPVAQ 
TFTFADEDGA SLAEVSRLDT MVTVVDAVHF LRDYTDADAL VERGQAAGEQ DERTVSDLLV 
EQVEFADLIV ISKIDLVAAD VLAELEAVLH HLNPGARIVR AERGQVPLDE LLDTGRFDYE 
RAAASAGWIR ELAGEHVPET EEYGISSFVY RARRPFHPQR LWQLMNGDWT GVLRSKGFFW 
LATRPAHAYE WSQAGGVSNC HAAGHWWAAM PREYWGHPED ERPDRQPSWH PRYGDRCQEL 
VFIGIGIERE RWSAALDACL LDDEQAARAM AGTLSLPDPF PVVELVADSE PAELA