Gene Hoch_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1894
Symbol
ID	8544276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2603169
End bp	2604362
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	76%
IMG OID	646386599
Product	molybdenum cofactor synthesis domain protein
Protein accession	YP_003266334
Protein GI	262195125
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCACGG TCGAACAAGC CAGCGCCCGG GTGCGCGCCA GCGCCGCCCC GCTGGGCAGC 
GAGCTGGTGC CGCTCGCCCA TGCCCAGGGG CGCATCCTGG GCGCCGATCT GCGCGCCGGT 
CGCGCGCTGC CGCCGCACGA CAACTCGGCC ATGGACGGCT TTGCCGTGCG CTGCGCCGAT 
CTCCCGGGCA CCCTGCCCGT CGCCGGCACC GTGGCCGCCG GTGACGCAGG CGACGCGGTC 
CTGGCCGCGG GCAGCGCGCT GCGCATCATG ACCGGCGCGC CCATGCCGGC CGGGGCCGAC 
GCCGTGGTCA TCCGCGAAGA GGTCGAGGAC CTCGGCGAGC GCGCGCGCTT CGCGGCCGCC 
GCGCAGCCCG GCGACAACCT GCGCCGCGCC GGCGAGGACA TCGCGCTGGG CGCGGTCGCC 
CTGGCCGCCG GCATGCGCCT GGGCGCCGGC GAGCTCGGCC TGGCCGCCGC GCTCGGTCAC 
AGTGCCCTGG CCGTGGCCCG GCGCCCGCGC GTGGCCATCC TGTCCACGGG CGACGAGCTG 
GTGAGCGCCG AGGTGCCGCC GCGGCCGGGC CAGATCGTCA ACTCCAACGC CTACGCGCTG 
GCCGCCCAGG TCCGCGAGGC CGGCGGCATC CCGGTCGACG CCGGCATCGC GCCCGACGAC 
CCCGATATCC TGGTCGCCCG CGTGCGCAGC GCGCTGGCCG CCGACGTGCT GCTCACCGCG 
GGCGGCGTCT CGGTCGGTGA CTTCGACTTC GTCAAGGACG CCTTCGCCCG CGCCGGCGTG 
ACCATGGACT TCTGGAAGGT CGCGGTCAAG CCCGGCAAAC CGCTCGCATT CGGACACACG 
TCCGACAAGC GCCCGGTGTT CGGCCTGCCC GGCAATCCCG TGTCATCGAT GCTCGGCTTC 
GAGCTGTTCG TGCGCCCGCT GCTCCTGGCC ATGCAGGGCG CGCGCTCGCT CGATCGCCCG 
CGCGCGACGG TCACGCTCGC CAGCGACTAC GGCAAGCGGC CGGGCCGCGA CCACTATCTG 
CGCGCGCGCC TGCGCCGCGA GGGCGATGTC CTGCGCGCCG AGTTGCACCC CCGCCAGGGC 
TCGGCCATGC TCGGCTCCAT GGTCGATATC GACGCCCTGG TCATCGCCCC CGCCGACAGC 
GGCGACCTGC CCGCAGGCAC CCGCCTCGAG GCGCTGCTGC TGCGTGCGGT CTGA

Protein sequence

MLTVEQASAR VRASAAPLGS ELVPLAHAQG RILGADLRAG RALPPHDNSA MDGFAVRCAD 
LPGTLPVAGT VAAGDAGDAV LAAGSALRIM TGAPMPAGAD AVVIREEVED LGERARFAAA 
AQPGDNLRRA GEDIALGAVA LAAGMRLGAG ELGLAAALGH SALAVARRPR VAILSTGDEL 
VSAEVPPRPG QIVNSNAYAL AAQVREAGGI PVDAGIAPDD PDILVARVRS ALAADVLLTA 
GGVSVGDFDF VKDAFARAGV TMDFWKVAVK PGKPLAFGHT SDKRPVFGLP GNPVSSMLGF 
ELFVRPLLLA MQGARSLDRP RATVTLASDY GKRPGRDHYL RARLRREGDV LRAELHPRQG 
SAMLGSMVDI DALVIAPADS GDLPAGTRLE ALLLRAV