Gene Hoch_5112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5112
Symbol
ID	8547523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7044958
End bp	7046088
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	71%
IMG OID	646389788
Product	hypothetical protein
Protein accession	YP_003269493
Protein GI	262198284
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.690635
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCCCT ACTCGCTCGC ACGTGCGAGC CGACACGCCT CAGCGCTCGC GCTCGCGCTG 
CTGGTGGGAT GCACCTTCGA CCCCGCCCCG CTCGATCCCG TCCGCGGGGT CGATGCCGGT 
CCCGATCTGC CGCAATGCGG ACGGCCTTCC GATCTCTGTG AACACGGCCT GCGCCGCGCG 
CTCGAGCTCG ACCGCAGCGG CGTCACCGAG ACCCTGCTCG AGGTGCCCGT GCTGGTGCGC 
CTCGACCCCG AGCGCATCGA CTACGCCAAG CTGCGCGAGG ACGGCCGCGA CCTGCGCTTT 
CGCTGGGGCG AGGAGCAGCG CGATCTGGCC TATGACATCG AGCGCTGGTC GCCCGGCGGC 
AGCTCGCTGA TCTGGGTGCG TGTGCCCGAG GTGGCGGCGG CCGAGGCCGA GGCCACGCCG 
CTGTGGATGT ACTACGGCAG CCCCGAGGCC GAGGCGGCCG ACGCCCACCC CAGCGCGGTG 
TGGAAGCCGC AGTACCGCAG CGTCCATCAC CTGGGCGCCG ACCTCAAAGA CGCCAGCCTC 
AGCGGCCACA ACGGCCACAG CCCGTCGCCG CCGCTCGAGG TCGAGGGCCA GCTCGGCGGC 
GCCCGCGCCT TCGACGGCGA GAGCACGGTC ATCGTCCTGC CCAACGAGAC CGGCTACGAC 
TTCGCGACCA CCATGAGCCT GTCACTGTGG ATGCGCTCGG CCGCGGCCGC GCATCCCTTC 
GAGACCATCA TCGCCAAGGG CGACAGCGCC TGGCACCTGC GCCGCGACGC CAGCCAGCAG 
CACATCGAAT TCCGCACCAC CTCGCTGGGC CGCGACAGCA CCAAGGTCGG CACGGTGACG 
GTCAATGACG GCGCCTGGCA CCACGTCTTC CTGGTGCTCG ACGGCGAGCG CAAGCTGCTG 
TACATCGACG GCGAGCTCGA CACCGCCGGC GACTACAGCG GCCGGCTCGA CAACACCGCC 
GATCTCGTCC GCGTGGGCGA AAACAGCACC GTGCCGGGGC AATCCTACCG CGGCGAGCTC 
GACGAGCTGC GCCTGTCCGA GGCTCCGCGC TCGGCCTCGT GGGTGCGCTT CCAGTACCGG 
GCCGGCAGCG GCGCGGGCGT GGTCGCCTTC GGCCCCGAAG AGTCACTGTA G

Protein sequence

MLPYSLARAS RHASALALAL LVGCTFDPAP LDPVRGVDAG PDLPQCGRPS DLCEHGLRRA 
LELDRSGVTE TLLEVPVLVR LDPERIDYAK LREDGRDLRF RWGEEQRDLA YDIERWSPGG 
SSLIWVRVPE VAAAEAEATP LWMYYGSPEA EAADAHPSAV WKPQYRSVHH LGADLKDASL 
SGHNGHSPSP PLEVEGQLGG ARAFDGESTV IVLPNETGYD FATTMSLSLW MRSAAAAHPF 
ETIIAKGDSA WHLRRDASQQ HIEFRTTSLG RDSTKVGTVT VNDGAWHHVF LVLDGERKLL 
YIDGELDTAG DYSGRLDNTA DLVRVGENST VPGQSYRGEL DELRLSEAPR SASWVRFQYR 
AGSGAGVVAF GPEESL