Gene Hoch_1825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_1825
Symbol
ID	8544207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	2516798
End bp	2518045
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	66%
IMG OID	646386531
Product	HipA N-terminal domain protein
Protein accession	YP_003266266
Protein GI	262195057
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.401045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.66095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACGTG CCAGCGAAGC ATCTCGGCGG GGCCTGGACG TCCGGGTCTC AAACGTCCGG 
GTGGGCTCCC TGGCTCGAGA CGCAGGCGGC GACCTGCGCT TTACCGCCGA CCGCGCATGG 
CTCGAAGACG GGCAGCACCC GCCTCTGGGT CTGACGTTCT TGCAAGACCC TGCGCCGCGC 
GTGCAACGCG GCCTCGTGCC CGTATGGTTT GAAAACCTCC TGCCCGAGCG CGGGACTCCG 
ATGCATCGCT GGATCTGCCA ACAACACGGA CTCCGCGAGC GCGACGAAGC AGCCCTGCTG 
CAGGTACTCG GTCATGATCT GCCAGGCGCC GTAGAAGTCA GCGGCGACAT CGACGAGCGC 
GAAGACGAAG CCACCGAAGC GCCAGAAGAT GGCCGATTTC GTTTCTCGCT GGCGGGCATG 
CAGCTCAAGT TCTCCATGCT ACTCGAAGGG GATCGCCTGT CGCTGCCGCT CCGCGGAGAG 
ACCGGACACT GGATCGTAAA GGTTCCCGGA AACGAGCTTC CTCAGGTCCC CGAAGTCGAG 
GCAGCAACCC TCACCTGGGC GGAGGCAGCA GGCTTCGCCA CGCCTCGCCA TCGAGTGATG 
CCCCTCAAAG CGCTCGCCGG TATCGACGCC GCGCGCCTGG GTCAAGCGCA CTGCGTACTC 
GCCGTCGAGC GCTTCGACCG TCGCGCCGAC ACGCGAGTTC ACCAGGAGGA TTTCGCCCAG 
GCGCTCGAGA TCCGTCCCTC CGACAAGTAC GGGGCCCGCA ATCGCGCCCC GACCTATGAC 
AGCCTCGCCC GCCTGGTACG GGACGCATGT GGCATCGAGG GGCAGAAAGA GTTCATCCGA 
CGCGTGGCCT TCGTTGTCGC GTCGGGCAAC AGCGACGCTC ATCTCAAGAA CTGGTCGTTT 
CAATGGGGCG CGTCCCACCG CCCCCGGCTC AGCCCTTGTT ACGACCAGGT GGCCACCATC 
TCGTGGCCAG AATTTGGCTG GAACGCGGCC GGGGGCGCGG AGTTAGCGCT CACCCTGGGA 
CGCTCCAAAC GCTTCGGCGA ACTCGACCGC AGCCGACTGC GCCTGTTCGC AGAGCGCGCC 
GGTGCTCCCG ATGGAGAGGC GTGGTTCCTC GATGCGCTCG ATCAAATTCG CAGCGCGTGG 
TCGGGACTCG AAGCGCAGGC GCCCGCGCGC ATGCGTGACG CGCTGCTCGA ACACTGGCAA 
AAAGTGCCCG TCCTTTGGGA CATGGGCGGT CTCCCCGGTG CGAGATGA

Protein sequence

MKRASEASRR GLDVRVSNVR VGSLARDAGG DLRFTADRAW LEDGQHPPLG LTFLQDPAPR 
VQRGLVPVWF ENLLPERGTP MHRWICQQHG LRERDEAALL QVLGHDLPGA VEVSGDIDER 
EDEATEAPED GRFRFSLAGM QLKFSMLLEG DRLSLPLRGE TGHWIVKVPG NELPQVPEVE 
AATLTWAEAA GFATPRHRVM PLKALAGIDA ARLGQAHCVL AVERFDRRAD TRVHQEDFAQ 
ALEIRPSDKY GARNRAPTYD SLARLVRDAC GIEGQKEFIR RVAFVVASGN SDAHLKNWSF 
QWGASHRPRL SPCYDQVATI SWPEFGWNAA GGAELALTLG RSKRFGELDR SRLRLFAERA 
GAPDGEAWFL DALDQIRSAW SGLEAQAPAR MRDALLEHWQ KVPVLWDMGG LPGAR