Gene Hoch_0231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0231
Symbol
ID	8542610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	344278
End bp	345807
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	72%
IMG OID	646385027
Product	von Willebrand factor type A
Protein accession	YP_003264765
Protein GI	262193556
COG category	[R] General function prediction only
COG ID	[COG2425] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCGA GCGAGCTGCA CGTCATCGTC TGCGACGGCT ACGACCGCGA GGTCTTCGCC 
CGTCTGCTGC GCGAGAAGCG CTCCATGGGC GAGTGCCGCG AGCGCCTGGG CCGACTGCTG 
CCGCACCCCG AGCCGCTGCT GTGCGACCTG TTCAGCGTGC TGTTCAAGCT CAACGTTGTC 
GTACGAGCGG CCGAAGAACT CGCCGCCGCG GTGCAGATCC ATCACCGCCT GGTCACGGCC 
GTGAGCCAGG CCCGCGACCT GGCCGCCCTG CGCGCGCGTA CCGAGCTGCG CGAGAACGAG 
TGCGCGGCGC TGCTGCCCGG TCTGGTCGAG CGTATCCTCA CGGCCATGAA GCGCGACTTC 
TACATCGGCC CGCAGGAGCT TCTCGAGGCC GCCGAGGTGG CCCACGACGA GGACACCCTG 
GCGCAGCGCG AGGCCGAGCG CGAGCATCTA CGCGAGCTGC CCGAGGACGC CTTTGACGAC 
GACGAGCGCG AGCGCCTCGA GGGCGATCTC GACGGCGAGA TCGACGCCCT GCGCGAGCGC 
ATCGACGAGG CCCGCGCCCG CCAGGCGCGC GTCGCCGACA AGATCACGAG CGACCTCGAC 
GACACCATCG GCCGCAAGGT CTCGGTGCTG CCCGATCAGC TCGAGCAGGG CGAGGATCTG 
CGCCGCAGCA TGGGCCTGGG CAGCGGCCGC GAGGGCCAGG TGGGCGCGGC CGAGCGGCTC 
GAGCTGGGCG AGCGCCTGAT GCGCAGCCGC AAGCTCAAGC TGCTGGCCAA GCTGGTGGGC 
GCGTTCCGCG AGGTCGCGTT CGAGGCCCGG CGCCGGCGCG TCGTCCGAAC TCCCCAGGTG 
ATGCACGAGG TCGGCCGCGG CGCGCATCTC GACCGCCTGC TGCCCTCGGA GCTGCTCGGC 
CTGCCGCGCC ACCGCGGCGC CCTGCACCGC GAGTTCGTGC GCCGCCTGGT CGAGGGCGAG 
CTGCTCGAGT ACGAGCTGCG CGGGGCCTCG TCGCGCGGGC CGATGGTGGT GTGCGTCGAC 
GGCAGCGGCT CGATGCAGGG CACCAAGGAG ATCTGGGCCA AGGCCGTGGC GCTCACGCTC 
ACCGAGATCG CCCGGCGCGA GCGCCGCCGC TGCCTGGCCA TCGTGTTCTC GTCGGGGCAC 
GCGCTGTTCG AGGTCGAGCT GCTCGGCGCC AAGGGCCGCT CGAACGTGCG CGCGCCCATG 
CTCGACGACA ACGTGCTGGC CTTTGCCGAG CACTTCCCCG GCGGCGGTAC CGACTTCGAG 
CCGCCCATGC GGCGCGCGCT CGCGGCCGTG AGCGAGGGCA ACTACCGGCG CGGCGATATC 
GTGTTCATCA CCGACGGCCA GGCCCAGGTG TCCGAGAACC TGATCGCCGA CATCACCAAG 
GCGCGCAAGA AGCACCGCTT TCGCGTGCGC GGCATCTTGG TGGACGTCGC CGACAGCGAC 
CGCGGCAGCC TGCTGCGCTT CTGCGACGAG GTCCGCGAGG TCACCGACCT GGTCGCCGAT 
TCGCTCGGCG ATCTCTTCGC CAGCGTGTGA

Protein sequence

MPPSELHVIV CDGYDREVFA RLLREKRSMG ECRERLGRLL PHPEPLLCDL FSVLFKLNVV 
VRAAEELAAA VQIHHRLVTA VSQARDLAAL RARTELRENE CAALLPGLVE RILTAMKRDF 
YIGPQELLEA AEVAHDEDTL AQREAEREHL RELPEDAFDD DERERLEGDL DGEIDALRER 
IDEARARQAR VADKITSDLD DTIGRKVSVL PDQLEQGEDL RRSMGLGSGR EGQVGAAERL 
ELGERLMRSR KLKLLAKLVG AFREVAFEAR RRRVVRTPQV MHEVGRGAHL DRLLPSELLG 
LPRHRGALHR EFVRRLVEGE LLEYELRGAS SRGPMVVCVD GSGSMQGTKE IWAKAVALTL 
TEIARRERRR CLAIVFSSGH ALFEVELLGA KGRSNVRAPM LDDNVLAFAE HFPGGGTDFE 
PPMRRALAAV SEGNYRRGDI VFITDGQAQV SENLIADITK ARKKHRFRVR GILVDVADSD 
RGSLLRFCDE VREVTDLVAD SLGDLFASV