Gene Hoch_5121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5121
Symbol
ID	8547532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7058512
End bp	7059771
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	73%
IMG OID	646389797
Product	von Willebrand factor type A
Protein accession	YP_003269502
Protein GI	262198293
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.104188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTGG AGCTGCTCAC AGACGTCGAA GACGCCGGCG CCTCGGTCTT TCTGCTGGTC 
CGTATCGAGG CGCAGGCGAC CGAGAGTTCA GCGCGTATGC CGGTCAATCT GGCCCTGGTC 
ATCGACCGCT CGTCGTCGAT GCGCGGGCCG CGGCTGGCCA GCGCCATCGT GGCCGCGCGC 
CAGGTCGTCG AGCAGCTCGA CGAGCGCGAC CGGCTCTCGG TCATCGCCTT CGACGCCACG 
GCGCGAACCA TCTTCGGTCC CATGAGCGTG ACCGACGAGG CCCGCCAAAC CCTCGAACAG 
GCCCTGGCCG GCCTGCGCAC CGGCGTCGGC ACCAACCTCG CCGCGGGCAT GAAAAAAGGC 
GCCGAGGCGG TGCGCTCGGG CTTTGTGCGC GGCGCCCTCT CCCGCCTGGT GCTGCTCACC 
GACGGCCAGC CCTCGCTGGG CATCACCGAC AACGACCGGC TGTGCGCGCT GGCGCAGAAA 
GAGGCCGATC GCGGGGTCAC CATCACGACC ATGGGCCTGG GCCAGGGCTT CGACGACGAG 
CTGCTCGCCG ACCTCGCCCA CAGCGGCCGC GGCGGCTTTC ACTATCTGGC CAGCGCGGCC 
GACATCCCGG GCGCCTTCGG CCGCGAGCTG AGCGGCGTGT TCGCCATCGC CGCCACCCAG 
ACCGAGATCG GCCTGCGCCC GGCGCAGCAG ATCGACGCCG CCGAGGTGCT GCACCGCCTG 
CCCTCGCGGC CGCTCGACGA CGGACTGGCG GTCGAACTCG GCGAGCTGGC CGCGGGCACG 
CCGCGCCAGG TGCTGTTCCG CCTCAGCCGT CGCAGCGGCG ACATCGAAGC CCGCTGCGGC 
ACCCTCACCG TCACCTACCG CAGCTCCGAG GGCACCCCGG GCGATGCCCA CCTGCTCGGC 
ATCGAGGTCC CGGCCCAGCC CGACCCGGCC CACCGGCGCA TCATCGCGCT CGAGCGCATG 
CGCCTGGCCG TGGCCAGCGC CGTGGACGTG GCCTGGGCGC GCCGGGCCAG CGGCGACAGC 
CTGCGCGCGC TGGGCGCCCT GAGCGAGATC AAGCTCGAGG TGTCGCAGCT CAAAGAGTCC 
GAGGGGGCCG ATCCCGACGC CCTCGACGTG CTCTTGCGCG ACATCGGCGA AGCCGAGTCA 
GCCGTGGTCA AGAGTTCGGC CGAACGCGAG CGCGCCCGCC GCAGCATGCG CGAGCGCAGC 
CATATCACCC TGCTCGGCCA ATCCCAGACC CAGGCGGCGC CGCCCCGCGA TGACGACTGA

Protein sequence

MRVELLTDVE DAGASVFLLV RIEAQATESS ARMPVNLALV IDRSSSMRGP RLASAIVAAR 
QVVEQLDERD RLSVIAFDAT ARTIFGPMSV TDEARQTLEQ ALAGLRTGVG TNLAAGMKKG 
AEAVRSGFVR GALSRLVLLT DGQPSLGITD NDRLCALAQK EADRGVTITT MGLGQGFDDE 
LLADLAHSGR GGFHYLASAA DIPGAFGREL SGVFAIAATQ TEIGLRPAQQ IDAAEVLHRL 
PSRPLDDGLA VELGELAAGT PRQVLFRLSR RSGDIEARCG TLTVTYRSSE GTPGDAHLLG 
IEVPAQPDPA HRRIIALERM RLAVASAVDV AWARRASGDS LRALGALSEI KLEVSQLKES 
EGADPDALDV LLRDIGEAES AVVKSSAERE RARRSMRERS HITLLGQSQT QAAPPRDDD