Gene Ndas_1621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1621
Symbol
ID	9245471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1985092
End bp	1987191
Gene Length	2100 bp
Protein Length	699 aa
Translation table	11
GC content	77%
IMG OID
Product	von Willebrand factor type A
Protein accession	YP_003679556
Protein GI	297560582
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.921819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.480885
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTGC GGTCACCGCA CTACCCCTTT TCCGCGATCG TCGGCTGCGA CGCCGAGGAA 
CTCGACGACC TGGGCCTGTC CCTCGTCCTC ACCAGCGTCT CGCCGGAGAT CGGCGGCGTC 
CTGGTGCGCG GCGAGAAGGG CACCGCCAAG TCCACCGCGG TCCGGGCCCT GGCCTCCCTC 
CTGCCGCCCG TCGACGTCTA CCAGGGCGAC CGGTTCTCCG TGGACCCCGC CGACCCGGCG 
CAGCACTCCC CCGACGGGCC CTTCGGGTCC GGCACGGCCG TGGAGAGCCG CCCGGTGCGC 
CTGGTCGAAC TGCCCGTCGG CGCCACCGAG GACCGCGTCC TGGGCTCCCT GCACCTGGAA 
CAGGCCCTCA CCCACGGCAG GGTCGCCTAC GAACCCGGCC TGCTGGCCCG GGCCCACCGC 
GGCATCCTCT ACGTCGACGA GGTCAACCTC CTGCACGACC ACCTGGTCGA CCTGCTGCTG 
GACGCCGCCG CGACCGGCCG GGTCACCGTG GAGCGCGACG GGTTCTCCGT GGAGCACGCG 
GCCCGGTTCC TGCTCATCGG CACCATGAAC CCCGAGGAGG GCGAGCTGCG CCCGCAGCTC 
CTGGACCGGT TCGGACTCAC CGTCGAGGTC GCCGCGCCGT CCGAGCCCGC GATCCGCGCC 
GAGGTGGTGC GCAGGCGCAT GTCCCACGAC GCCGACCCCG CCGCCTTCGC CGGGCGCTAC 
CACGGGGCCG AGAAGGCGCT GGCCGAACGC ATCGCGGCGG CCCGGGAGGC ACTGGGCCGG 
GTGCGCCTGT CCGAGGCCGC GCTGCTGAAG ATCGCCGAGG TGTGCGCCGC CTACGACGTG 
GACGGCCTGC GCGCCGACAT CGTGACCGCG CGCACGGCGA TGGCGCACGC GGCCTGGTCG 
GGCCGGACCT CGGTCACCCG GGCCGACATC CGCCGCGCAG CCACGCTCGC CCTGCCGCAC 
CGGCGCCGAC GCAACCCCTT CGACGCGCCG GGACTCGACG AGGAGCTCCT GGACCGGATC 
CTGGGCGACG AGGAACCGCC GCCCGACCCC CCGGAGCCGC CGGGCCCGCA GGGGACCGAC 
GACGGCGACG ATTCCGAAAC CCCGTCAGAC ACACAGGACC CACAGGATCC CTCCGACAAC 
GCCAGTCCCC CGGACAACGC CGGGGACACC GGGGAAGCCG AGACCTCCGG CGGCGAACAG 
CCCGACCCGG AGCGCTCCCC CGCCTCAGCC GAGCACGCGC CCGAGGACGC CGAGGGCGAC 
TCCCCCGAAC CCCGCCCCTC CGGCGCCTCC CCGACCACCG CCAGGGCCGC CGCCCCCTAC 
CGGACCCGGC TGCTCACCGT GCGGGGCTCC GGCGAGGGCG CCGACGGCAG GCGCAGCCGG 
GCCGTCGGCA CGCGGGGCCG GCGGATCGGC GCCGCCGAGC CCGGCCGGGG TGCGGGCAGC 
GCGGTCCACC TGGTGGAGAC CGTGCGGGCC GCCGCGCTGC GGCCCCAGGG CGGCGGCCGA 
CTGCGGCTGC GCCCCCGCGA CCTGCGCGTC GCGGTCCGCG AGGGTCAGGA GACCAACCTG 
GTGCTGTTCT GCGTGGACGC CTCCGGCTCC ATGGCGGCGC GCAGGCGTAT GACCGAGGTC 
AAGACCGCGA TCCTGTCCCT GCTCCTGGAC GCCTACCGGC GCCGCGACAA GGTCGGCCTG 
GTCACCTTCC GGGGGCGCGA GGCCGAACTC ACGCTGCCGC CGACCCGTTC GGTGGACGTG 
GCCGCGGCCC GCCTCGACGA CCTGCCCGCC GGGGGGCGCA CCCCGCTGGC CGAGGGCCTG 
GAGGAGGCGG CCCGCGTCCT GCGCCGCGAG CGGCTGCGGG ACCCGAGGCT GCGTCCGCTC 
CTGGTCGTGG TCACCGACGG CCGGGCCACC GGCGGCAAGG GGGCGGTGGG CCGCGCGATG 
GCCGCCGCCG ACCACGTCGC CGGACTGGGC GTGACCACCG TCGTGGTGGA CGGGGAGTCC 
GGGCCGCTGC GCCTGGGCCT GGCCGCCTCC CTGGCCGCCC GCCTGGGCGC CGACCACATG 
CCCGTCAGCG AGGTCAGCGC CGACGCGCTG GGCACCGCCG TACGAGAGAG GGCCGCCTGA

Protein sequence

MPLRSPHYPF SAIVGCDAEE LDDLGLSLVL TSVSPEIGGV LVRGEKGTAK STAVRALASL 
LPPVDVYQGD RFSVDPADPA QHSPDGPFGS GTAVESRPVR LVELPVGATE DRVLGSLHLE 
QALTHGRVAY EPGLLARAHR GILYVDEVNL LHDHLVDLLL DAAATGRVTV ERDGFSVEHA 
ARFLLIGTMN PEEGELRPQL LDRFGLTVEV AAPSEPAIRA EVVRRRMSHD ADPAAFAGRY 
HGAEKALAER IAAAREALGR VRLSEAALLK IAEVCAAYDV DGLRADIVTA RTAMAHAAWS 
GRTSVTRADI RRAATLALPH RRRRNPFDAP GLDEELLDRI LGDEEPPPDP PEPPGPQGTD 
DGDDSETPSD TQDPQDPSDN ASPPDNAGDT GEAETSGGEQ PDPERSPASA EHAPEDAEGD 
SPEPRPSGAS PTTARAAAPY RTRLLTVRGS GEGADGRRSR AVGTRGRRIG AAEPGRGAGS 
AVHLVETVRA AALRPQGGGR LRLRPRDLRV AVREGQETNL VLFCVDASGS MAARRRMTEV 
KTAILSLLLD AYRRRDKVGL VTFRGREAEL TLPPTRSVDV AAARLDDLPA GGRTPLAEGL 
EEAARVLRRE RLRDPRLRPL LVVVTDGRAT GGKGAVGRAM AAADHVAGLG VTTVVVDGES 
GPLRLGLAAS LAARLGADHM PVSEVSADAL GTAVRERAA