Gene Strop_2073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2073
Symbol
ID	5058536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2345879
End bp	2347189
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	69%
IMG OID	640474336
Product	von Willebrand factor, type A
Protein accession	YP_001158902
Protein GI	145594605
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.04125
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.439198
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGAGCT GTCCTAGACT GCCGTCGATG ATCAAGACGA GACGATTGGC GGCAGCCCTC 
GTCGGGCTGC TGGCAGCGAG CGTGATGACT GGTCCGGTGC CGGCCCTCGC GGACTGGGAG 
ACCCCGGTCG AGCCGCCGAA GGTCGAGCTG GTCCTCGACG TCAGCGGATC GATGCGGGCC 
ACCGACATCG ACGGGCGGAG CCGAATCTCG GTCGCCCAGC AGGCGTTCAA CGAGGTGGTG 
GACGCGCTGC CGGATGAGAC TGAACTGGGA ATCCGGGTCC TCGGTGCCAC CTATCCGGGT 
GACGACAAGG AGCAGGGCTG CCAGGACACC CAACAGATCG TGCCGGTCGG ACCGGTCGAT 
CGGGTGCAGG CAAAGGCAGC GGTGGCGACG CTTCGTCCGA CGGGTTACAC GCCGGTCGGA 
CTGGCGCTGC GCTCGGCCGC CGAGGATCTC GGTACGGGTA GCACCGCCCG GCGGATCGTG 
CTGATTACCG ACGGCGAGGA CACCTGCGCC CCACCAGACC CCTGTGAGGT GGCCCGAGAG 
CTGGCTGCGC AGGGGACGAA GCTGGTCGTG GACACCCTCG GCCTGGCCCC GGACGAGAAG 
GTGCGTCAGC AACTGCTCTG CATCGCCGGG GCCACTGGTG GCACGTACAC CGCGGCGCAG 
AGCGCGGACG AACTGACCGG GCGGATCAAG CAACTGGTCG ACCGGGCCCG GGACACGCAC 
ACGGCCACGC CGGCCGTGGT CGCCGGTACC TCGGTCTGTG CCGACGCCCC GCTACTCGGC 
GCCGGCGTCT ACAGCGACCG GGAGAAGTTC TCGGAGCACC GCTGGTATCG GGTGCCGGTG 
TATCCCGGGC AGGAGCTGCG CGCCTCTGTC AGTGTGGCGT TGGACCGGCC GGTCAACCCC 
GACCATGCGG TGCTGCTGCG GGCGGTGGCC ACCGACGGTC GGGAACTGGT GCGTGGCGTG 
GACGCCGGTA GCGGCCGGAC CGATGTCGTC TCCGCCGGTC TGCGTTGGTC GGCGGGGGAG 
CAGCCGGAGG ATGGGCCCTC CCCAACCCCG TCGACTACCA CCGACGCCGA AGCCACCATC 
GTCTGTCTCG TGGTGAGTAA CGCCTTCGCA CCCCAGCCGG GGACCCAGAT GTCGCCGGGT 
ATGCCGGTTG AGTTGACCGT GGACATGGTC GTGTCCTCGC CTGCTCCGGC TGCCCCGGAT 
CTCGGTCGTG GCTGGGTGCT GCTCGTCCTG CTGACCGGGG TTGGTCTGCT GGCAGGACTG 
GCGTCCGGGG TGCTCACCCG GTGGTGGGTA ACGACCTGGA GGGAGAAGTG A

Protein sequence

MWSCPRLPSM IKTRRLAAAL VGLLAASVMT GPVPALADWE TPVEPPKVEL VLDVSGSMRA 
TDIDGRSRIS VAQQAFNEVV DALPDETELG IRVLGATYPG DDKEQGCQDT QQIVPVGPVD 
RVQAKAAVAT LRPTGYTPVG LALRSAAEDL GTGSTARRIV LITDGEDTCA PPDPCEVARE 
LAAQGTKLVV DTLGLAPDEK VRQQLLCIAG ATGGTYTAAQ SADELTGRIK QLVDRARDTH 
TATPAVVAGT SVCADAPLLG AGVYSDREKF SEHRWYRVPV YPGQELRASV SVALDRPVNP 
DHAVLLRAVA TDGRELVRGV DAGSGRTDVV SAGLRWSAGE QPEDGPSPTP STTTDAEATI 
VCLVVSNAFA PQPGTQMSPG MPVELTVDMV VSSPAPAAPD LGRGWVLLVL LTGVGLLAGL 
ASGVLTRWWV TTWREK