Gene Strop_3594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3594
Symbol
ID	5060069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4110526
End bp	4112256
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	69%
IMG OID	640475849
Product	von Willebrand factor, type A
Protein accession	YP_001160403
Protein GI	145596106
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTCCAG GCCGCCATCG CACCCGAACG AACATCCGCA CCGCCGGTGT CGCCGCAGCT 
GTCGGGGTAC TGGTCATTGC TGCTGGTGGA TACTTCGGCT ACCGGCAGCT AGCCTCGCCG 
GGGTGCTCCG GCCAGGTTGA GCTCGCGGTC GCGGTCGCGA CTGAGCTGGC ACCGGCAGTC 
GACGCCGCGG CGACCGAGTG GGCGAACGAG GGCGCGGTGG TGGATGGCAG CTGCGTTGAG 
GTAAGCGTGA CGGCTGCCGA GCCGGTCGAG ATAGCCGCCA CCGTCGCGGC CAAACACGGT 
GCCATCCTGG CCGGGGTGGG GCAGGTCAAC GGCGCCGCGG TCAGCCCGGA TGTCTGGGTG 
CCCGACTCGT CGGCGTGGCT GCTACGGCTT CGGAGCGGCG GTGCGACCGC ATTCGATCCG 
GGTAACGGAG CGTCAATCGC CCGCAGCCCG GTGGTCCTGG GGGTGCCCGA GCCGATCGCC 
TCCCAGCTCG GCTGGCCGGC GCAGGAACTC ACCTGGTCCG CGCTGGTCGG CCAGGTTAAC 
AGCGCTAAGC CGCTCAAGGC CGGCACCGTG AACCCGACCC GAGATGCCGC CGGTCTCTCC 
GGGCTACTCG CGCTGAGCGC CGCCGCGGCG GCCGGGCAGG ACGGCCAGGC GGCAACCGTC 
GGCGCGTTGC GGGCCTTGTC CACCAGCAGC GCGAATCTGC GCCAGGAACT GCTCTCGAAG 
TTCCCCACCG CCGCAGACTC CACCACGCTG GCCCGGAGTC TCGGCGCGGC GGCGTTGTCT 
GAGGAGGATC TGCTCTCGTA CAACGCCCGG AAGCCGGCGG TGCCGCTGGC CGCGCTCTAC 
CCGGAGCCAG CGGCGAACCC GTTGGACTAC CCGTACGCGG TGCTGCCGGG GATCGGGCCG 
GCCAAGGCGT CGGCTGCCCA GATGCTTTTC GACGTGCTCA CCACGGCCAG CTTCAAGGAT 
CGGTTGGCGT TGTCGTCACT ACGAGCGCCG GACGGTACCT GGGGTGCTGG TTTCAGCGCG 
CCCGCAGGGG CGCCGAGCCC GGCGGCCGAT GGTGGCAACG CCGCTGGTGA CCTGGACCCA 
CTGGCGGTCG AGCGAGCGGT CTCCAGCTGG TCGATCGCCA CCCAGTCCGG CCGGATGCTC 
TGTGTCATCG ATGTCTCTGG CTCGATGCGG GAACCCGTGG CGAGCGCCAA CGGTGTGAGC 
CGCCAGCAGG TCACCCTGGA TGCCGCGGGG CGGGGGCTCC ACCTCTTCGA TGACAGCTGG 
CAGATCGGGC TCTGGGAGTT CTCGACCAAC CTGGGCAGCG GGCGGGACTA CCGGCGGCTG 
GTCGAGATCG GCCCGCTGAG TAGTCAGCGG AGCGAGCTTG AGCAGGCGTT GGCCCAGATT 
CAGCCGACCC GGGGTGACAC TGGTCTGTTC GACACGGTGC TCGCCGCGTA CGAGGCAGTC 
CAGGAGGACT GGGACGAGGG CCAGGTCAAT TCGATCGTGC TCTTCACCGA CGGCAAGAAT 
GACGATGACA ACGGCATCAG CCAGCAGCAG CTGATCGCCG AACTGGAACG GATCAAGGAC 
CCGGAGCGGC CGGTGCAGGT CGTTCTGATC GGGATCGGCG CGGACGTCAG CAAGGCAGAG 
CTGGAGTCGA TCACGGAGGT TACCGGTGGT GGCTCCTTCA TCACCGAGGA CCCGACCAAG 
ATTGGTGACA TCTTCCTGAA GGCCATCGCA CTGCGCGAGC CGGATGCCTG A

Protein sequence

MSPGRHRTRT NIRTAGVAAA VGVLVIAAGG YFGYRQLASP GCSGQVELAV AVATELAPAV 
DAAATEWANE GAVVDGSCVE VSVTAAEPVE IAATVAAKHG AILAGVGQVN GAAVSPDVWV 
PDSSAWLLRL RSGGATAFDP GNGASIARSP VVLGVPEPIA SQLGWPAQEL TWSALVGQVN 
SAKPLKAGTV NPTRDAAGLS GLLALSAAAA AGQDGQAATV GALRALSTSS ANLRQELLSK 
FPTAADSTTL ARSLGAAALS EEDLLSYNAR KPAVPLAALY PEPAANPLDY PYAVLPGIGP 
AKASAAQMLF DVLTTASFKD RLALSSLRAP DGTWGAGFSA PAGAPSPAAD GGNAAGDLDP 
LAVERAVSSW SIATQSGRML CVIDVSGSMR EPVASANGVS RQQVTLDAAG RGLHLFDDSW 
QIGLWEFSTN LGSGRDYRRL VEIGPLSSQR SELEQALAQI QPTRGDTGLF DTVLAAYEAV 
QEDWDEGQVN SIVLFTDGKN DDDNGISQQQ LIAELERIKD PERPVQVVLI GIGADVSKAE 
LESITEVTGG GSFITEDPTK IGDIFLKAIA LREPDA