Gene Sros_3212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3212
Symbol
ID	8666500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3500148
End bp	3501692
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	73%
IMG OID
Product	von Willebrand factor type A
Protein accession	YP_003338898
Protein GI	271964702
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0502803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGCGGG CGGCGGCCGC GCTCGCGCTG GTGACCATGG CCACGCTGGC CGCCTGCTCC 
TCCGGCGACG TGCCCGGGGA CGGCCCGGAC GTGCTGCGGG TGCTGGCCGG CAGCGAGGTC 
AAGGACCTGG AGCCGCTGCT GCGGAGGTCC GGGGTGAAGG TGAGGATCTC CTACACCGGC 
ACGCTGGACG GCGCCGAGCA GGTGGCGGGC GGCGGCGCGG ACGGCTCCTA CGACGCGATC 
TGGTTCTCCT CCAACCGCTA CCTGTCGCTG ATCGACGGCG CGACCGCACG GCTGTCCACC 
GAGACGAAGA TCATGGTCTC CCCGGTGGTG CTCGGGCTCA CGACCGCCAA GGCCAGGGAG 
CTCGGCTGGG AGGGCAGGCC GGTCACCTGG GAGCAGATCG CGACCGCCGC CCGCGAGAAG 
CGGTTCACCT TCGGCATGAC CAACCCCGCC TCCTCCAACT CGGGTTTCTC CGCACTGGTC 
GGGGTGGCCG CCGCGTTGTC GGACGCCGGG GAGGCGCTGA GCGGCGAGCA GATCACCGCG 
GTGACGCCCA GGCTCAAGGA GTTCTTCTCC GCCCAGCGGC TGACCTCGGG GTCCTCCGGC 
TGGCTGGCCG ACGCCTACTC CCGGGAGGGC GGGGTGGACG GCATCGTGAA CTACGAGTCG 
GTGCTGCTCG GCATGGGCGG GCTGAGCCTG GTCCGCCCGA GCGACGGGGT GGTCACCGCC 
GACTACCCGC TGACCCTGCT GGCCTCGGCC CCGCGGGAGA AGAAGGAGCT GTACGGCAGG 
CTGACGGCCT GGCTGCGGAC GCCGGACGTG CAGCGGGAGA TCATGACCGG CACCCACCGG 
CGGCCGATCG TCCCCGGCGT CCGGCCGGGG CCGGAGTTCG GCACGGCGCC CCTGCTGGAG 
CTGCCGTTCC CCAACCGCAG GGCCGCCGCC GACGGGCTGA TCACCGCCTA TCTCGACGAG 
GTGCGCGTCC CTGCGCGGGC GCTGTTCGTG CTGGACACCT CGGGGTCGAT GGAGGGCGAG 
CGGATCGAGG CGCTGCGCCA GGCACTGGTC ACGCTCACCG GCGCCGACAC CTCGGCCTCC 
GGCACGTTCT CCCGCTTCCG CAGCCGGGAG AACGTGATCA TGATCCCGTT CGGCGGCTCG 
GCCGGGCTGC CGCAGCCGTT CATCCTCCCC GAACGTGACC CGCAGCCGGC CCTGGCGCAG 
ATCAGAGCCT ACGCCGAACG GCTCCGGGCG GCCGGCGGGA CCGCGATCTA CGACGGGCTG 
CGCGCCGCCT ACGGGCAGGC CGGCGACGCC GGCCGGGACC ACTACACCTC GATCGTGCTG 
ATGACCGACG GCGAGAACAC CGACGGCTCC TCCTACGAGG ACTTCGAGGC GTACTACCGG 
TCGCTGCCCG AGGCGCGGCG GCAGGTCCGG ACGTTCGTCG TGCTGTTCGG CGAGAGCGAC 
GCGGACGAGA TGGAGAGGAT CGCCACGCTG ACCCGGGGCG CCGTCTTCGA CGCCCGCACC 
GGATCGCTCG CCTCGGCGTT CAAGGAGATC CGTGGCTACC AGTGA

Protein sequence

MRRAAAALAL VTMATLAACS SGDVPGDGPD VLRVLAGSEV KDLEPLLRRS GVKVRISYTG 
TLDGAEQVAG GGADGSYDAI WFSSNRYLSL IDGATARLST ETKIMVSPVV LGLTTAKARE 
LGWEGRPVTW EQIATAAREK RFTFGMTNPA SSNSGFSALV GVAAALSDAG EALSGEQITA 
VTPRLKEFFS AQRLTSGSSG WLADAYSREG GVDGIVNYES VLLGMGGLSL VRPSDGVVTA 
DYPLTLLASA PREKKELYGR LTAWLRTPDV QREIMTGTHR RPIVPGVRPG PEFGTAPLLE 
LPFPNRRAAA DGLITAYLDE VRVPARALFV LDTSGSMEGE RIEALRQALV TLTGADTSAS 
GTFSRFRSRE NVIMIPFGGS AGLPQPFILP ERDPQPALAQ IRAYAERLRA AGGTAIYDGL 
RAAYGQAGDA GRDHYTSIVL MTDGENTDGS SYEDFEAYYR SLPEARRQVR TFVVLFGESD 
ADEMERIATL TRGAVFDART GSLASAFKEI RGYQ