Gene Plim_0521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_0521
Symbol
ID	9137198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	649497
End bp	650645
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	54%
IMG OID
Product	von Willebrand factor type A
Protein accession	YP_003628568
Protein GI	296120790
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTTC GATACTCACG CTATGACGAA AACAACGCGT TCTCCCCGCA ATCGGCCGAC 
GAACTCTTCG ACCAACTCTC CGAGTATATG TTGCAATACG GCGACGAAGT CCTCGACAAC 
CTGAGTGACT GGGAAGAGCA ACAGCCCGAT GTCGTCGACA TGCTCATCCG CCAGGGTCTC 
GTCGAGAAAG ACCGCGAAGG ACGGTACTCC GTCACCCCCA AAGGTCTTAA ACGCGTCGAG 
AATCGGGCCC TCGATGAACT CTTCCAGGTC CAACGCAAAG ATTCCTTCGG CAAACATCAG 
GTCGATTTTC GCGGCCCGGG CGAAGTCTTG CAGGATGAAT CCAAGAAATA CGAATTCGGA 
GACGCCATCT CCAATCTCAA CCTGCACGAA ACCATGCGGT CTGCCATGTC TCGTCACGCC 
CGGGAAGGCA AACTTGCTAA CCGGCAGATC CACATCCAGG AAGACGACCT CGTTCTTTAC 
GATCAGCAAT ATCAGACCAA CTGTGCCACA GTCCTCCTGG TCGATATGTC CGGCAGCATG 
ACTCGCATGG GTAAATACGG GTCGGCCAAA CGCGTCGCCA TGGCTTTACA GGCCCTGATC 
AACGGGCGCT ACCAAGGAGA TTTTCTCCAG ATCGTCGGAT TCTATACTTA CGCCAGCCCA 
TTAAGCTCCA AAGAACTCTT TGCCTCGGCC CCCAAACCTG TCAGCATGTA CGACCCACGC 
ATCCGGCTGC GCATTTCTCT GGATAATTCA CCGGCATTCG TGCCACAACA CTTCACGAAT 
ATCCATGCAG GGCTGCAATT CGCCCGCAGA ATTCTCAATA AGCAGCCCAC TCAGAATCGA 
CAGATCCTCA TCGTCACCGA TGGCGAGCCC ACAGCCCATG TCGAGGGCAG AGATCTCATG 
CTGATCTACC CTCCCAGCGA ACAGACCGCG CTGGCTACTT TAGCAGAAGC CAAACGCTGT 
GCGGCAGAAG GGATCAGCAT CTCCAGCTTC GCACTCATTG AAGATTACTT CTACCTCGAA 
CTGGTCAACT TCGTTCAACG CATGGCCGAA GTCACCGGCG GCATTTCAGC CTACTGCAAC 
GCCGGCGACC TGGGAAACCT CGTCATTGAG AGCTTCATTA AAGGCCGCAA AAAACGCATG 
GCGAGGTAA

Protein sequence

MDFRYSRYDE NNAFSPQSAD ELFDQLSEYM LQYGDEVLDN LSDWEEQQPD VVDMLIRQGL 
VEKDREGRYS VTPKGLKRVE NRALDELFQV QRKDSFGKHQ VDFRGPGEVL QDESKKYEFG 
DAISNLNLHE TMRSAMSRHA REGKLANRQI HIQEDDLVLY DQQYQTNCAT VLLVDMSGSM 
TRMGKYGSAK RVAMALQALI NGRYQGDFLQ IVGFYTYASP LSSKELFASA PKPVSMYDPR 
IRLRISLDNS PAFVPQHFTN IHAGLQFARR ILNKQPTQNR QILIVTDGEP TAHVEGRDLM 
LIYPPSEQTA LATLAEAKRC AAEGISISSF ALIEDYFYLE LVNFVQRMAE VTGGISAYCN 
AGDLGNLVIE SFIKGRKKRM AR