Gene Plim_4121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_4121
Symbol
ID	9140841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	-
Start bp	5286676
End bp	5287848
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	54%
IMG OID
Product	von Willebrand factor type A
Protein accession	YP_003632131
Protein GI	296124353
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCTGCCT TGCAGCTCGG TCATCAACCA CATCGCCAGG GGGCCATGCT GGTCCTGGTC 
GCCGTTGTGA TTGTGGCACT TCTGGCCATG ACGATGTTCA CCGTCGATGT GGCCTACATG 
CAATTGGTGC GTACTGAACT CCGTGCTGCG ACCGATGCCT CTGCCAAAGC CGGGATGGAA 
GCGCTGCGTC GTACTCAGGA TACCGAAGCA GCCATTGACG CTGCCATTGC CACTGCTGCT 
GCTAACAAAG TCGGTGGACG ATCTTTGACC CTCACTGCCG ATCAGATCGA GTTTGGACTG 
GCTTTTCGAA ATGTGGATAA CTCCGTTTCA TTCAATGCGG GGCAGTTGCC ATATACTGCT 
GTCCGCGTGA ACTCAGCGAT GACTGAATCC TCTGCCGCCG GGGCTGTCCC CCTGTTTTTT 
GGCAGTATTT TCGGGACGGG CCAGTTCGAG CCGACTCGAT CCGCCGTCTC AGCGAGTACT 
GAAGTTGAAA TCTGCTTTGC GATCGACCGG TCACACTCAA TGTGTTTCGA CCTGACGGGT 
GTCGATTGGT CTTATCCTCC CGGGACTCCA CGCAATCCAG ATCCCGTCGC ATTTCCTCCG 
CATCCCACAC TCAGTCGCTG GGCCTCACTC TCTCGAGCCA TGCAGACATT TGTGAGCATT 
ACCGCTTCTC AGGAACCAAA ACCGCGTGTG GCAATGGTGA CCTGGGCCTC CAAAATCACT 
CAGTCGAACT ACGAAGGCAA ACTCACCAAA ACCAACAGTC CGGAAGTTTT TGTTGATGTT 
CCTCTTACAA CCAATCTGGC CGACCTCAAT CAGGCCATCA AAGGGCGCTC GGAAAAGGTC 
ATGCTCGGTG CCACCAATAT GGCTGCCGGA ATCGACGAAG CTCGCAAAAT CCTCAATGCG 
ACAAAAAGTA CGCGCCCTTA TGCTCATCGG ATCATCATTC TCATGACCGA TGGTCTCTGG 
AATCAGGGGC GTAATCCGCT ACTGGCCGCA CAGGATGCCG CTAACGAAGG AATTGTGATT 
CATTCCGTCA GTCTGTTGCC GCGAAGTGGA GATATCACAC CACAGGTCTC CAGCACCACC 
GGTGGTGTCA ATTACCCTGC TACCAACAGT GCCGCTCTCG AAGCCGCCTT CGCTGATATT 
GCTCGAACTT TGCCCATTGT TCTCACGGAA TAA

Protein sequence

MPALQLGHQP HRQGAMLVLV AVVIVALLAM TMFTVDVAYM QLVRTELRAA TDASAKAGME 
ALRRTQDTEA AIDAAIATAA ANKVGGRSLT LTADQIEFGL AFRNVDNSVS FNAGQLPYTA 
VRVNSAMTES SAAGAVPLFF GSIFGTGQFE PTRSAVSAST EVEICFAIDR SHSMCFDLTG 
VDWSYPPGTP RNPDPVAFPP HPTLSRWASL SRAMQTFVSI TASQEPKPRV AMVTWASKIT 
QSNYEGKLTK TNSPEVFVDV PLTTNLADLN QAIKGRSEKV MLGATNMAAG IDEARKILNA 
TKSTRPYAHR IIILMTDGLW NQGRNPLLAA QDAANEGIVI HSVSLLPRSG DITPQVSSTT 
GGVNYPATNS AALEAAFADI ARTLPIVLTE