Gene Plim_3001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3001
Symbol
ID	9139713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	3884609
End bp	3885706
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	55%
IMG OID
Product	von Willebrand factor type A
Protein accession	YP_003631022
Protein GI	296123244
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCC CTCAAAGAGC TGTGACCGAA CCAGTAATTC AGGTCTCACA GGGAGCAGCC 
AGACAAAGTG CGCTGGTAGG CTGGCTCCTT TCCGGCTGTC TCCATCTGAT CGCTATCGTC 
CTGCTCCTCT TTGTCATTCA AGGACAAAGT GTTGAACGCG TTGGTTTCGG CAATGGTGCT 
GAAGGTCCAC CCGGTCTCGT AATGGTGGAT GCCAGTGATG GTGGGTTGAC GCAAGAAGCC 
GCACCATCAG AAATTGGAAA TGGGAATCGG CCATTACGAA CGGCAGCAGG GAGCAGCGGG 
ACTGGTCGCG AAGTTCAATC GACAGAACTC CCGGCTGATG TACCACCAGT TCCACTCTCC 
TTGCCGAAAG CTGGTGCAGC AGGACTGGGT TCTGCCCGCG GCAACCTCGC CTCAGAGTTC 
TCTCCCACGG CGGGAACTGG CAATAGTGGA ACCGGCCTGA CAGGGACAGG AACCAGTGGT 
GATCTGCGGG ATCTGATCGA AGGGACAGGA ACACGAAAAC CGGGAACTGG CCTCGGTGCT 
GCCACACCTG GCACCAGCTT CATGGGGATC AAAGATCAGG GAAGCCGGGT CGTGTTTGTG 
ATCGATTGCT CGGGAAGCAT GACCAACTAC AACGCGATGC GAGTCGCGAA GACGGCACTG 
GTCAGCAGCT TGCAGGCACT TGATACCGGG CAGCAGTTCC AGATCATTTT TTACAACGAC 
AGCCCGACGT TTTTGAAAGG GACCAGCCGC GACGGAAAGG CCAGCTTGTG GTTTGCAACC 
GAGATCAACA AAACTCTGGC AACACAGCAA ATCAGTGCGG TTCAGCCCGA CCGGGGAACA 
CAACATCTGC CGGCACTGAA GCTCGCTCTC AAGTTTTCTC CTGAGGTGAT CTATTTCCTC 
ACAGATGCGG ATGAACCCGA GTTAACATCG ATTGAGCGGA AAGAACTGAT TCGGTTGAAT 
CAAGGTCGCA GCCGCATTCA TACGATTGAG TTCGGTCAAG GGCCGGAGTT GAAGACGGAG 
AACTTCCTCA AGAAAGTCGC TCGCGAGAAC GGAGGAAGCT ATCGATATGA AGATGTCACC 
CGCTTCACTT CCCGATAA

Protein sequence

MTTPQRAVTE PVIQVSQGAA RQSALVGWLL SGCLHLIAIV LLLFVIQGQS VERVGFGNGA 
EGPPGLVMVD ASDGGLTQEA APSEIGNGNR PLRTAAGSSG TGREVQSTEL PADVPPVPLS 
LPKAGAAGLG SARGNLASEF SPTAGTGNSG TGLTGTGTSG DLRDLIEGTG TRKPGTGLGA 
ATPGTSFMGI KDQGSRVVFV IDCSGSMTNY NAMRVAKTAL VSSLQALDTG QQFQIIFYND 
SPTFLKGTSR DGKASLWFAT EINKTLATQQ ISAVQPDRGT QHLPALKLAL KFSPEVIYFL 
TDADEPELTS IERKELIRLN QGRSRIHTIE FGQGPELKTE NFLKKVAREN GGSYRYEDVT 
RFTSR