Gene Pnap_4666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_4666
Symbol
ID	4685862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008760
Strand	-
Start bp	53531
End bp	54583
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	53%
IMG OID	639826661
Product	von Willebrand factor, type A
Protein accession	YP_973824
Protein GI	121583393
COG category	[R] General function prediction only
COG ID	[COG4245] Uncharacterized protein encoded in toxicity protection region of plasmid R478, contains von Willebrand factor (vWF) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.404551
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	0.0464435
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGTT TGCCTGTGTT TTTCGTCCTC GACTGTTCCG AGTCCATGGT GGGTGCAAAC 
CTAAAAAAAA TGGAAGGTGC CGTCGCTGCG ATTGTCAAAT CGCTGCGCAC CGATCCGCAG 
GCGCTGGAAA CTGTCTTTTT CTCAGTGATC GCATTTGCGG GTGTGGCCAG AACCATTGCG 
CCGCTGGTTG AAATCGTGTC TTTCTACCCT CCGAAACTTC CTCTCGGCGG TGGCACGAAT 
CTGGGATCGG CCTTGGACGC TTTGATGGGT GAAATCGACA GATCAGTGAT CAAAACGACG 
GCCGAGCGCA AGGGCGACTG GCGACCCATC ATCTACTTGG TCACCGATGG CCGTCCTACC 
GATAACCCGA GTCGAGCAAT TGAACGGTGG AATTCTCACT ATGCCAAAAA GGCAACGCTC 
ATCGCCATAG GTCTGGGGCG TTCAGTCGAC TTTACGGCGC TGCGGCGCCT CACCGAGAAT 
GTCATTTCCT TTGAAGATAT AAAGGAGAGC GACTTTAAGA AGTTCATTAA CTGGGTGACA 
GCTTCCGTAG TAGTGCAAAG CAAAAGCGTC GGAGATGGAA CAGATTTTCA GGGGCTGCGC 
ATTCTTGACA AGAGCGTGAT GAAAATCATC ATGGAGCCTC CTTCAACGAT TGCCGATGAA 
ACTGTGGTGA CGCTGATCGG CCGGTGCCAA AAAACCAGCC GGCCCTACAT CATCAAATAC 
GAGCAAGCTA TGCAAGATGT CGTCATGAAG GACTTCAAGG TCCAGGTTTC CAGGTACGAG 
ATTGCCGGCT GCTATCCGCT GGAAGAGGAT TATTTTGAAT GGTCTGATCC GCGCACGGTT 
GACCTCAAGG TCAACACCTC GGAGCTATTT GGAGCGCCGG GTTGCCCTCA CTGCGGCGCG 
CACACGGCTT TTGCCGTCTG TGGGTGCGGA AAGCTTTTAT GCCTGAACGA TGCAGCGTCA 
GTGGTTTGTC CATGGTGTCA AAAAACCGTC TCGTTCTCTT CGCTGGGGCC AGACGATGAA 
GGTGGGTTCG AGGTCAGGCG AGGCAGAGGC TGA

Protein sequence

MRRLPVFFVL DCSESMVGAN LKKMEGAVAA IVKSLRTDPQ ALETVFFSVI AFAGVARTIA 
PLVEIVSFYP PKLPLGGGTN LGSALDALMG EIDRSVIKTT AERKGDWRPI IYLVTDGRPT 
DNPSRAIERW NSHYAKKATL IAIGLGRSVD FTALRRLTEN VISFEDIKES DFKKFINWVT 
ASVVVQSKSV GDGTDFQGLR ILDKSVMKII MEPPSTIADE TVVTLIGRCQ KTSRPYIIKY 
EQAMQDVVMK DFKVQVSRYE IAGCYPLEED YFEWSDPRTV DLKVNTSELF GAPGCPHCGA 
HTAFAVCGCG KLLCLNDAAS VVCPWCQKTV SFSSLGPDDE GGFEVRRGRG