Gene Ppha_0243 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ppha_0243
Symbol
ID	6461632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pelodictyon phaeoclathratiforme BU-1
Kingdom	Bacteria
Replicon accession	NC_011060
Strand	+
Start bp	234715
End bp	235746
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	51%
IMG OID	642726537
Product	von Willebrand factor type A
Protein accession	YP_002017196
Protein GI	194335402
COG category	[R] General function prediction only
COG ID	[COG4245] Uncharacterized protein encoded in toxicity protection region of plasmid R478, contains von Willebrand factor (vWF) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0131225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGTTTTG CCTGGCCAGA TAATATTGGA TATTTACTTT TTTTGATGCC CCTTGCCGTG 
ATTTTGGGGT ATGGAGTCGT AAGGCAGCTT CATGCACGCG AAGCCGTTTT TGGCCCTGCG 
CTGATTGATG CTATGATGGG ACGCCTGTCT TTGAGAGTTC TGGTTGTAAA AAAACTGTTG 
ATTTTTTGTG GTATCGCGTT GCTGCTCTTT GCGTTGGCGG GTCCCCGGTT TTGCAGTGGA 
GGCCGACCGG TGTTGCGCAA AGGTGCCGAT ATCGTTTTTA TGCTTGATGT TTCCCGGAGT 
ATGAGGGCAA GAGATGTGCT TCCTGACCGT CTCGGGCAGG CGAAGCAGGA GATAACAAGT 
ATCAGTCGTG CTGTCACTGG CGGACGGATG TCTATTCTTC TTTTTGCTGC CAGTCCACTG 
GTTCAGTGCC CCCTTACGAC GGATCGGGAT GCTTTCGATG CTCTGCTTGG CATGGCTTCA 
CCCGATCTGA TCGAAGAGCA GGGTACCTCT TTCCGTGCGG CGTTTGAGCT TGCCGGACGA 
CTTCTTGAAC CGACATTGGA GGATCGAATG GCATCAGGGG TAAAAGGAGA GAAGATTGTG 
GTGCTGCTGA GTGATGGGGA GGATCATACC GGTGAGGTTC GGAGTGCAGT CCAGCAGTTG 
AAAAAAGCGA ATGTTCATTT GTTTGTGATA GGAGTTGGTA TGCGTCAGCC TGTTGTGATT 
CCGTTGGATG ATGCCGGGGA AGGAGTCAAA CGGGATGAGC ATGACAGGGT GATCATGAGC 
AGTTTCAGAC CTGAATTCTT ACAGATGCTG GCCCGTGAAG CTGCCGGGTT TTATTTTCGA 
AGCAGTGCCG AACATGCCGT TTATAAGGAG GTTTCTGAAA GCATTAACCG TATTGCCTCC 
GCTTCCCGAT GGGTGATGGA GCCTGGTGAG CGTGAACCGC TTTATCGTTA TTTTGTTGCG 
GCAGGACTTT TTTTACTGCT CACTGAAACT ATGGTTGGAA GAGCTGCAGG AAAGAGGCGG 
AGCTGTTCCT GA

Protein sequence

MCFAWPDNIG YLLFLMPLAV ILGYGVVRQL HAREAVFGPA LIDAMMGRLS LRVLVVKKLL 
IFCGIALLLF ALAGPRFCSG GRPVLRKGAD IVFMLDVSRS MRARDVLPDR LGQAKQEITS 
ISRAVTGGRM SILLFAASPL VQCPLTTDRD AFDALLGMAS PDLIEEQGTS FRAAFELAGR 
LLEPTLEDRM ASGVKGEKIV VLLSDGEDHT GEVRSAVQQL KKANVHLFVI GVGMRQPVVI 
PLDDAGEGVK RDEHDRVIMS SFRPEFLQML AREAAGFYFR SSAEHAVYKE VSESINRIAS 
ASRWVMEPGE REPLYRYFVA AGLFLLLTET MVGRAAGKRR SCS