Gene Pcal_0953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pcal_0953
Symbol
ID	4908124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum calidifontis JCM 11548
Kingdom	Archaea
Replicon accession	NC_009073
Strand	-
Start bp	900225
End bp	901295
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	54%
IMG OID	640124701
Product	von Willebrand factor, type A
Protein accession	YP_001055844
Protein GI	126459566
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1240] Mg-chelatase subunit ChlD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGACT TAGTAGAGCT CTTAGCGGCT GTATACTCCT GCCTCGGGGG CCTCTCCATA 
CGCAGTCTTA TATACGGCAT TGAGGACGTC TATGTACGGG CAGAGCTCGG CGACGTGGAC 
TGGGAAAAAG TTCTTGAAAT ACTTGCACAG AATTTGGCGG GCACGCTTAA GATGAGCCCC 
TCTGCGGCGA AGGAGGTTAT AAGAGAAGCT ATAACGTGTC GCCCGAAGTT GCGCGAAGGC 
GCGCCCACGC TAGCCATAGG CTCGGTGGGC GACGAGAAGG CGCCTACGCT TGCCCACTTG 
GTTAATAGAC ACGTCCCAGT GGACGCCACG CCCAGGGTAA AGCTTGAGGT AGTTAGGAGG 
CTGGGCCTTC CTAGGGACAG AATTTTGCGC TCGTATAGCA GAGTCGTGGG TAGAGGCGAG 
GGGTGGCACG TGCGGGGCGC CGTGAAGTCT CTGCGAGGCT ATATACCCGG CACGCCTTTC 
GCCGATGTAG ATCTGATAAG GACGGCCACG GCTTTTAGAA GAAAGCTCGT CATGAATATG 
CCGATTTCCG ACTTCGACAT ATTCGTAAGG GAGTATTCAA GGACGGCGGA TAAGCCGGTG 
TACATAGCGC TTGACGTCTC GGGGAGCATG AAGGAGTACA TGTGGGGCGA CGTGAAGCTT 
AGAGTCGCCA AGAACGCCGT GGCGAGGTAC TTGCGTCAGA TGGCAAGTCT CAGAGGCCGC 
GTCTCGTTGT TGCTCTTCAA CGTCGACGCC GACTTTATGT GGACTCCCTA CGAGGTTCAT 
AAGTATCTTA GGGAGATGCT CGAAATTCTC GAGTACGTAT ACGCCGGGGG CGGCACCGAG 
CTTGCGTCTG CCCTAGAGGT GCTCTACAGC TACGGCGTTA GAGAGGCGGT GTTGATAACT 
GATGGGAGAA CCGCCGACGT TGAAAAAACT TGGAGTCTCG TGAAAAAGTT CAAGAGACTC 
CACGCCGTGG CGGTTGAGAA AAGCGACTTG TTGAAACAGA TTGCGAAAGC CACAGGCGGG 
AAATACCAAG AGCTTAGCCC CAAGTTAGAC ATGTCGGTAA TACATGACTA G

Protein sequence

MNDLVELLAA VYSCLGGLSI RSLIYGIEDV YVRAELGDVD WEKVLEILAQ NLAGTLKMSP 
SAAKEVIREA ITCRPKLREG APTLAIGSVG DEKAPTLAHL VNRHVPVDAT PRVKLEVVRR 
LGLPRDRILR SYSRVVGRGE GWHVRGAVKS LRGYIPGTPF ADVDLIRTAT AFRRKLVMNM 
PISDFDIFVR EYSRTADKPV YIALDVSGSM KEYMWGDVKL RVAKNAVARY LRQMASLRGR 
VSLLLFNVDA DFMWTPYEVH KYLREMLEIL EYVYAGGGTE LASALEVLYS YGVREAVLIT 
DGRTADVEKT WSLVKKFKRL HAVAVEKSDL LKQIAKATGG KYQELSPKLD MSVIHD