Gene Pars_2099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_2099
Symbol
ID	5054948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1874549
End bp	1875760
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	66%
IMG OID	640469649
Product	VWA containing CoxE family protein
Protein accession	YP_001154297
Protein GI	145592295
COG category	[R] General function prediction only
COG ID	[COG2425] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.242069
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTCTCC TCCTCAACGT CGACTACGGC GACGCGTTGG TGAGGGCGAG GGCGCTTAGG 
GTATTGCGGG CCTCTGGGGT TAGGGCTGTG GGGGTTGAGG AGGCAGTGGA CGCCTATTAC 
GTCCACTACA GGTCGCCCAT TTTCGGGGGG CGGGCCTCCA GCCCCGTGTG GGAGAGGTTC 
CTCATGGCGT ATGTGAAGTC CCAATACTAC GGGGCGGTCT CCGCCGTCTC TAGGCTGAAC 
CATAAGGCCT CTCTTGAAGC GGCGGTGAGG CTCCTCAAGG CGTTTGAGTC CTACCTCCGG 
TACTTGGATA GCTACGGCAG GGCGTGGTTT GGGAGGGGGG CTAGAGAGGC ATGGGCGGTG 
GCCATGAAGC AGATTAGGCG CCACTTGGGG GATCCCGCCG ATGTGGTGGA GCTCTACCGC 
CTCTTCAAGC GGCTTGGGGA GGTGCTGGGG AGGGGGAGGT CGGACAGCCC TGGGGCGCTG 
GCGCTGTCGG TGGCCTCCGA CCCGCGGCGG GTGAGGCTGT CGCGTATCTT GGCCAAGGCG 
CTGGCTCTCT CATCGAGGCT TGGCGCCCTT CTCGACGGCG TGTGGGGACT GGGCGAAGAG 
GAGGAGAGAG CCTACGGCTC TCTGCACCGC CTGAGGAGGG CCGCTCTGTA CGCCAAGGCC 
CTCGCCCTGG GGGCGCCCCC GCTGTTCCTC CATAAGGCCG CCTCCGCCGA GCTCCCCGTC 
TATAGGCAGG TGGGCGGCGG GGACAAGGGG ATATACCTCC TCGTTGACAA GTCGGGCTCT 
ATGTACGGCG CGCTCGGCGG GGTTGAGAAG ATAGCGGTTG CGGCGGCGTA CGCCATAGCG 
GTCTTGAGGA GGTTCACGAA CGTGGTCATA CGGTTCTTCG ACGTGGAGGT CTACGACCCC 
GTCTCAGACG TGGAGAGGCT TGTCGACGTC TTGACGCGGG TGGCGGCTAG CGGGGGCACA 
GATATCACTC AAGCGGTGGA GGCCGCTGTT GAGGACGCCG AGAGGAGGAG GCTGAGGGGC 
TACGTCCTCG CGGTTGTCAC CGATGGCGAG GACGATAGGC TTAACCCCGT GGCCGTGAGG 
GAGGCAAGGG CGGTGTTCCG CGACGTGGTG TTCGTGCTGC TGGGTGCCCA GAAGCCCCCG 
CCCCACGCCC GCGCGGTGCG GATCTCCCCT AATGACCTCC GCCTCGCGGG GGCCGCCTCA 
GCAGTTATTT AA

Protein sequence

MGLLLNVDYG DALVRARALR VLRASGVRAV GVEEAVDAYY VHYRSPIFGG RASSPVWERF 
LMAYVKSQYY GAVSAVSRLN HKASLEAAVR LLKAFESYLR YLDSYGRAWF GRGAREAWAV 
AMKQIRRHLG DPADVVELYR LFKRLGEVLG RGRSDSPGAL ALSVASDPRR VRLSRILAKA 
LALSSRLGAL LDGVWGLGEE EERAYGSLHR LRRAALYAKA LALGAPPLFL HKAASAELPV 
YRQVGGGDKG IYLLVDKSGS MYGALGGVEK IAVAAAYAIA VLRRFTNVVI RFFDVEVYDP 
VSDVERLVDV LTRVAASGGT DITQAVEAAV EDAERRRLRG YVLAVVTDGE DDRLNPVAVR 
EARAVFRDVV FVLLGAQKPP PHARAVRISP NDLRLAGAAS AVI