Gene Pars_0708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0708
Symbol
ID	5055274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	630706
End bp	632247
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	61%
IMG OID	640468265
Product	glycosyl transferase family protein
Protein accession	YP_001152946
Protein GI	145590944
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.43114
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.211707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCAACA TCACCCTGCC GAATATCACC ATCCCGCAGA TATCGCCAGA CGTCCTCAAC 
GACACACTGC GAATCCTCAA CAAGACGCGC CAAGGCCCCG TGACGGTGCC AAACGCCCCC 
GCCATCCCGC CCTGGCTTGA AAACGCGTTG CTGACAATAT ACCTCGCCCT ACTGGCCTTG 
TCCATACTGC TAATAGCCCA CTACATCTAC TACGCCCGGC ACTCCAGCCG CCAGCCCCCC 
GACCTCCGCG CCGACCCCGC CGACGCCCCA CTCTCCATAA TAATTCCGGT AAAAAACGAA 
AGCCCCGAGA CCGTTGCCCA AGCCGTAAAG AGACTGGCGG CGCTTAACTG CCCCGACGCG 
GAGATCATAG TGGTGTCAGA CGACCCCCCA GACGCCTTCG AGGAGATTAG AAAGGCGGTG 
GAGAGCCTCG CAGTCCCCAA CGCCAAGGCG CTGAGGAGGC CCCAGCCCGT GGGCTACAAG 
GGAGTTGCGC TGAACTGGGC CGCGGAGCGG GCCAGGGGGG AGATCCTCCT CTTCCTCGAC 
GTAGACAGCG TGCCGCCCCC CGACCTATGC CACAGGGCCA GGGCGGTGGG GGAGAGGGAG 
ATCCTATTCC TCGGCTGGGA CGGCTACGCC CCCGTCAAAA CCCCCATAGC AACCCTCCAG 
CTCTTCCTCT ACAAGTATTT GCTATTTCAC GTAGCGATAG TGGGACGCCA CAATACGGGA 
CACCCAATCT TCGCCTTGGG GTCGGGGATA GCGGTGAGGA AGAAGTTCCT CCAGGAGATG 
GGAGGCTTCT GCAACTGCAC CGCCGACGAC TACGACATAT CCATGAAGGC GTATCTACAC 
GGAGGCAGAG TGGTATACTC GCCGGGGGTT CCAGTATATG TCGAGGTGCC TGGCGGCTAT 
GCCGCGTTCA AGAAGCAGTA CGCCCGCTGG ACCTACAACT CGGCGTACTT ATTGGCGGCG 
TACGGGCTGA AGATATTTAG GCTGTGGATG CCCCTCCCCC ACAGAATAAG CGTCTTCCTC 
AACGTGGCCA CCCACCCCCT CATGATAATG ACAACATTCG CCATAATGCT CTCGGGACTG 
GCAATGGGCT ACATGGGCAT CCTCCTGCCG CCCCTCCACA TACTCATACT ACAGCTGGCC 
CTGGGCATAG CGGCGCTGGT CCAGGTATAC TACGTCTACA AGCTGGCGAG GCGCGACGGG 
CACAGCTTCG TTGCGGTGGC GGGGAAGCTT GCCAAGTCAG CCGCCCTCCT CCTAGTCCTC 
AGCCCCTACC TAGCCTTCTA CGTGGTCCTC GGCACACTCC GGAGGAGAAT AAGGTGGCAC 
ATCACCCCCA AAGGCCTCGC CTCCGTCTTG TCGGGCCGAG CCGGGCCGTA CGAGATAGGC 
CTCGCCGCGG CCCTAGGCGC CCTCTTCGCC TACGCCCTAA CCACCGCAAA CCCAGTCTTC 
ATAACAAACA CCGCCTTCCT CCTAGCCGCC ACCCTCTACG TACTTACAAA AATAACTAGC 
CCTCCGCCAA GGAGCGACGC GACACAATCG GGTACGGGAT AA

Protein sequence

MVNITLPNIT IPQISPDVLN DTLRILNKTR QGPVTVPNAP AIPPWLENAL LTIYLALLAL 
SILLIAHYIY YARHSSRQPP DLRADPADAP LSIIIPVKNE SPETVAQAVK RLAALNCPDA 
EIIVVSDDPP DAFEEIRKAV ESLAVPNAKA LRRPQPVGYK GVALNWAAER ARGEILLFLD 
VDSVPPPDLC HRARAVGERE ILFLGWDGYA PVKTPIATLQ LFLYKYLLFH VAIVGRHNTG 
HPIFALGSGI AVRKKFLQEM GGFCNCTADD YDISMKAYLH GGRVVYSPGV PVYVEVPGGY 
AAFKKQYARW TYNSAYLLAA YGLKIFRLWM PLPHRISVFL NVATHPLMIM TTFAIMLSGL 
AMGYMGILLP PLHILILQLA LGIAALVQVY YVYKLARRDG HSFVAVAGKL AKSAALLLVL 
SPYLAFYVVL GTLRRRIRWH ITPKGLASVL SGRAGPYEIG LAAALGALFA YALTTANPVF 
ITNTAFLLAA TLYVLTKITS PPPRSDATQS GTG