Gene Pcal_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pcal_2037
Symbol
ID	4909580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum calidifontis JCM 11548
Kingdom	Archaea
Replicon accession	NC_009073
Strand	-
Start bp	1891006
End bp	1892196
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	64%
IMG OID	640125790
Product	glycosyl transferase, group 1
Protein accession	YP_001056918
Protein GI	126460640
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0000383796
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTCTTG TGGCACACCA CTACTGGGGC TCCCCCGGCG GGGGCCAGTT GGTCTGCGCC 
GCGGCGGCCT ACGCTCTGGA CAAGGCGGGG TTGGCGCCCG TGCTCAGCGG CACGTTTAAG 
TTTGACCCGG GGAAGTACGT GGAGTGGTAC GGCATAGACA TCTCCAAGTA CCCCCGCGTA 
ACTCTGCCAG TGGGCGCCAA GGCCTTCGGC CTTTGGGCCA GGCTCCTGGT GTGGTTGCCG 
GCCAAGAGGG CCGTTGAGAA GTACAGGCCG CGGCTCATTT TCACAGACGA GGTGGCGTAT 
AAGCCCATCG CCGGCGCGGC GCCCCTGGTG GAGTACATAC ACTTCCCCTT CGAGGTGTTC 
ATAGACCCCC GCTTCAGGGG CACCGGCCTG GCCTATGGGG AGGATCCCTA CATAACAGAG 
CGCTACTCCC GCTTCCCGCT GAGCCTCTAC TGGCGCATCT ACGTCAAGCT GTTGCCAAGG 
TACGCCAGGG AGAACCCCTT CCACTACGCC AGCCTAGTCC TCGCCAACTC AAGCTGGACC 
GCCGACGTGG CCAAGGAGGT ATATGGGGAG AGGCCAACCG TCCTCAACCC CCCAATTGCG 
CCCAACGTAG AGGTGGTGGA GTCGCCTAGG CCCTTCGAGG AGAGGGAGCC CGCCGTGGTT 
ATGCTGGGCC GCTTCTCGCA GGAGAAGCGC TACCACTGGG CCGTCACAGA GGTGGCGCCG 
CGCCTCGTGA AAGAGGTGCC GGGCGCAATG CTGTACATCT TCGGCGGCGC CGCCACGCCC 
ACGCTGAGGG CCTACATGGA GGAGGTGAAG AGGCTGGCTG AGAAAAGCGG CGTGGCACAC 
GCCGTCCGCC TAATCCCCAA TGCCCCGAGG CGGGAGATAA ACGCCACCAT GGACAGGGCC 
AGGGCCTTCT TCCACGCCAC GATAAACGAG CACTGGGGGA TAGCCGTGGC CGAGGCCATG 
GCCAGGGGGC TACCCCCCGT GGTCCACAAA AGCGGAGGCA CGTGGAGCGA CTTGGCCCAG 
GGGGCCGGGC TGGGCTACGC AAGCGCTGAG GAGGCAGTGG AGCAGTTGGC CAAGTTCCTC 
ACAGACCCCA AGGCCTGGAA AGCCGCGTCC GCCGCCTCCG TCGCCAAGGC AAAGGGTCTA 
ACACTAGACG TCTTTGCCAA AAAGCTGGCC GACTTAGTGT CGGCGATTTA A

Protein sequence

MSLVAHHYWG SPGGGQLVCA AAAYALDKAG LAPVLSGTFK FDPGKYVEWY GIDISKYPRV 
TLPVGAKAFG LWARLLVWLP AKRAVEKYRP RLIFTDEVAY KPIAGAAPLV EYIHFPFEVF 
IDPRFRGTGL AYGEDPYITE RYSRFPLSLY WRIYVKLLPR YARENPFHYA SLVLANSSWT 
ADVAKEVYGE RPTVLNPPIA PNVEVVESPR PFEEREPAVV MLGRFSQEKR YHWAVTEVAP 
RLVKEVPGAM LYIFGGAATP TLRAYMEEVK RLAEKSGVAH AVRLIPNAPR REINATMDRA 
RAFFHATINE HWGIAVAEAM ARGLPPVVHK SGGTWSDLAQ GAGLGYASAE EAVEQLAKFL 
TDPKAWKAAS AASVAKAKGL TLDVFAKKLA DLVSAI