Gene Pars_0356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0356
Symbol
ID	5055782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	305868
End bp	307055
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	39%
IMG OID	640467927
Product	glycosyl transferase, group 1
Protein accession	YP_001152614
Protein GI	145590612
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATTC TTCACATAGC CCCCTTCTTT ACAGGGGGCG TTGGGATAGT AGCGAAGAAC 
CTTACGTATG CACTTTCTAG ACTAGGTAAT GATGTTGTTA TCGCATCCCC TGCTAATCCG 
CCAGAGGAAA TACGCGAAAA CATTTCTACT TTTTACAAGC TTAGGGAGCT GGTACTTAAA 
GACCCCTTAT ACGCGCCAAT GTTTGCATTA ATAAATAAAA ATATTGTTGA AAAGATAATT 
AGAGACGTGA AACCCGATAT CATTTTAACT CATGGTCCGC TTACACTTCT AGCATCACTT 
ATAAAAACTA AGATACCTTG GTTCTCAGTT GTTCATGGCA CGTATTTCAA TGAACTAAAG 
TATATGTGGC AACACCCGAT CCGAGGTATT GAAAAACTGA AGTATTGGTT ATCAATAGGT 
ACAACATACC ATGAAGATAT GGAAATTTAT AGATATGTAA CGAAAAAAAG AAATATTTAC 
CTTGTCGCAG TTTCTAAAAG AACGAGGCAA GAGCTTATAG ATGCCGGTGT CAATCCGCAA 
AGAGTTTTTT CGGTTTTAAA TGGAGTTGAT AAAAACATAT TCAAACCGAT GGATAAAGAC 
AAGAACCTAT CGATTCTCGA AAAGAAGTAT GGTGTTGAGG TTGATAATGA AAGGCTACTT 
CTCCATGTTA ATCCAGGCGC GATAAAGGGT ACTCATATAC TCATTAAGTC TATTGCCATC 
CTCAAGAAAA TATTGAAAGA TAGAGTGATG TTACTCGTCG TGGGTAACAT AGGGCCCAGT 
ACATATAGAA GCTACATAGA GAGGCTAGTC AAAGAAATGA AGCTAGAAGA CACGGTCAAG 
TTTATCGGGC GAGTACCTCA TGAAGAACTC CCATACTTCT ACAATATAGC TGAACTCACA 
ATCGTCCCGT CATATTCGGA GGGTGCACCA TTAGTAATAC CTGAGTCGCT TGCATGCGGA 
ACGCCCGTAG TCGCGACAGA AGTCGGTGGC AATTCTGAAT ATCTAAGGCT GGCACTACCC 
AAACCTGACA AATACCTCGT AGAGATCAAA GAATACGATT TTTCCAAAAC ATTGGCAAAG 
AAAATAGGTA TGGCTCTTAG CTATAGAGCT ATCCCTAATA TAGAATCTAT CCCCTCATGG 
TTTGATATTG CTAAGATCTA TCTTAAATTA TTTAGAGAAA AATCGTAA

Protein sequence

MKILHIAPFF TGGVGIVAKN LTYALSRLGN DVVIASPANP PEEIRENIST FYKLRELVLK 
DPLYAPMFAL INKNIVEKII RDVKPDIILT HGPLTLLASL IKTKIPWFSV VHGTYFNELK 
YMWQHPIRGI EKLKYWLSIG TTYHEDMEIY RYVTKKRNIY LVAVSKRTRQ ELIDAGVNPQ 
RVFSVLNGVD KNIFKPMDKD KNLSILEKKY GVEVDNERLL LHVNPGAIKG THILIKSIAI 
LKKILKDRVM LLVVGNIGPS TYRSYIERLV KEMKLEDTVK FIGRVPHEEL PYFYNIAELT 
IVPSYSEGAP LVIPESLACG TPVVATEVGG NSEYLRLALP KPDKYLVEIK EYDFSKTLAK 
KIGMALSYRA IPNIESIPSW FDIAKIYLKL FREKS