Gene Pars_0357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0357
Symbol
ID	5054856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	307117
End bp	308244
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	46%
IMG OID	640467928
Product	glycosyl transferase, group 1
Protein accession	YP_001152615
Protein GI	145590613
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATAACC TAGCTAAGCA CCTCAGAATG CTTGGCGTAG ATGCCTATGC TATTGACTGC 
ATCAAAACGG CTGGTCATGA AAACCAGGAG GATTTCATAT TAAGGGTGAA GTGCGATAGC 
AATTTGCATA AGGTGCTGTG TAGGGAGGCA AGCGCGAGGT GCAATGTATT AAAAGAGGTT 
GTCTTTGCTA GACGGGCGAC GAAGATTTTA GACAAATTCG ATGTGGTTCA CGTAAATACT 
GCGTGGGTTG GTTTTACACT AAGCCTATTG TTGAGAAGAC CCAGGTTTGT TTACACCTGC 
CACAACCCCT TGTGGCCTGA AGACCAAGTG CATTTCGGCG AGAAAATCGT CAGGATAGTG 
GAGGGCCACG CTATGAGGAG GGCTCATGCC GTCATAGCGC TGAATAACAC GATGAAGAGA 
TCCATTGAGG CTAAGGCCAA GGTGGGCCCA TCAAAAATCT TTATTGTGCC AAATGGCGTG 
GACACAGAGT TTTATAGGCC AAACCTACCC TGCGAACATG TTAACGAGGA GTATGGGCTT 
GAGGGTAAGA AGGTTGTGCT ATTCGTAGGC AGAGTTACTT GGGGCAAGGG CGTACACATA 
CTATTAAAGG CCATTAAACG CCTCAGAGAT TTCTACAATG TCAGAGATGT CAAGGCTTTG 
ATCGTGGGCC CCCTCTCGGG CTTCTACAAA TCCGACAAAC CCTCGAGCTA TGCCCAGTTA 
CTCATGAGCT ATGCTAAAGC CAACAACCTA GGTGTCGTCT TCACGGGCTC TATAGATTCA 
GACATGCTCA GATACGTATA CTCGTGTTCA CACGTATTAG TACTACCTTC GTATTTCGAG 
GCTTTTGGAA TGGTTCTTAT AGAGGCTATG GCCTCGGGGA TACCGGTGAT AGGCTCCAGA 
GCCGGCGGGA TACCAGATAT TATAGAAGAG GGCGTAAATG GATTTACATT CCCTGTGGGA 
GATGATGTCA CACTAGCAGA GAAGCTATAT ACACTTTTGA CAGATGAATC TTTACATAAG 
AATATGGCTA ATGCTGCGAG AAGCATAGCG GTAACAAGGT ATAGCTGGAA AATTGTTGCA 
AAAAAACTAT TGAAATTATA TGAGATTGAA AACTCCATCC AGTCATAA

Protein sequence

MYNLAKHLRM LGVDAYAIDC IKTAGHENQE DFILRVKCDS NLHKVLCREA SARCNVLKEV 
VFARRATKIL DKFDVVHVNT AWVGFTLSLL LRRPRFVYTC HNPLWPEDQV HFGEKIVRIV 
EGHAMRRAHA VIALNNTMKR SIEAKAKVGP SKIFIVPNGV DTEFYRPNLP CEHVNEEYGL 
EGKKVVLFVG RVTWGKGVHI LLKAIKRLRD FYNVRDVKAL IVGPLSGFYK SDKPSSYAQL 
LMSYAKANNL GVVFTGSIDS DMLRYVYSCS HVLVLPSYFE AFGMVLIEAM ASGIPVIGSR 
AGGIPDIIEE GVNGFTFPVG DDVTLAEKLY TLLTDESLHK NMANAARSIA VTRYSWKIVA 
KKLLKLYEIE NSIQS