Gene Pars_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1969
Symbol
ID	5054536
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1765092
End bp	1766051
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	50%
IMG OID	640469516
Product	glycosyl transferase family protein
Protein accession	YP_001154168
Protein GI	145592166
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0472] UDP-N-acetylmuramyl pentapeptide phosphotransferase/UDP-N-acetylglucosamine-1-phosphate transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGCCG AAATCGTGTC TGCCGTCGCC GCTTTTATAG CCGGTGTTGT TTTTGGCTTG 
TGGTGGGTAG GCGAGCAGAA AAGGCGCAAC ATCACATCCC GTGATATATA CAAGAATATT 
AGTGGAGTGC CTAGAGCCGG GGGGCTAATA GCAATGGTGG CTGCAACTGT GGGGTATAGC 
CTCTTGTCAA CAATTACGGA TAAGTCGTTG CTAGTTCTGG TGATATCGAT GATTATGGGG 
ATCTTGGGGC TAGTTGACGA CTTGAAAGGG CTTAGCGAAT ACGTAAGGGT GCTAGTCCCG 
GTGGTCTTAG CATTTGCGCT AGCCCGGACA AGTATGATAA CGCTTACTGT GCCGATGGTA 
GGTCTTTTCT ATGGGGCAAC TGGTTGGCTC TCTGTCTTGG CAATTCCCGT ATTGACAAAT 
GCCTTTAACA TGCTTGACCC GGTAAACGGC TTTCTTCCCA TGGCAAACAC CATAGTTGGC 
CTCTCCCTAG CCGCGGTAGC CGCTATGAGG GGACAGTGGG ACGCCGTCTA TTTGTTGGCG 
GTTCATGCGG CGGCTTCCCT TTCGCTGTAT GTGCACAACA GATACCCCGC CAAGACCTTC 
AACGGTAATG TCGGTAGCTA CTTCTTGGGA GCTAGCATCT CTACAATAGC AGTACTCTAC 
GACTTAGTCC CTTATCTGAT ACTAGCTGGT CTTCCCTTTG TTGTAAACGG GGCGTTGATA 
ATATTCTCCT CAGGCGGGAT TAAGGGACGG GAAAAAATTG AGAGGCCTAC CTATTTGGAA 
AACGGCCTCG TGTACCAACA ATGCAACTCA CCTATTATTT CCCTGGTTAG GTTAACTGTA 
GCCAACGGGC CTATGAACGA GTACGGAATT TTCAAGGCGC TGACGGTGCT GACGGCGACG 
ACCTCGGCAT TAACAGTAGC AACCACAGCA GTCATACACA TCTTTTCTTT ACCCATATGA

Protein sequence

MFAEIVSAVA AFIAGVVFGL WWVGEQKRRN ITSRDIYKNI SGVPRAGGLI AMVAATVGYS 
LLSTITDKSL LVLVISMIMG ILGLVDDLKG LSEYVRVLVP VVLAFALART SMITLTVPMV 
GLFYGATGWL SVLAIPVLTN AFNMLDPVNG FLPMANTIVG LSLAAVAAMR GQWDAVYLLA 
VHAAASLSLY VHNRYPAKTF NGNVGSYFLG ASISTIAVLY DLVPYLILAG LPFVVNGALI 
IFSSGGIKGR EKIERPTYLE NGLVYQQCNS PIISLVRLTV ANGPMNEYGI FKALTVLTAT 
TSALTVATTA VIHIFSLPI