Gene Pars_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1035
Symbol
ID	5054600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	922253
End bp	923380
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	62%
IMG OID	640468591
Product	2-methylcitrate synthase/citrate synthase II
Protein accession	YP_001153265
Protein GI	145591263
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01800] 2-methylcitrate synthase/citrate synthase II

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACCTCC CTGGTCTAGA AGGGGTTGTG GTAAAAGAAA CGAAGATATG CTACATCGAC 
TTGGAAAATT CCAAGATATA CTACCGCGGC TACGACCTCG AAGAGCTGGC CCGGCTGTCC 
ACTTTTGAGG AGGTGACCTA CCTCCTTTGG TTCGGCCGGC TCCCGGGCAG GCGAGAGCTG 
GAGGAGTTTA AGGCTAGGCT CGCGGCGCAT CGGCTACCCC TGCCGCACGT CGCGGCGCTG 
GCGAAATCAG CGCCGCCATC GGCTGAGCCT ATCGACGTGT TGAGGACGGC GGTTTCGGCA 
ATGGCTTGGG GGGAGGATCT TTCAGACAAG TCGCCGGAGG CGGAGCTCCA GAGGGGGTTG 
AAGATAACCG CGGCGATGCC CTACGTCGTG GCGGCTTTTG ACAGGGCTAG AAGGGGGCAA 
GAGCCTGTCC ACCCGGCGGA GGCGGGGAGC CACGCGGAGT ACTTCCTCTG GGCGCTTAGG 
GGGGAGAGGC CCAGCCCGCG GGAGGCCAGG GCGATGGACG TCATGCTGAT AGTATACGCA 
GAGCACTCCA TGAACAACAG CGCCTTCACC GCAGTTACCG TGGCCTCAAC CTTCGCCGAC 
ATGTACGCTG CCGTCACCGC GGCCGTGGCC AGCCTCAAGG GGCCTCTCCA CGGCGGGGCC 
AATGTAGACG CCGCGAAGAT GATCGAGGAG ATAGGAGACG CCAAGAAGGT GGAGCGCTGG 
GTCGATGAGC AACTGGCCAA GGGGCGGAGG ATACCGGGCT TCGGACACCG GCTGTACAAG 
AAGGGCCCCG ACCCGAGGCT GAGGGTTCTG AGGGAGCTGG CTAAAGGGCT AGCGGCGGAG 
AGGGGTGACT TCCGCTGGGT GGAAATCGCC GAGCGGCTCG AAGATTACGT GACGGCTAAG 
CTGGCGGCGA AGGGCATCTA CCCCAACACC GACCTATACG CCGCGGTGAT CTTCCGCTAC 
CTCGGCCTAC CCGTTGACAT AAACCTGCCG ACCTTCGCCA TATCCCGCGC GGCTGGATGG 
GTCGCCCACG TCTTGGAATA CCGCCAAGCG AATCGCCTCA TAAGGCCGAC AGAGAAATAC 
GTCGGCCCCA TTGGGCTTAA GTACATCCCA CTGGAGGAGC GGAGCTAG

Protein sequence

MYLPGLEGVV VKETKICYID LENSKIYYRG YDLEELARLS TFEEVTYLLW FGRLPGRREL 
EEFKARLAAH RLPLPHVAAL AKSAPPSAEP IDVLRTAVSA MAWGEDLSDK SPEAELQRGL 
KITAAMPYVV AAFDRARRGQ EPVHPAEAGS HAEYFLWALR GERPSPREAR AMDVMLIVYA 
EHSMNNSAFT AVTVASTFAD MYAAVTAAVA SLKGPLHGGA NVDAAKMIEE IGDAKKVERW 
VDEQLAKGRR IPGFGHRLYK KGPDPRLRVL RELAKGLAAE RGDFRWVEIA ERLEDYVTAK 
LAAKGIYPNT DLYAAVIFRY LGLPVDINLP TFAISRAAGW VAHVLEYRQA NRLIRPTEKY 
VGPIGLKYIP LEERS