Gene Pars_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1100
Symbol
ID	5054793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	984197
End bp	985858
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	54%
IMG OID	640468656
Product	glutamate synthase alpha subunit
Protein accession	YP_001153330
Protein GI	145591328
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0067] Glutamate synthase domain 1 [COG0070] Glutamate synthase domain 3
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.154608
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCGGAA TAGTGGGGCT TTACTCATTA CGCCAGAAGG TGCCGGTAGA GGTGGTCGTG 
AGGGCACTCG ATGTTATGAA AGAGCGTGGA ACCCCCCACG GGGCAGGACT TGCGCTTTAC 
AACCCCTCTG ATAAGCCGAG GATAAAGGCC TTCACCCGCC AACCCATCGG CAACAGATAT 
GTCAAGCTAT ACAATGACTT ATATGACGTC GAACTTACAG AATTAATAAA TATAGATGGA 
TATATTTACC TAAATAGTAA ATGGATAGAT GTATACAAAG TTGTCGGGTG GCCCAACGAT 
ATAGTAAAGA TATACGGAAT CAGCGGATTG TCCAGTAATA TATGGCTGGG GCACACCAGG 
TACCCTACCA ACAGCCCGGG GAGGCTACCC TACTATTCCC ATCCGTTTAC CGCCGGCGAC 
GTTGCCATAG TCCACAACGG CGACTTGAGC AGCTACGGAT CCAACATCAA CTTCATACGG 
TACAGAGCCC ACGTCAAGTT CACGGGCAAC GACAGCGAAG CGATTGCCTA CCTCTTGTCG 
TTTTTGGCAA GCGAGTTGGG CGTCGAGGAG GCGGTGGAGG AGCTGATGTA TGGGCGCCGG 
TACAGATGGG CCCGCCTCGA CGGGCCTTAT GCGGTCAGCT TCATAATCGG CGGCCCAAAG 
CCCGTGTTCG GCGCCTTTGT AGATCCGCAA CACTTCCGCC CGCTGTACGT CGGCACGACA 
GACTCAATGC TTATAGTCGC CTCGGAGGCG GCTGCCATAA AGGCCATTGA GCCGAGGGCC 
GCTGTGTGGG CCTTGAGAAG CGGCGAGTAC ATAATAGCAG AGGGAGACGA GGTGCGCGGA 
AATTTCAGGA AAAGGTATGT CTACCCCGAG CTACCCCAGC CCCCCGAAGA CGCAATAGAC 
GCGAGCCAAT ACGACGCAGT ATCGCTGGCG CCGGTGGTTA GGGCCGAGCT CCAGAAGCGC 
GGCGAGGTAA AAGTGGTGAA CGTCCTCGGG CATAGGTACC TCGGCAACGG CATGTCCTCG 
GGAATTCTCA AAGTCTGGGG CGTGGTGGGG AACGCCTCAG CAAACGTAAT GTCCGGCGGA 
GTCTACTTCG TATACGGCGA CGTACAGGAC GACTTCGGGG ACGCCATGAA CGGGGGGTTA 
GCCGCCATCT TCGGCAACGC GGGCGACGCA GTGGGGCAAG CCAAAAGAGG CGGCGAGATT 
TATGTGTACG GCGACGTCGG CTCGAGAGCG GCCATTCAAC ACAGAGGCGG CGTAATGGTA 
GTGGGAGGCT CAGCGGGCAA GTACCTCGGC GAATACATGG GAGGGGGCAC CGTGGTGGTG 
CTCCGCGCCA CAAACAACGA GGAGGTGGGC AATATGATAG GCAGAGGCAT GGTAGGAGGC 
GAGATATATA TAAGAGGCGA AGTGCCCATG GATTACATAA GCCCCGTGGA TAAAAGAGCA 
TTGGAGAGAT ACGCCAAGTC GCTCCTAATC GACGGCCTCG CCGGGGTCGA GGACTACACA 
AAACTCCTAG ACGGAGCCGA GCCCCTGGCA GTAGAACATA GAGAACTCAC CGAGGAGGAA 
ATAGCAAAAC TAAGCCCATA TATTACTAAA TTCAATAATA TATTTAACTT AAACATAAAA 
ATAAGTAGAG ATATATTCAC AATAATAAGG CCTAAGAAAT AG

Protein sequence

MCGIVGLYSL RQKVPVEVVV RALDVMKERG TPHGAGLALY NPSDKPRIKA FTRQPIGNRY 
VKLYNDLYDV ELTELINIDG YIYLNSKWID VYKVVGWPND IVKIYGISGL SSNIWLGHTR 
YPTNSPGRLP YYSHPFTAGD VAIVHNGDLS SYGSNINFIR YRAHVKFTGN DSEAIAYLLS 
FLASELGVEE AVEELMYGRR YRWARLDGPY AVSFIIGGPK PVFGAFVDPQ HFRPLYVGTT 
DSMLIVASEA AAIKAIEPRA AVWALRSGEY IIAEGDEVRG NFRKRYVYPE LPQPPEDAID 
ASQYDAVSLA PVVRAELQKR GEVKVVNVLG HRYLGNGMSS GILKVWGVVG NASANVMSGG 
VYFVYGDVQD DFGDAMNGGL AAIFGNAGDA VGQAKRGGEI YVYGDVGSRA AIQHRGGVMV 
VGGSAGKYLG EYMGGGTVVV LRATNNEEVG NMIGRGMVGG EIYIRGEVPM DYISPVDKRA 
LERYAKSLLI DGLAGVEDYT KLLDGAEPLA VEHRELTEEE IAKLSPYITK FNNIFNLNIK 
ISRDIFTIIR PKK