Gene Pars_1379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1379
Symbol
ID	5054697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1240776
End bp	1242602
Gene Length	1827 bp
Protein Length	608 aa
Translation table	11
GC content	61%
IMG OID	640468924
Product	glutamyl-tRNA(Gln) amidotransferase subunit E
Protein accession	YP_001153593
Protein GI	145591591
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2511] Archaeal Glu-tRNAGln amidotransferase subunit E (contains GAD domain)
TIGRFAM ID	[TIGR00134] glutamyl-tRNA(Gln) amidotransferase, subunit E

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00195959
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0032704
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGGACTACA AGGCGCTTGG CTTGAAAACC GGACTTGAAA TCCATATACA GCTCAACACG 
AGGCGCAAGC TCTTCTGCCA CTGCCCCCCG GTATTGAGAG ACGACGAGCC CCACTTCAGA 
GTAGAGAGGA GGTTGCACAT ATCTGTCAGC GAGCTGGGGG CGGTTGACCC GGCGGTTGTG 
TGGGAGGTGA GGAAGCGGAG GAAGTACATA TACGAGGGGT ACAGGGACAC CACCTGCCTC 
GTGGAGCTTG ACGAGGAGCC GCCCCACATG CCGGACGAGG AGGCCTTGAC GACGGCGGTG 
GCCGTGGCTA AGATGTTCAA CGCCAAGCTC TTTGACGAGA TCTACGTGAT GAGGAAGACG 
GTGGTGGACG GCTCCAACGT GTCGGGCTTC CAGCGCACGA TGCTCGTGGC GTATGGCGGG 
AGGGCCAAGA TCCTGGGCTA CGACATCGGG GTGGAGACCA TAGCCCTCGA GGAGGACGCG 
GCGAGGAAGA TGGGAGAGGA GGGCAAAGCT GTGGTGTACC GCCTGGACAG GCTGGGGATC 
CCCCTCATCG AGATCGCCAC GGAGCCCATG ACCTACGCGC CACAGCAGGT GGAGGAGGTG 
GCGTGGATTA TAGGCTACAG CGTGAAGATA ACGGGGAGGG CCAAGAGGGG CGTGGGCACA 
GTGAGGCAAG ACGTCAACGT CTCCATCGCG GGCGGCGCCA AGACTGAGAT AAAGGGCGTC 
CCCGACTTGT CCCTAATCCC CAAGGTTATC GAGTACGAGG CGACGCGCCA GCTCAGCCTG 
TTGAAAATAG CAGAGGAATT GAAGAGACGC GGCGTGGAGA AGGTGGAGCT CTCCCTCGCC 
GACGTCACCC AGGCCTTTGC CAACACCAAG TCTAAGCTTG TGAGGCGGGT GCTAGACGCC 
GGGGGGAAGG TGGTGGCGGT GAAGGCCCCC GGCTTCAATA AGCTCCTAGG CGCGGAGGTC 
CAGCCGGGGA GGAGGTTCGG CACTGAGCTG GCGGACTATG TGAGGGCTTG GACTGAGCTG 
GGGGGCCTCC TACACAGCGA CGAGCTCCCG GGTTACGGCA TTACAGCAGA CGAGGTAAGG 
GACGTGGAGG CGAGGGTGGG GGTTAACAGC TTCATCTTGC TCATGGGCGT CGACGAGGGG 
GAGCTGGAGG AGGCGGCGAG GGTGGTTGTG GAGAGGCTCA ACGCGGCGCC TAGGGGGGTG 
CCCGAGGAGA CCCGGGCCGC CAACCCCGAC GGCACTACGA GGTTTCTCAG GCCTAGGCCC 
GGCGCGGCTA GGATGTACCC CGAGACAGAC CTCCCGCCGG TAAGGATTAC TTTTGAGATC 
TTGAAGAAGG CCGAGGAGGT GGCCAAAGTC ACCCTTGAGG GCAAGCTCAA GGAGCTCACG 
TCGAGGGGGC TGAGCAGGGA CTTGGCGCTT CAGCTGGTGA AGTCTCCACA CCTGGAGAAG 
TTTGAGGACT ACCTCCAGAG GTTTAAGGAG GTGCCGCCCC AGCAAATAGC CGCGGTTCTA 
CTCAACATCT CCAAGGCCTT GGCGAGGGAG GGCGTCGAGA TCACCGACGA GAAGGTGGAG 
TCTGTTCTCG ACGCTTTGAA TAGGAAAGTC ATAACCAAGG AGGCTGTGGA GGAGGTCCTC 
AGGAACATGA AGCCGGGGGA GTCGGCCGAG GAAGCGGCTA AGAGGCTGGG GCTGTTGAGA 
ATGTCCTACG ACGAGGTGAA GAAAATCGTG GCCGAGGTGG CGGCCCAGGT GGGGAAGGAG 
AAGGCGGTGG GCGAGGTGAT GAGGCGCTAC AGGGGAAAGG TGGATGTGGA GGACGTAAGA 
CGGGCGCTGG CCGAGATATA TTTATAA

Protein sequence

MDYKALGLKT GLEIHIQLNT RRKLFCHCPP VLRDDEPHFR VERRLHISVS ELGAVDPAVV 
WEVRKRRKYI YEGYRDTTCL VELDEEPPHM PDEEALTTAV AVAKMFNAKL FDEIYVMRKT 
VVDGSNVSGF QRTMLVAYGG RAKILGYDIG VETIALEEDA ARKMGEEGKA VVYRLDRLGI 
PLIEIATEPM TYAPQQVEEV AWIIGYSVKI TGRAKRGVGT VRQDVNVSIA GGAKTEIKGV 
PDLSLIPKVI EYEATRQLSL LKIAEELKRR GVEKVELSLA DVTQAFANTK SKLVRRVLDA 
GGKVVAVKAP GFNKLLGAEV QPGRRFGTEL ADYVRAWTEL GGLLHSDELP GYGITADEVR 
DVEARVGVNS FILLMGVDEG ELEEAARVVV ERLNAAPRGV PEETRAANPD GTTRFLRPRP 
GAARMYPETD LPPVRITFEI LKKAEEVAKV TLEGKLKELT SRGLSRDLAL QLVKSPHLEK 
FEDYLQRFKE VPPQQIAAVL LNISKALARE GVEITDEKVE SVLDALNRKV ITKEAVEEVL 
RNMKPGESAE EAAKRLGLLR MSYDEVKKIV AEVAAQVGKE KAVGEVMRRY RGKVDVEDVR 
RALAEIYL