Gene Pars_1916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1916
Symbol
ID	5055254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1721603
End bp	1722676
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	54%
IMG OID	640469462
Product	VWA containing CoxE family protein
Protein accession	YP_001154115
Protein GI	145592113
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1240] Mg-chelatase subunit ChlD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAGCC CAGCGGATTT GGTATTAAAA ATTAGTGAGT GCCTCGGCGG CCTCTCCACC 
CGTAGCCTAA TATATGCAGT TGCTGATATC TACGCGAGGT TGTACCTTGG CGAAATAGAC 
GAGGAGAAGG TCCTGGAAAT TATTGCGCAG AACCTCGCCG GTGTTTTAGG CACCACGCCA 
AGCGGCGCCA AGAAACTTAT AACAGAGGCG TGCGGTCCAA AACCGGTCGA GGCGGCGGCG 
CCGACGTTGA CTACAGCCTC CGTGGGGGCG GAGAAGGCGC CGACTCTGGC ACATCTCGTT 
AACAGACATG TCCCCGTAGA CGCGCCGCCC CGGGCGAAGT TGGAGGTAAT AAAGAGGCTG 
AATCTGCCCA CCGACGCGCT GGGCGAATAT AGGCATAAGA TCTCCGCACG GGGAGAAGGG 
GAGTTACATG TAAAAACCGC GGTTACTACC ATAAGGACGT ACTACCCAGG CGCCTCTACT 
GTTGACGTAG ATCTGGTAAG GACGGCGCTG GCTTTTTCGA GGAGGAGGGC CTCCGGACAG 
CCCATCTCCG ACTCCGATAT CTACATACGT GAATACGCAC ATGTAGTTGA CAAGCCTGTG 
TACGTCGCCT TGGACGTTTC GGGCTCTATG AAGGAGTACA TGGGGGGAGC CACTAAGCTG 
AAGATAGCCA AGGACGCGAT TGCGAGGTAT ATCAAACAAA TGGCGGAGCT ACGCGGCAAT 
GTGTCGCTTA CGCTTTTCAA CGCCGACGCC GACTATATGT GGACTCCCCA CCCCGCCCAC 
AGATATTTGA AAGAGATGCT GGAAATTTTG AGATACGTCT ACTCGATGGG AGGTACCGAG 
ATAGCCTCCG CCCTGGAGCT TCTTCATGCC GACGCGGCGC GGAGCCACGT TGTAATTATA 
TCAGACGGCA GAACAAACGA CCCAGAAAAG GTTCTCCAGC TTGCCAAGAA GTTTAGAAGA 
ATTCACACAG TCGCGGCGGA GAGGAGCCGT CTTTTAAAGC AAATCGCCAA AATAACCGGC 
GGTAAATACA GAGAGCTGAA CCCCACTCTA GATCTGTTAA GTCTACATAC TTAA

Protein sequence

MSSPADLVLK ISECLGGLST RSLIYAVADI YARLYLGEID EEKVLEIIAQ NLAGVLGTTP 
SGAKKLITEA CGPKPVEAAA PTLTTASVGA EKAPTLAHLV NRHVPVDAPP RAKLEVIKRL 
NLPTDALGEY RHKISARGEG ELHVKTAVTT IRTYYPGAST VDVDLVRTAL AFSRRRASGQ 
PISDSDIYIR EYAHVVDKPV YVALDVSGSM KEYMGGATKL KIAKDAIARY IKQMAELRGN 
VSLTLFNADA DYMWTPHPAH RYLKEMLEIL RYVYSMGGTE IASALELLHA DAARSHVVII 
SDGRTNDPEK VLQLAKKFRR IHTVAAERSR LLKQIAKITG GKYRELNPTL DLLSLHT