Gene Pars_0578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0578
Symbol
ID	5056043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	516565
End bp	517659
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	61%
IMG OID	640468139
Product	parallel beta-helix repeat-containing protein
Protein accession	YP_001152824
Protein GI	145590822
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3420] Nitrous oxidase accessory protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.56022
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTATCA ACACGCCGGG TTATTACAGA GGCGTCGTGG CCGATAGGCT TGTAATCAAC 
GCCAGCGGCG TCTGGCTGGA GGACGTGACG GTGAGGGGGG GCTATAGGGA GGTGCCGCTC 
CCCCAGACTA TGACGGCGTA TAGGGTTAAG CCTGCGGTGG GCTGTCTAGT GGTGGCGGGA 
CGCAACGTGA CCATCACAAA CCTGAGGCTG GACTGCGCGG CGGGTCTGCT AATCTTTAAC 
TCATCCGGCG TCGTCGTCCG CGGATTCGAG GCGCGGGGGC CTGTGGAGAT GGCCGTGTAC 
AAAAGGGGAC TAGGCATCTA CGTATACAAC TCCACAGACG TGAGAGTAGA GGGTGGCAGT 
CTGTACGGCT TCCACGACTG CGTCTACGTG GAGTATTCCC GCAACGTCTT TCTCGACGGT 
TTGAGAGCCC AGGGCTGTAG GTACGGCGTA CATGTCATGT TCAGCGAGGG CGTCTCCATC 
AAGAACTCTA TGGTCTCTGA CAGCTATGTG GGCTTCGCGG TTATGTACAC GAAAAACGCC 
TCTGTGGTCA ACGCCTCGGC GGTTGGCAAC AGGGCGTGGG CTGAGGGCTA CGGCATCTTG 
CTGGCGGAGC TCAGCGGCGT TGTGAGAGGT TGTAAGGCTG TGGACAACGT CCACGGCATC 
TACGTCTTGT ACTGGGGGGG CACCAGGGTG TTGGTGGAGG GCTGCGTCAT ATCCGGCAAC 
TACTTCGGCA TCACGCTGAG GGGGAGGAAC GCCACCGGCG TGGAGTTCGT AGGTAATGTG 
ATTCGAGGCA ACGTGGTTGA GGTGGATCAC ATGGGGGTGG GGGAGGAGGC CCCCGCCGCC 
TTGTTTAGGG GCAATCTCTG GGGCGGCCAC GCCTCGCCGT CCCCCTACTA CTACGCCAGC 
GCCTTCTCTG ACTTGATGAC CGCGACGGAG GGGGCGCTTG CATATTTAGC CGCATCCCCG 
GCCCGCTTCG TGATCGACGC CGCCATGGGG AGGCCAATTG CCTACGACCC GGCGCCTAGG 
CCGGATGAGA GGGCCCCGCC GTATTTGTTG CTTTTGGCCC TCCTCCTGGT GCCGCTGGTA 
TGGAAGTCGA GGTGA

Protein sequence

MVINTPGYYR GVVADRLVIN ASGVWLEDVT VRGGYREVPL PQTMTAYRVK PAVGCLVVAG 
RNVTITNLRL DCAAGLLIFN SSGVVVRGFE ARGPVEMAVY KRGLGIYVYN STDVRVEGGS 
LYGFHDCVYV EYSRNVFLDG LRAQGCRYGV HVMFSEGVSI KNSMVSDSYV GFAVMYTKNA 
SVVNASAVGN RAWAEGYGIL LAELSGVVRG CKAVDNVHGI YVLYWGGTRV LVEGCVISGN 
YFGITLRGRN ATGVEFVGNV IRGNVVEVDH MGVGEEAPAA LFRGNLWGGH ASPSPYYYAS 
AFSDLMTATE GALAYLAASP ARFVIDAAMG RPIAYDPAPR PDERAPPYLL LLALLLVPLV 
WKSR