Gene Pars_0848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0848
Symbol
ID	5056123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	753122
End bp	754177
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	60%
IMG OID	640468408
Product	hypothetical protein
Protein accession	YP_001153085
Protein GI	145591083
COG category	[R] General function prediction only
COG ID	[COG4756] Predicted cation transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.11518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.339338
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCTCC TTTTGCAGAT AATATTTCTC GTCGCGCTAG TCGCCGGGCC AGTACTCTCA 
AAGCGGATAG AGCACAACAT CGAGATCTAC TTCCTAGCCT TGGGCGTGGC GGGGGCAACA 
ATCAGCAACC TCTGGAGCTG GCACCTCCTG GAAGAGGCCC TGCTCCACCC AGTTGCCGTC 
TACCAGCCGG GCATAGGGTA CATCCCCGTA GGCATAACCC AGGTGGTTCT CTTCGCAGGC 
CTCGCCTTCT ACTTCCTCCG CCACCGACTA GCCGGGTGGG CCGACAAGCT CGCCCAGCCC 
ATAACCGTCG CCGTGTTGAT AGCCGTGATG GGGTTCTCGT CCAGCGTAAT ATCGGCGATA 
GTGGCCTCCG CCATTATGGC AGAGCTCCTT GCCTTCGCCA GGGCGCCCCA CGCCTACAAG 
GCAAAGGCCG CTGTATATGC GGCGTACGCC ATCGGCGCGG GCGCCGCCCT CCTCCCCATC 
GGCGAGCCCC TCTCGACGAT TGCAGTGGCG AAGCTCAAGG CGCACTTCTT CTACCTAGTA 
GACGTGTTGA TCGACGCCGT GGCCCTGGTG GTGATCTTCT TCGCGGCCTA CACCTATCTG 
CAACTCAAGC GCTACAAGCC GGCGGAGGCG GAGATAATCC CCTACGAGCC GGAGCTGAAA 
GAGGTGCCCC TTAGAGCCGT CAAGATCTTC ATCTTCATCT TCGCCTTGAC CATACTCGGC 
GAGTTCTTTA AACCCTTAGC CAACGCCGCC GCGGCGCTCG GCAAAGAGCT CCTCTACATA 
TTCGGCGCAA TCTCGGCAGT GGCTGACAAC GCGACGCTTG TAGCCGCCCT CGTCAGCCCA 
GAAATGGCCG CCGAGGTCCT AAGAGCCTTC CTCATCTCGC TGGTCATTTC GGGAGGCTTC 
ACCGTCCCCG GCAACGTCCC CAACATAGTG TTCGCAAGCG TCTTAAAAAT AGGATTCAAG 
GAGTGGATAA AGCTGGCCCT CCCCATAGGA GTTGCCATAT TCGCCGCGAT GGGGGCATAC 
GTCCTATTCA TCGTGCCTCA CCCGCCACTC GCTTAG

Protein sequence

MDLLLQIIFL VALVAGPVLS KRIEHNIEIY FLALGVAGAT ISNLWSWHLL EEALLHPVAV 
YQPGIGYIPV GITQVVLFAG LAFYFLRHRL AGWADKLAQP ITVAVLIAVM GFSSSVISAI 
VASAIMAELL AFARAPHAYK AKAAVYAAYA IGAGAALLPI GEPLSTIAVA KLKAHFFYLV 
DVLIDAVALV VIFFAAYTYL QLKRYKPAEA EIIPYEPELK EVPLRAVKIF IFIFALTILG 
EFFKPLANAA AALGKELLYI FGAISAVADN ATLVAALVSP EMAAEVLRAF LISLVISGGF 
TVPGNVPNIV FASVLKIGFK EWIKLALPIG VAIFAAMGAY VLFIVPHPPL A