Gene Pars_1591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1591
Symbol
ID	5054901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1440881
End bp	1442317
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	55%
IMG OID	640469132
Product	ABC transporter related
Protein accession	YP_001153797
Protein GI	145591795
COG category	[R] General function prediction only
COG ID	[COG3845] ABC-type uncharacterized transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.243746
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGTTT CTCTCAAGGA AATTCACAAA ATTTTTTCAG ACGGAACCCA CGCCTTGCGT 
GGGGTTTCTC TTGATATCTA TCCAGGGGAG GTTTTGGCAT TGCTAGGCGA GAACGGCGCA 
GGAAAGACAA CGCTGATGAA GATCCTTGCG GGCATCTACA AGCCCACATC TGGGGAGATA 
TACATCGACG GGAAAAAGGC TAGGTTCAAA AACGCCCGGG AGGCTTTGCG CCTCGGCATA 
GCCATGGTGC ACCAACACCT TTCCCTCATA CCAGGGCTTA CCGCACTTGA GAATATCGCC 
GTGCTGGAGG GGGCGGGCCT AGGGCCTATA TCAGGAGAGG TGAGGAAGAG GGCAGAGGCC 
ATCGCGGCGG GGCTGGGTTT TGAAATTGAC TGGGATAGAG ACGTGGAGGA GCTCCCCCTA 
GGCGTGAGGC AGAGAGTGGA AATCGTGAAG GCGCTTTATT GGGGCGCCGA CTTGCTAATC 
CTCGACGAGC CCACCACAGT CTTGTCCCCT CCCGAGGTGA AGTCCCTTTT CCAAGTAGTT 
AAGAGCCTCA AACAAAAGGG GAAGTCCATT GTATATATCA CACATAAAAT ACCAGAAGTA 
CTCGAGGTGG CTGATAGGGT CGCCGTGCTG AGACGTGGGG TAAAAGTCGC CGAGTTCAAG 
CCACCGTACG ACGCCAAGAA GCTGGTGGAG GCTATGGTAG GCGAGCTTAA AACAGAGAGC 
GTAGAGAGGT CGGGAGAGAC CGGCGAGAGG CCGGTGCTAG AGGTGGTGGA TCTCTGGGTC 
TACGAAGGGG GGAGAGCCGT GGTCCAGGGC GTTAACCTGG TCGTGAGGGA GAGCGAAATT 
TTAGCCGTAG TGGGGGTAGA GGGTAACGGA CAGGAGCACT TGGTGGAAGC CGTGGTAGGG 
CTGAGGAAGT ACAAGGGTGT TGTGAAAATC CATGGGGGCT ACGCATATAT ACCTGACGAC 
AGGCATAGAA AGGCCCTAGT CTTGGAAAAG ACGCTTGTGG AGAACGCGAT TTTGGGGAAG 
GAGGCCGAGT TCTCTAGACG CGGCCTCATC TCTTGGAAAG ACGCAGAGAG ATTTACGGCA 
AAACTAGTGG AGGAGTTCGG AATCGTGACT CCTGGGCCGT GGGCTTTCGT GAAGCAACTT 
TCAGGCGGCA ACCAGCAGAA GCTTGTAGTG GGCAGGGAGC TGAGCAGAAA CGCCAAGCTT 
ATAGTTGCAC ATCAGCCCAC GAGGGGGCTC GACGTGGCGA CAACGGAGTA TGTACAACAT 
TTGTTGTTAA AGGCGAGGAA CAACGGCGCG GGGGTGTTGC TCGTCACAAG TGACCTAGAC 
GAGGCATATA AGCTGGCCGA CACAATCGCC GTGATGTATC GCGGTAGGAT AGTCGCCATA 
GGGTCTGTGG GAGAGATGGC TCTTGACGTA GTAGGGAAGA AGATGGCAGG GCTATGA

Protein sequence

MQVSLKEIHK IFSDGTHALR GVSLDIYPGE VLALLGENGA GKTTLMKILA GIYKPTSGEI 
YIDGKKARFK NAREALRLGI AMVHQHLSLI PGLTALENIA VLEGAGLGPI SGEVRKRAEA 
IAAGLGFEID WDRDVEELPL GVRQRVEIVK ALYWGADLLI LDEPTTVLSP PEVKSLFQVV 
KSLKQKGKSI VYITHKIPEV LEVADRVAVL RRGVKVAEFK PPYDAKKLVE AMVGELKTES 
VERSGETGER PVLEVVDLWV YEGGRAVVQG VNLVVRESEI LAVVGVEGNG QEHLVEAVVG 
LRKYKGVVKI HGGYAYIPDD RHRKALVLEK TLVENAILGK EAEFSRRGLI SWKDAERFTA 
KLVEEFGIVT PGPWAFVKQL SGGNQQKLVV GRELSRNAKL IVAHQPTRGL DVATTEYVQH 
LLLKARNNGA GVLLVTSDLD EAYKLADTIA VMYRGRIVAI GSVGEMALDV VGKKMAGL