Gene Pars_1590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1590
Symbol
ID	5054937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1439658
End bp	1440881
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	57%
IMG OID	640469131
Product	basic membrane lipoprotein
Protein accession	YP_001153796
Protein GI	145591794
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0787459
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACAA AACTTTTGGT AGCTCTAGTC GTTGTAATAA TCGCAGTGGC CGCCGCGGCG 
CTTCTACTAC TCCAGCAACC CCAGCAGGCG TCCACCCAGA CTACCCAAAC TCCAAGCAAG 
GGCAATATAT ATGTAATATA CGATATCGGA GGTAGAGGCG ACCTCTCTTT TAACGACATG 
GCTTACCTAG GCGCCTCCAA AGCCGCCAAG GATTTCGGCC TGGGGCTAAA GGAGGTGCAG 
AGCAAAACGC AGGACGACTA CGTGCCTAAC CTGCGCGCGG CCGCCAGATC CGGCGATGCG 
GCGTTAGTCG TCGCAGTGGG GTTCCTCATG ACCGATGCCG TGAAGCAAGT CTCCCAAGAG 
TACCCCAACG CCAAGTTCGC CATAATTGAT GGCTACATTC CCGACCGGCC GAACGTGCTC 
TCCGTCCTCT ACAGAGAGAA CGAGGGATCC GCCCTAGTTG GCGCACTGGC CGCGTTAACA 
GCCTACCACT TCAACTGCAC CAAGGTCGGC ATAGTCCTAG GCATGGAAAT ACCCGTCTTG 
TGGAAATTCG AAATTGGTTA CGCCTACGGG GTGAGGTGGG CCGAGCGCTA CCTAAGCCAG 
AAGTTTGGGA AGAACGTCAA GTTCGACGTG CTCTACATCT ACACAGGCTC TTTCAACGAC 
CCGGCCAAGG GCAAGCAGGC AGCTGAGGTA ATGCTTGCAC AAGGCGTATG TGTAATATAT 
CAAGCCGCAG GCGCCACTGG ACTGGGAGTG TTTGAAGCCG TGGCCGAGGC AGGGAAGAAG 
GCTGGGAGGA ATATGGGCCC GCCGTTTGCC ATCGGCGTAG ACGCCGACCA AGACTACCTA 
AAGCCAGGCT TCATCCTTGC CTCTATGATG AAGAGGGTCG ACGTGGGCGT CTACACAGCC 
GCGAAGATGG CCGTAGAGGG CAATTTCAAG GGCGGCGTGC TTGAGCTTGG CTTAAAGGAG 
GGCGGGGTGT CGGTAAGCAC CCTGAGCGAC TTGCGGCAGT TTATAGAAAT AGGCGTAAGC 
GCCGGGGCCG TGAGGAGGGA GGACGCCGAT AAGATTGTGG CAACTGTAAG CGATATGAGG 
TCCAAGATAC CGTCGTGGAT ATGGGAGGCG GTTGATCAGC TTAAGCAAGA CATCATAGCC 
GGCAGGGAGA AGGTGCCTCT GCCCACCGCC CAGGACCAGG TGGTGCAACT TAGGAAAGAG 
TTGGGCCTCG GCGTCGCCGG GTAA

Protein sequence

MNTKLLVALV VVIIAVAAAA LLLLQQPQQA STQTTQTPSK GNIYVIYDIG GRGDLSFNDM 
AYLGASKAAK DFGLGLKEVQ SKTQDDYVPN LRAAARSGDA ALVVAVGFLM TDAVKQVSQE 
YPNAKFAIID GYIPDRPNVL SVLYRENEGS ALVGALAALT AYHFNCTKVG IVLGMEIPVL 
WKFEIGYAYG VRWAERYLSQ KFGKNVKFDV LYIYTGSFND PAKGKQAAEV MLAQGVCVIY 
QAAGATGLGV FEAVAEAGKK AGRNMGPPFA IGVDADQDYL KPGFILASMM KRVDVGVYTA 
AKMAVEGNFK GGVLELGLKE GGVSVSTLSD LRQFIEIGVS AGAVRREDAD KIVATVSDMR 
SKIPSWIWEA VDQLKQDIIA GREKVPLPTA QDQVVQLRKE LGLGVAG