Gene Pars_1762 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1762
Symbol
ID	5055280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1580401
End bp	1581750
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	56%
IMG OID	640469305
Product	extracellular ligand-binding receptor
Protein accession	YP_001153965
Protein GI	145591963
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.304418
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.000873526
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCTCCA AAACACTGTA TATAGGACTA GCAATAGCAG TAGTATTAAT AGTAGTAGTT 
GCGGTACTTC TATCCCAAGG CGGTGGGCAA ACAACTCCCA CGCAGCCACC CAAACAATCG 
CCAACAGTAA CAACCTCTAC CCCTGGCGGT GGGCAAACGA CCTCTACACA GCAAACTACG 
CCAACTCAAG CGGTTAAAAC TGTGTATATA GGCGCCGCCC TTCCGCTGAC CGGCGGCTTG 
CAGTCTTATG GTGTTGGTGT GAAGAACGCT GTGGAGATGG CTGTGGAGGA TGCTAATAAG 
ATGTGTGGGG GGAAGGTTAA GTTTGAGCTT CTGGTGGAGG ATACCGGTAC AAGCCCGACG 
CAAGCTTTGC AGAAGGTGCA GACGCTGTAT TCCAAGGGCG CTAGGCTAAT CGTAGGCCCA 
ATGGCAAGCG GCGAGGTCAG TGCCAGTAAG TCTTTTGCAG ACCAGAACCA CGTGATTATC 
TTCTCGCCTT CCTCTACGTC TCCGCTTTTG GCTATACCCA ACGACTGGGT ATACAGAATC 
GTGCCGACAG ACTTCGCCCA AGCCGCCGCC ATAGCCGCGC TGATGCAGAA GCTGGGCATT 
AAAAAGGCCG TCATCCTCTA CCGCAACGAC GCCTGGGGGG TAGGCCTCAA AGACGCAATA 
ACCAACGAGT CTAAGAAGCT GGGAATACAG ATAGCCGCCG CGGAGGGCTA CGACCCAGAC 
CCCAAGGCCT TCCCCACCGC GGTGCCCCAA GCAGTGAACA AACTATCCAG CGCCTTAGGC 
CAACCCAGCC CCGACGTCGC TTTGATACTA GTAACCTTTG AGGACGATGG CCTTGTGGCT 
GTTCAATCCG CCGCAGGCGA CCCGGTGTTG GGGAGGATTA GGTGGATTAG TACAGACGGC 
ATTGCTTACA GCGACGCGTT GATTAAGCAG GTGGGTAAAG AGATGGCGGC GGCGAAGATG 
TTGGGCACAA TTGCCGGGCC GAACCCCGCC GATCCGAAGT ACCAGGAGTT TAAGCAGAGG 
TACAAGGCCA AGTACGGCAA GGACCCAGTG GCCTACGACC CCTACGGCTA CGACGCCGCC 
ATGTTGCTAA TGCAGATCGT CTGCCAGCTG GGGACAGAGG ACCCAGACAA GGTGCGCGCA 
ACGCTTGAGC AGTGGGGCAG AGACGGCACC TACCAAGGCG TCACCGGGAG AGTATACCTA 
GACGCCGCCG GCGACAGGGC ATACCCCAAC TACATCATAT GGGGCGTAGT AACCGAGGGC 
GGACAGCCAA AATACGTAGA CGCCGCCTAC TACTATGGCG CAGACAAGAA AATAGAGGTA 
TACGACGCAG GCAAGCCACT ATTCCAATAG

Protein sequence

MASKTLYIGL AIAVVLIVVV AVLLSQGGGQ TTPTQPPKQS PTVTTSTPGG GQTTSTQQTT 
PTQAVKTVYI GAALPLTGGL QSYGVGVKNA VEMAVEDANK MCGGKVKFEL LVEDTGTSPT 
QALQKVQTLY SKGARLIVGP MASGEVSASK SFADQNHVII FSPSSTSPLL AIPNDWVYRI 
VPTDFAQAAA IAALMQKLGI KKAVILYRND AWGVGLKDAI TNESKKLGIQ IAAAEGYDPD 
PKAFPTAVPQ AVNKLSSALG QPSPDVALIL VTFEDDGLVA VQSAAGDPVL GRIRWISTDG 
IAYSDALIKQ VGKEMAAAKM LGTIAGPNPA DPKYQEFKQR YKAKYGKDPV AYDPYGYDAA 
MLLMQIVCQL GTEDPDKVRA TLEQWGRDGT YQGVTGRVYL DAAGDRAYPN YIIWGVVTEG 
GQPKYVDAAY YYGADKKIEV YDAGKPLFQ