Gene Pars_1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1761
Symbol
ID	5055271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1579332
End bp	1580291
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	52%
IMG OID	640469304
Product	inner-membrane translocator
Protein accession	YP_001153964
Protein GI	145591962
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0559] Branched-chain amino acid ABC-type transport system, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.328925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.000752559
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATATAT TAAGTGGGGT GGATTATCAA ACACTTTTTA GGGCGATTAT ACTTTCTAAT 
ATATACGCAC TTATGGCGTT GGGGCTTAAC CTTACCTACA TCACTACTAA GATTCCTTCT 
TTTGCCCACG GTGATCTAGC CACGATAGGC GCATATACCA GCTACTTAAT CCTCACCTTT 
TTAGTTATCC CTCTTGGCCT GCCTGCCAAT GTATACGCCA CGTTTCCCAT AGCGGCTCTC 
GTGGCCGGTG CTACGGCGTG GCTGACGTAC GTGACTGTGT TTAGGCCAAT GATCAGGCGG 
GGGGCTAGCA TCACGTCGTT GATGATAGCC TCGTTCGGTA TCCACTACGT CCTTTTTGCC 
ATTGTGGCGA TAATAGCGGA CTATGTACAG AATACGTATA AGGTGCTTAG TAGGAATATT 
CTGCTGTCGC GTTGGGAGTA CGTGTGGCCC GGTACGGATT TCTTAACATC GTCACTGATA 
AACACAACCA TCGCAGTCGC GGTGGTGACC GCCCTCCTCT ACCTACTCCT CTACAAGACG 
CGTTACGGCA TAGTGATGCG GGCTAGTATA GACAACCTCT ACTTGGCCAG GGCGGTGGGG 
ATAAACGTTG AGAGAGTTTT CGCAGTGGCT TGGATTCTCA TTGGGGCCGT CACGGGGATA 
GCCGGGGTCT ACTTAGCTAT GTTTTACACA ATGACAGAAG AGCTTGGGTG GCTGAGATTG 
GCGCTTGTCT TCGTCGCCTC TGTAGTCGGA GGACTTTCCA ACATATACGG AGCAGTTTTG 
GGCGGCTACG TGGTGGGGCT AAGCACCGTG CTGGGCGCCG CGTATATCCT CAGACCTCTG 
GGAGTTCCCA CAGAGTTCCA GCTGGCGATC CCCTTCGCCT TCGTAATTGC GATATTGCTA 
TTCGCGCCGC AGGGACTTGC CGGCGTGATA TCTAACTTGG TACAGCGCGG GAGGAAATGA

Protein sequence

MDILSGVDYQ TLFRAIILSN IYALMALGLN LTYITTKIPS FAHGDLATIG AYTSYLILTF 
LVIPLGLPAN VYATFPIAAL VAGATAWLTY VTVFRPMIRR GASITSLMIA SFGIHYVLFA 
IVAIIADYVQ NTYKVLSRNI LLSRWEYVWP GTDFLTSSLI NTTIAVAVVT ALLYLLLYKT 
RYGIVMRASI DNLYLARAVG INVERVFAVA WILIGAVTGI AGVYLAMFYT MTEELGWLRL 
ALVFVASVVG GLSNIYGAVL GGYVVGLSTV LGAAYILRPL GVPTEFQLAI PFAFVIAILL 
FAPQGLAGVI SNLVQRGRK