Gene Pars_1496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1496
Symbol
ID	5054986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1353768
End bp	1354781
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	54%
IMG OID	640469038
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001153704
Protein GI	145591702
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0601] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.992492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAGTC TCTTGAGATA TGCGGCGTAT CGCGTGCTCT TAGCTATACC AACCCTTATT 
ATCCTTCTCA CAGTTGTATT CTTCATTTTG AGAGTGATCC CAGGAAACCC TATTGTGGCT 
ATGGTGGGGA TGAAGGCGCC TCCGGAGTAT GTAGAACAGC TAATAAAGGA GGCCGGCCTC 
GATAAGCCTC TGCCAGTCCA GTACGTGGAG TATATGGTCC AAGTGTTTAC GGGTAACTTG 
GGGAGGAGCC TGATCTTTGG CAGGAGGGAG GTCGCCGCCG AGATTATGGA CAGGCTCCCC 
GCCACAGTGG AGCTGGCTGT TTCAGCCTTT GTGGTGAGCG TTCTGTTGGG CCACGTTTTC 
GGCTTCCTGG CGGCGAGATA CGGCGGGAGG GTAGATGCAG GCGCGAGGCT ATATGCCATG 
GTCTCCTATG TGTTGTTTAT TCCATTCATA GGGCTGGCAC TACAGCTCGT ATTCGCCGTG 
TGGCTTGGCT GGTTCCCCGT AGCTGGGAGA ATTACCCCGG GTCTCGAGCC GCCGAGAATT 
ACGGGCCTGT ACCTGCTAGA CTCCCTTCTG GCGGGGCGCC TAGACTCGTT TATAGACGCC 
TTGAGCCATA TTGTACTACC CTCTGTCACG CTGGGTCTTG TCCTGTCTGG GGTATTTGTG 
AGACTTATCA GGAACAACAT GGTTAAAACC CTCGGCGAGG ATTTCATATC TGCATATAGG 
GCTATGGGCT TCAGCGAGAG GGCTGTGTTG TGGAAGGCAT ACCGCGTCGC CATAGTGCCT 
ACCGTTACTA TGATGGGGTT GCAGCTGGCG TTGTTGTTGC AAGGCGCCGT GCTTACAGAG 
ACCACCTTCT CGTGGCCCGG GCTGGGCACC TTGTTGTTAG AACGAATACA ATACCTCGAC 
TACACTACTG TGCAAGGCGC CGTCGTCGTG TTTGTGATAA TTGTTGTGGT GCTGAATGTG 
GCCGCGGATC TGATAAACGC GGTTCTAGAT CCCAGAGTTA GGAGGGGGCT ATGA

Protein sequence

MASLLRYAAY RVLLAIPTLI ILLTVVFFIL RVIPGNPIVA MVGMKAPPEY VEQLIKEAGL 
DKPLPVQYVE YMVQVFTGNL GRSLIFGRRE VAAEIMDRLP ATVELAVSAF VVSVLLGHVF 
GFLAARYGGR VDAGARLYAM VSYVLFIPFI GLALQLVFAV WLGWFPVAGR ITPGLEPPRI 
TGLYLLDSLL AGRLDSFIDA LSHIVLPSVT LGLVLSGVFV RLIRNNMVKT LGEDFISAYR 
AMGFSERAVL WKAYRVAIVP TVTMMGLQLA LLLQGAVLTE TTFSWPGLGT LLLERIQYLD 
YTTVQGAVVV FVIIVVVLNV AADLINAVLD PRVRRGL