Gene Rpal_1598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1598
Symbol
ID	6409255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1709871
End bp	1711115
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	63%
IMG OID	642711487
Product	Extracellular ligand-binding receptor
Protein accession	YP_001990602
Protein GI	192289997
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCCATTT CCCGACGTTC ATTCGGAATC GGTGCGACTG GTCTGGTGCT CGGAACGGTC 
GCAGCGCCTT GGGTTCGCAA CGCCAGCGCA GAGCCGGCCC CGATCAAAAT CGGCGTGATC 
AATTCGATGA GCGGCGGTCT GTCGGCCTAC GCGCAGGAAG GCAAGCCGGC GTTCGATTAC 
ATCATCGATC AGATCAACAA GAGCGGCGGC ATCAAGAGCA AGGACGGCGC CAAGATTCAG 
TTGCTGCAGG CCGACGACGC CAGCCAGCCG GCGCGGACCG CCACCGAAGC GCGCCGCCTG 
ATCACCGAAG AAAAGGTGCC GCTGCTGACC GGCACCATCC TCAGCGCACA GATGCTGGCG 
CTGACGCCGG TGCTCGACGA ATTGAAGGTG CCGACTCTGT CGATCTGGGC TGGCGGCGCC 
AGGTCGAGCT ACATGTTCTC GCTCGGTTAT CCGTATGACC GCGGCTACGC GCAATCGATG 
CACGATTTCA TCGTGTCGCT GCGCGACAAC GATAAGTTCC CGATCAAGAC CGCGGTGATG 
TGCTACTCGA ACTACGAGGC CGGCCAGCAG GTCAACAAGT TCCTGATCGA GAAGCTGAAG 
GCCAGCGGCA TCGAGGTGAT CGGCGAAGCG CCGCTCGACA CCAAGGCGCA GGACCAGACC 
TCGGCGATGA TCCGCATCCG CTCGCTGAAG CCGGACGTCG TCACCGGACT GGTGACACCG 
CGCGACGGCA TTCTGATGCA TCAGGCGCGC TACAACCTCA ACTATCAGGG CAGCCTGTTC 
GTCGGCGGCA CCGGCGGTTA TTCGGACCTG TCGCTGTGGA AGGATCTCGG CCCCGAGATC 
GGCAAGGCGG TGCTGACGCG CAACCTGTTC GGCATGACCG GCTTCAGCGC CGGCGCCAAG 
ATGGACTCAA TGCAGAAGAT CATCACCGAG CTGCGCGACG TTGCCAAGCT CGAGCGCATC 
GGCCAGGGCG CGGTTCAGTA TGCCCAGGGC GCGCGCGTGC TGCAGCAGGT GCTTGAGAAC 
GCCAAGTCGC TGGAGCCGGA CGCGCTGCTC GAGGCGTTCA AGAGTTTCAA GATCCCGTTC 
GGCGATCCGC ATCTCTACAT CGCCAAGCCG AAGGGCCTGC AGTTCGCCGA GGACCGGCTG 
CTGACCGACG GTTCAGCGAT GATGATCCAG TGGATGCCGG ATCAGAGCCA GGAGGTCGTG 
TTCCCGAAGG AGTTCGCACA GGCAGCTCCG CGTCCCAAGA GCTGA

Protein sequence

MSISRRSFGI GATGLVLGTV AAPWVRNASA EPAPIKIGVI NSMSGGLSAY AQEGKPAFDY 
IIDQINKSGG IKSKDGAKIQ LLQADDASQP ARTATEARRL ITEEKVPLLT GTILSAQMLA 
LTPVLDELKV PTLSIWAGGA RSSYMFSLGY PYDRGYAQSM HDFIVSLRDN DKFPIKTAVM 
CYSNYEAGQQ VNKFLIEKLK ASGIEVIGEA PLDTKAQDQT SAMIRIRSLK PDVVTGLVTP 
RDGILMHQAR YNLNYQGSLF VGGTGGYSDL SLWKDLGPEI GKAVLTRNLF GMTGFSAGAK 
MDSMQKIITE LRDVAKLERI GQGAVQYAQG ARVLQQVLEN AKSLEPDALL EAFKSFKIPF 
GDPHLYIAKP KGLQFAEDRL LTDGSAMMIQ WMPDQSQEVV FPKEFAQAAP RPKS