Gene Rpal_4650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4650
Symbol
ID	6412336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5012356
End bp	5013558
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	61%
IMG OID	642714529
Product	putative ABC transporter (substrate-binding protein); putative branched-chain amino acid transporter
Protein accession	YP_001993616
Protein GI	192293011
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATGA CGACCGCGCG GGCATTGCTC GCCGTATCAC TCGGTCTGAT CGGCACGGCC 
GCATCGGCCG AGGATCAACC GGGGATCACC CAGACCGAAA TCCGCATCGG GCAGACCATG 
CCTTATAGCG GGCCGGTTTC GGCATTCGGG ATTCTCGGCA AGGGCGAACT CGCTTACTTC 
AAGATGGTCA ATGATCGCGG CGGCATCAAC GGCCGCAAGA TCAACCTGAT CTCGCTCGAC 
GACGGCTACG TGCCGCCGAA GACGGTGGAG CAGACCAGAC GACTGGTGGA AAGCGACGAA 
GTCTCGTTCA TCTTCTCCAC CATGGGCACC GCGCACAACA CCGCGATCGC CAAATATCTG 
CAAAACAAGA AGGTGCCGCA GCTGTTCGTC GCTTCCGGCG CCTCCAAATT CGGCGACATC 
TCGCAGTACC CGCTCGCCAT CATGGGCATC ATGGCGCCGT TCCGCAACGA AGCGAGAATG 
TACGCCCGCT ACGCCCTGGA GAAGAAGCCG GACGCCACCT TTGCGGTGAT CGCACAGAAC 
GACGATTTCG GCCGCGACTA TCTTGCCGGG CTGCGCGACG TGCTCGGCGA GCGCTACGAC 
AAGGCGGTGA CCGCAAGCAT GTACGAAGTC ACCGACCCGA CCATCGACTC GCAGATCGTC 
AGCCTGAAAG CCAGCGGCGC CGATGCGCTG ATCATCGCCG CGACACCAAA GTTCGCCGCG 
CAGGCGATCC GCAAGACGTT CGAGATCGGC TGGAAGCCGA TGAGATTCCT GTCCAACGTC 
TCGGTGTGGA TGTCGTCGGT GATGGAGCCG GCCGGCGTCG ATGCCGGCGT CGGCATCATC 
TCGACTGCCT ACGTCAAAGA TCCGCTCGAT CCCGCCTGGG CCAACGATCC CGGCGTGAAG 
GATTGGCGAG CCTACATGCA GAAGTACATC CCGGACGGAG ACTTGCGCGA TTCCAACTAC 
GTCAACGGCT ACAACAACGG CATGGTTCTC GAACATGTGC TGAAGGCGGC CGGCAACGAT 
CTCAGCCGCG ACAACATCAT GAAGCAGGCG CTCTCGATCA AAGAGCTGGA GTTGCCGATG 
CTGCTGCCGG GCATCAAGGT TCAGACTGCG GCCGACGACC ACCTTCCGAT CGAGCAGGTC 
CAGTTCATGC GCTTCACCGG CAAGCAATGG GAACGGTTCG GAGAGGTGCG CTCGACCAAG 
TAA

Protein sequence

MRMTTARALL AVSLGLIGTA ASAEDQPGIT QTEIRIGQTM PYSGPVSAFG ILGKGELAYF 
KMVNDRGGIN GRKINLISLD DGYVPPKTVE QTRRLVESDE VSFIFSTMGT AHNTAIAKYL 
QNKKVPQLFV ASGASKFGDI SQYPLAIMGI MAPFRNEARM YARYALEKKP DATFAVIAQN 
DDFGRDYLAG LRDVLGERYD KAVTASMYEV TDPTIDSQIV SLKASGADAL IIAATPKFAA 
QAIRKTFEIG WKPMRFLSNV SVWMSSVMEP AGVDAGVGII STAYVKDPLD PAWANDPGVK 
DWRAYMQKYI PDGDLRDSNY VNGYNNGMVL EHVLKAAGND LSRDNIMKQA LSIKELELPM 
LLPGIKVQTA ADDHLPIEQV QFMRFTGKQW ERFGEVRSTK