Gene RPD_0052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0052
Symbol
ID	4020506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	64609
End bp	65649
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	63%
IMG OID	637960228
Product	inner-membrane translocator
Protein accession	YP_567193
Protein GI	91974534
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4177] ABC-type branched-chain amino acid transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.460999
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCAT TGATCTCGAA CCCCACCGCT CGTCGCACGC CGATCCGGAT GTTCGTCGGC 
CTGTTGGCGC TGTTCGCGGT GCTGCCCTGG CTGCTGACGG CGATCGGCCT CGGCGTCAAT 
CTGGCCACCG AAGTGCTGAT CATCGCGCTG TTCGCGATGA GCTACAACAT TCTGCTGGGC 
ACCACCGGCC TCGCATCTTT CGGCCACGCC GCATTCTTCG GCTCGGGCGC CTATGCGGTC 
GGAATCCTGC AGCGCTATGG CCTGAATGGA ATCGTCATCA GCCTGGCCGC AGCGATCGCC 
GCCGGGCTGG TCGCGTCACT GTTCGTCGGC CTGCTTGTCA GAAAGAAGCG CGGAATCTAT 
TTCGGCCTGC TGACGCTGTC GTTCGGCCAG ATGTTCTACA TCGTGGCGCT GCGCTGGGAT 
GAGCTGACCG GCGGCGAGAC CGGGCTGACG GGCCTGAAGC GGCCCGCGCC GTTCGGCCTC 
GATCTCAGCA GCCATATCAA TTTCTACTAC TTCACGCTGG CGATCTTCAT GGTCGCGCTG 
TGGCTGATCT GGCGGATCAC CAATTCGCCG TTCGGCAGTC TGCTGACGGC GATCAAGAGC 
AACGAGGTCC GCACCCAGTA TCTCGGCTAC GACACCGCGC TCTACAAGCT GGCCGCGATC 
GTCATCTCCG GATCGTTCTC CGGACTCGCC GGCGGCCTCT ATGCGTGGTT CCAGTACGCG 
GCCTATCCGC AGAACCTGTT CTGGATCGAA TCCGGCAACA TCGTCATCCT GACGTTGCTC 
GGCGGCGGCC TCTCCAGCTT CTTCGGCCCG ATCCTCGGCG CCGCGGTGTT CGTCGGCGCG 
CAGGACCTGA TCAGCGGCTA CACCCAGCAC TGGATGTTCT TCTTCGGGCT GATCTTCATC 
GTCGTGGTCA CGACGTTCCC CAACGGCCTG CCGGAAGCCT TCGCGAAATT CGTCGCTTCG 
GCGCGGCGGA GGTTCGGCCG CACGGCCGGG GAGACCGTGA TCTCTGCGCA ATCCTCATCG 
CGCTACGGAG CGGACCAATG A

Protein sequence

MNALISNPTA RRTPIRMFVG LLALFAVLPW LLTAIGLGVN LATEVLIIAL FAMSYNILLG 
TTGLASFGHA AFFGSGAYAV GILQRYGLNG IVISLAAAIA AGLVASLFVG LLVRKKRGIY 
FGLLTLSFGQ MFYIVALRWD ELTGGETGLT GLKRPAPFGL DLSSHINFYY FTLAIFMVAL 
WLIWRITNSP FGSLLTAIKS NEVRTQYLGY DTALYKLAAI VISGSFSGLA GGLYAWFQYA 
AYPQNLFWIE SGNIVILTLL GGGLSSFFGP ILGAAVFVGA QDLISGYTQH WMFFFGLIFI 
VVVTTFPNGL PEAFAKFVAS ARRRFGRTAG ETVISAQSSS RYGADQ