Gene RPB_1254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1254
Symbol
ID	3909188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1435621
End bp	1436772
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	64%
IMG OID	637883148
Product	inner-membrane translocator
Protein accession	YP_484875
Protein GI	86748379
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4177] ABC-type branched-chain amino acid transport system, permease component
TIGRFAM ID	[TIGR03408] urea ABC transporter, permease protein UrtC

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.27241
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGCC CGCGCTTTCT CAGCCGCTCC GACCTGATCG GTCTCGCCGC GCTCGCTCTG 
CTCCTGGTCG TGATCCTGCC GCTGTCGCTG GATGTGTTCC GCCTCAACCT GGTGGCGAAG 
TATCTGACCT ACGCCTTCGT GGCGCTCGGT CTGGTGCTGT GCTGGGGCTT CGGCGGCATC 
TTGAGCCTCG GGCAGGGGGT GTTCTTCGGC CTCGGCGGCT ACGGCATGGC GATGTATCTG 
AAGCTGGAAG CCTCCAGCGT CGCCAACACC AAGATCCAGT CCACGCCCGG CATCCCGGAT 
TTCATGGACT GGAACCAGAT CACGCAATTG CCGCTGTTCT GGCAGCCGTT CCACAGCCTG 
ACGCTGACGA TCCTCGCGAT CCTGATCGTG CCGACGCTGT TCGCCTATCT GATCGGCGCG 
GCGATGTTCA AGCGGCGCGT CGGCGGCGTG TATTTCGCCA TCATCACCCA GGCGATCGCC 
GCGATCCTCA CCATCCTGAT CATCGGCCAG CAGGGCTACA CCGGCGGCAT CAACGGCATC 
ACCGATCTGC GCACGCTGAA GGGCTGGGAC ATCCGTCCCG ACCACGCCAA GGTGGTGCTT 
TACTTCGTCG AGGTGGCGTT CCTGTTCGGC TGCATCCTGC TGGCGCTGTT CGTGCGCCAC 
TCCAAGCTCG GCCGCATCCT GGTGGCGATG CGCGAGAAGG AGGACCGGGT GCGGTTCTCC 
GGCTACAGCG TCGCCAATTT CAAGATCTTC GCGTTCTGCC TGGCGGCGAT GTTCGCGGCG 
ATCGGCGGCG CGATGTTCAC GCTCAATGTC GGGTTCATGT CGCCGTCCTT CGTCGGCATC 
GTGCCGTCGA TCGAGATGGT GATTTACACC GCGGTCGGCG GCCGGCTGTC GATCTTCGGC 
GCGATCTACG GGACGCTGCT GGTCAATTTC GCCAAGACCA GCCTGTCGGA ATCCTTCCCG 
CAGCTCTGGT TGTTCGGGCT CGGCGCGCTG TTCATCGCGG TGGTGCTGAT CTTCCCGAAC 
GGACTCGCCG GGATCTGGCG CGACCACGTC CAGCCGCTGA TCGACAAGGT CCTCAACAGG 
CGCAAATCCG GCTCGGATCA CACCAGCGGC AAGACGCTCG GCCCGGTCGC CGGCGGCGCT 
CCGGCGGAAT AG

Protein sequence

MESPRFLSRS DLIGLAALAL LLVVILPLSL DVFRLNLVAK YLTYAFVALG LVLCWGFGGI 
LSLGQGVFFG LGGYGMAMYL KLEASSVANT KIQSTPGIPD FMDWNQITQL PLFWQPFHSL 
TLTILAILIV PTLFAYLIGA AMFKRRVGGV YFAIITQAIA AILTILIIGQ QGYTGGINGI 
TDLRTLKGWD IRPDHAKVVL YFVEVAFLFG CILLALFVRH SKLGRILVAM REKEDRVRFS 
GYSVANFKIF AFCLAAMFAA IGGAMFTLNV GFMSPSFVGI VPSIEMVIYT AVGGRLSIFG 
AIYGTLLVNF AKTSLSESFP QLWLFGLGAL FIAVVLIFPN GLAGIWRDHV QPLIDKVLNR 
RKSGSDHTSG KTLGPVAGGA PAE