Gene RPD_3900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3900
Symbol
ID	4024416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4337380
End bp	4338405
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	67%
IMG OID	637964104
Product	hypothetical protein
Protein accession	YP_571022
Protein GI	91978363
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCGGCG AAAGGCGGCT CACGCGCGCG GCCCGAGCAT GGCCTGCATT CCGCGGCGGC 
TCTTTGCCGG GGCTCGTTTT TCAGGCATGG CTGCGCCTCA CTCGAACAGA TCGCCGCCGC 
TTGATCTCCC TGTTCCGCAC GGCTTTCGGC TGGCTCGCTC ACCAGCCCTA TCTGCTGCTC 
AGCCTGACCT CGCTGTTCTG GGCCGGCAAC ATCGTGCTCG CACGCGCCGT CGCCGGCCAT 
GTGCCGCCGG TGACGCTGTC CTGCGTGCGC TGGATCGGCG CGATGCTGTT GCTGCTGCCG 
TTCGCCTGGC CGCACCTGCG ACGCGACTGG CGCAAACTGC GGACGCATTG GGTGCTGATG 
ATCGTGCTGT CCGCCACCGG CTTCGCGATC AACAACGTGC TGTCCTATTG GGGCTTGCAA 
TACACCCAGG CACTGAACGC GCTGCTGCTG CAATCGTCGG GGCCGCTGTT CGTGGCGCTG 
TGGTCGCTGC TGCTGTTCGG TGTGCGGCTG ACCTGGACGC AAGCGATCGG AGTCGCGCTG 
TCGCTGCTCG GCGTGCTGAC CATCATCCTG CGCGGCGACC TTCTGGCGCT GGCCGGGATC 
GAACTCAACC GCGGCGACCT GATGGTCGCG GCCGCGCTGT GCGCCTTCGG AATCTACTCA 
GCGATGATGC CGAAGCGGCC GGTGACGCAT CCGCTGTCGC TGATCGTGGT CACCACCGCC 
GGCGGCGCGC TGTTGCTGCT GCCGTTGGCG GTGTGGGAAT TCGCCGCCGG GATCAGGCCG 
AGCGCCGACT GGGTGACCGC GGCGTCGCTG GCCTATGTCG TGATCTTCCC GTCGGCGCTC 
GCCTATCTGT GCTTCAACCG CGGCGTCGAG CTGATCGGCC CGAACCGCTC GGCGCCGTTC 
CTGCATATGA TGCCTTTATT CGGCTCGGTG ATGGCGATCG TATTGCTCGG CGAGAAGCCG 
GAATTATTCC ACCTCGCGGG CTACGCGATG GTGATTGCCG GCGTGTTCAT CGCGGCACGG 
CGGTGA

Protein sequence

MGGERRLTRA ARAWPAFRGG SLPGLVFQAW LRLTRTDRRR LISLFRTAFG WLAHQPYLLL 
SLTSLFWAGN IVLARAVAGH VPPVTLSCVR WIGAMLLLLP FAWPHLRRDW RKLRTHWVLM 
IVLSATGFAI NNVLSYWGLQ YTQALNALLL QSSGPLFVAL WSLLLFGVRL TWTQAIGVAL 
SLLGVLTIIL RGDLLALAGI ELNRGDLMVA AALCAFGIYS AMMPKRPVTH PLSLIVVTTA 
GGALLLLPLA VWEFAAGIRP SADWVTAASL AYVVIFPSAL AYLCFNRGVE LIGPNRSAPF 
LHMMPLFGSV MAIVLLGEKP ELFHLAGYAM VIAGVFIAAR R