Gene RPD_3897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3897
Symbol
ID	4024413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4334718
End bp	4335755
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	637964101
Product	hypothetical protein
Protein accession	YP_571019
Protein GI	91978360
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACCCAG CCGGGCCGCG GAACAGCGGC GTCGCATGGC ACGAATTCGG CGGGTGGACT 
TGCGGCGGCG GCGATTTTCG GCACAAGTCG CCTCCCCTCC AGCAGAGCAG TCAAAACGTG 
CCCTCCGCTC CCCATCCCTT CGCGCGCCTC ACCGACCAGC CCTATCTCCT GCTCAGCCTG 
ACCTCGCTGT TCTGGGCCGG CAACGCCATC GTCGGCCGCG CCGCCGCCGG GCATTTCCCA 
CCGGTGACGC TGTCGTTCCT GCGCTGGGCC TTCGCCTTCC TGCTGGTCGC GCCGTTTGCA 
TGGCGGCACC TGATCGCGGA CTGGAAGGTG ATCCGCAAAC ACCTCGTCGT CATGGTCGCG 
ATTTCGATCA TCGGGATCTC GACCTTCAAC ACGCTGCAAT ACACCGCGCT GCAATACACC 
ACAGCGCTCA ATATCCTTCT GCTGCAGTCG ACCGCGCCGC TGTTCGTGGC GATCTGGGCG 
CTGATCGTGC TCGGCGCGCG GCTCACGCTG ACGCAGGCGC TCGGTATCAT GGCGTCGATG 
GCCGGCGTCG TGGTGATCAT CCTGCACGGC GACCTCGCCC AGATCACGGC GATCGATCTC 
AACCGCGGCG ATCTGATGTT CATCGGCGCG CTCGCGACCT TCGGCCTGTA CACCACGCTG 
ACGCAGCGGC GACCGGCGAT GCACGCGCTG TCGTTCCTCG CCTTCACCTT CGGCTGCGGC 
GCGCTGTTCC TGATTCCGCT GCTGATCTGG GAGCTGACGG TGCGGCCGGC GCCGGCGCTC 
GACGTCGCCA ATGCGGCGTC GCTGGCCTAT GTGGTGATCT TCCCGTCGAT CCTGGCCTAT 
CTCTGCTACA ATCGCGGCGT CCGGCTGATC GGCGCCAACC GCTCGGCGCC GTTCTTTCAT 
CTCATCCCGG TGTTCGGCTC GGCGATGGCG ATCCTGTTCC TCGGCGAACA GCCGCACCTC 
TACCACGCGA TCGGCTACGC GATGGTGCTG GCCGGCGTGG TGGTCGCCGC GAGGAAGCCC 
GCGGCACCTT CAGCCTGA

Protein sequence

MNPAGPRNSG VAWHEFGGWT CGGGDFRHKS PPLQQSSQNV PSAPHPFARL TDQPYLLLSL 
TSLFWAGNAI VGRAAAGHFP PVTLSFLRWA FAFLLVAPFA WRHLIADWKV IRKHLVVMVA 
ISIIGISTFN TLQYTALQYT TALNILLLQS TAPLFVAIWA LIVLGARLTL TQALGIMASM 
AGVVVIILHG DLAQITAIDL NRGDLMFIGA LATFGLYTTL TQRRPAMHAL SFLAFTFGCG 
ALFLIPLLIW ELTVRPAPAL DVANAASLAY VVIFPSILAY LCYNRGVRLI GANRSAPFFH 
LIPVFGSAMA ILFLGEQPHL YHAIGYAMVL AGVVVAARKP AAPSA