Gene RPD_3452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3452
Symbol
ID	4023966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3833015
End bp	3834664
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	62%
IMG OID	637963656
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_570576
Protein GI	91977917
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.747993
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCGCC AGTTCGTCTA TTTCATGCAG GGCCTGACCA AGGCCTATCC GACCCGCAAG 
GTGCTGGATA ACGTCCATCT GTCGTTCTAC CCCGACGCCA AGATCGGCGT GCTCGGCGTC 
AACGGCGCCG GCAAGTCGAC GCTGCTCAAG ATCATGGCCG GGATCGACAA GGAATACACC 
GGCGAGGCCT GGGTCGCCGA AGGCGCCCGC GTCGGCTATC TCGAACAGGA ACCGCAGCTC 
GATGCCGCGC TGAACGTGCG CGAGAACGTC ATGCTCGGCG TTGCCAAGCA GAAGGCGATC 
CTCGATCGCT ACAACGAGCT GGCGATGAAC TATTCCGAGG AAACCGCCGA CGAGATGACC 
GCGCTCCAGG ACCAGATCGA GTCCGCGGGG CTGTGGGATC TCGACAGCAA GGTCGACCAG 
GCGATGGACG CGCTGCGCTG CCCGCCCGAT GACGCAGACG TCACCAAGCT GTCCGGCGGC 
GAGCGCCGTC GCGTCGCGCT GTGCAAGCTG CTGCTCGACC AGCCCGAACT GTTGCTGCTC 
GACGAACCGA CCAACCATCT CGACGCCGAG TCGGTGTCTT GGCTCGAAAA TCATCTGCGC 
AACTATCCGG GCGCGATCCT GATCGTCACC CACGATCGTT ACTTCCTCGA CAACGTCACC 
TCCTGGATTC TCGAGCTCGA CCGCGGCAAG GGAATTCCCT ACGAGGGCAA CTACTCGTCC 
TGGCTGGTGC AGAAGCAGAA GCGGCTGCTG CAGGAGGGGC GCGAGGATGC GGCCCACCAG 
AAGACGCTCG AGCGTGAGCA GGAGTGGATC GCGTCGTCGC CGAAGGCACG CCAGGCCAAG 
TCCAAGGCGC GCTACCAGCG CTACGATGAA CTGCTTGCCA AGGCCAGCGA GAAGCAGACC 
CAGGCCGCGC AGATCATCAT TCCGGTGGCC GAGCGTCTCG GTAACAATGT GGTCGAATTT 
GATCACCTGA CCAAGGGCTT CGGCGACAAG CTGCTGATCG ACGACCTGAC CTTCAAGCTG 
CCGCCCGGCG GCATCGTCGG CGTGATCGGC CCGAACGGCG CCGGCAAGAC CACGCTGTTC 
CGGATGATCA CCGGGCAGGA AAAGCCCGAC CAAGGTACCA TCACGGTCGG CGAGACCGTG 
CATCTTGGCT ATGTCGATCA GTCGCGCGAC AGCCTCGACG CCAAGAAGAC CGTTTGGGAA 
GAGATTTCCG GCGGCAATGA GCAGATCCTG CTCGGCAAGA AGGAAGTTAA TTCGCGCGGC 
TATTGCTCGT CCTTCAACTT CAAGGGCGGT GACCAGCAGA AGAAGGTTGG TTCGCTGTCA 
GGCGGCGAGC GTAACCGCGT CCACCTCGCC AAGATGCTGA AGTCCGGCTC CAACGTGCTG 
CTGCTCGACG AACCGACCAA CGACCTCGAC GTCGATACGC TGCGGGCGCT GGAAGAGGCG 
CTCGAGGATT TCGCCGGCTG CGCCGTGATC ATCAGCCATG ACCGCTGGTT CCTCGACCGT 
ATCGCCACGC ATATCCTCGC CTTCGAGGAC GACAGCCACG TCGAATGGTT CGAAGGCAAC 
TTCCAGGACT ACGAGAAGGA CAAGATGCGC CGGCTCGGTC AGGACTCGGT GATCCCGCAC 
CGGGCGAAGT ATAAGAAGCT GACGCGGTGA

Protein sequence

MARQFVYFMQ GLTKAYPTRK VLDNVHLSFY PDAKIGVLGV NGAGKSTLLK IMAGIDKEYT 
GEAWVAEGAR VGYLEQEPQL DAALNVRENV MLGVAKQKAI LDRYNELAMN YSEETADEMT 
ALQDQIESAG LWDLDSKVDQ AMDALRCPPD DADVTKLSGG ERRRVALCKL LLDQPELLLL 
DEPTNHLDAE SVSWLENHLR NYPGAILIVT HDRYFLDNVT SWILELDRGK GIPYEGNYSS 
WLVQKQKRLL QEGREDAAHQ KTLEREQEWI ASSPKARQAK SKARYQRYDE LLAKASEKQT 
QAAQIIIPVA ERLGNNVVEF DHLTKGFGDK LLIDDLTFKL PPGGIVGVIG PNGAGKTTLF 
RMITGQEKPD QGTITVGETV HLGYVDQSRD SLDAKKTVWE EISGGNEQIL LGKKEVNSRG 
YCSSFNFKGG DQQKKVGSLS GGERNRVHLA KMLKSGSNVL LLDEPTNDLD VDTLRALEEA 
LEDFAGCAVI ISHDRWFLDR IATHILAFED DSHVEWFEGN FQDYEKDKMR RLGQDSVIPH 
RAKYKKLTR