Gene RPD_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2074
Symbol
ID	4022556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2323426
End bp	2325381
Gene Length	1956 bp
Protein Length	651 aa
Translation table	11
GC content	63%
IMG OID	637962267
Product	ABC transporter related
Protein accession	YP_569210
Protein GI	91976551
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5265] ABC-type transport system involved in Fe-S cluster assembly, permease and ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCACC CACATTCGCA CTCGCAGAGC GGCCCCGCGG CCGCGATTCC TGAGGACGCT 
GTCGCGCAGA AGGCGACCTT GGGCGGCACG CTGGTGCACC TGTGGCCGTA TATCTGGCCG 
GGCGACCGGG TCGACCTGAA GATGCGGGTG TTGTGGTCGG TGGTGCTGCT GCTCGTCGCC 
AAGGCGGCGA CGCTGATTGT TCCGTTCACG TTCAAATGGG CGATCGACGC GCTCACCGGC 
GCCGACACCG CGCCGATCGA GCCTTCGAAC TGGATGCTGT GGCTGTTCGC TTCGCCGCTT 
CTCCTGACGT TGAGCTACGG TCTGGTGCGG GTGCTGATGG CGTTGCTGAC GCAATGGCGC 
GACGGCCTGT TCGCCCAGGT CGCGATGCAT GCGGTACGCA AGCTCGCTTA TCGCACTTTC 
GTGCACATGC ATGAATTGTC GCTGCGGTTT CACCTCGAGC GCAAGACCGG CGGCCTGACG 
CGGGTGCTGG AGCGCGGCCG TCTCGGCATC GAAGTGATCG TGCGCATGGT GATCCTGCAA 
CTGGTGCCGA CGATCGTCGA GCTGGCGCTG GTGATGGGCG TGCTGCTGTG GCAGTTCGAC 
TGGCGTTACG TCGCGGTGAT CATGGTCACC GTCGTGGTCT ACATGTTCTA TACCTACAAG 
GCGACCGAGT GGCGGATCGC GATCCGGCGA CGGATGAACG ATTCCGACAG CGACGCCAAC 
CAGAAAGCGA TCGACTCGCT GTTGAACTAC GAGACCGTGA AGTATTTCGG CGCCGAGGAG 
CGCGAGGCGC GGCGTTACGA CAAGTCGATG GAACGCTACG AGGACGCCAG CGTCAGCACC 
TATACGTCGC TCGCGGTGCT CAATGCGGGG CAGGCGGTGA TCTTCACCTG CGGTCTGACG 
GCGACGATGC TGATGTGCGC CGTCGGCATC CGCAACGGCA CCAACACCGT CGGCGATTTC 
GTGATGATCA ACGCGATGAT GATCCAGTTC TATCAGCCGT TGAACTTCAT GGGCATGGTG 
TATCGCGAGA TCAAGCAGGC GATCATCGAC ATCGAGAAGA TGTTCGCCGT GCTGTCGCGC 
AATCCCGAAG TCCAGGACAA GGCCGACGCA AAGCCGCTGG TGGTCACCGA CGGCGTGGTG 
AAGTTCGAGG ATGTACGCTT CGCCTATGAC CCGTCCCGCC CGATCCTCAA GGGCCTCAGC 
TTCGAGGTTC CTGCCGGCAA GACGGTTGCG ATCGTCGGGC CTTCCGGCGC GGGCAAGTCG 
ACGATTTCGC GGCTGCTGTT CCGCCTGTAC GACGTCTCCG GCGGCCACAT CCGGATCGAC 
GGTCAGGATA TTCGCGACGT CACTCAGACA TCGCTGCGGG CGGCGATCGG CATGGTGCCT 
CAGGACACCG TGCTGTTCAA CGACACCATC CGCTACAACA TCCGCTACGG CCGCTGGAAC 
GCCTCCGACG CTGAAGTCGA AGAGGCGGCG CAGACCGCGC AGATCGACGC CTTCATCAAG 
GCGTCGCCGA AGGGGTACGA AACCGAAGTC GGAGAGCGCG GCCTGAAGCT GTCGGGTGGC 
GAGAAGCAGC GCGTCGCGAT CGCGCGAACC GTTCTCAAGT CGCCGCCGAT CCTGGTTTTG 
GACGAAGCCA CCTCGGCGCT CGACAGTCAT ACCGAGCACG AGATCCAGGG CGCGCTGGAG 
CGTGTGTCAC AGAACCGCAC CTCGCTGGTG ATCGCGCACC GGCTTTCGAC AATCGTCGGC 
GCCGACGAGA TCATCGTGCT CGATCAGGGC CGGATCTCGG AGCGCGGCAC GCACGCCCAA 
CTGCTTGAAC ATGGCGGCCT TTACGCGAGC ATGTGGAATC GGCAGCGCGA GGCCGAAGAG 
GCCCGCGAGC GTCTGGCGAT GATTGGTGAC CAGGATTCAC CGGTTCGTTC CGCCATCATC 
GACGATGATC TGGCAACTTC CGCGGCGGCA GAGTAA

Protein sequence

MAHPHSHSQS GPAAAIPEDA VAQKATLGGT LVHLWPYIWP GDRVDLKMRV LWSVVLLLVA 
KAATLIVPFT FKWAIDALTG ADTAPIEPSN WMLWLFASPL LLTLSYGLVR VLMALLTQWR 
DGLFAQVAMH AVRKLAYRTF VHMHELSLRF HLERKTGGLT RVLERGRLGI EVIVRMVILQ 
LVPTIVELAL VMGVLLWQFD WRYVAVIMVT VVVYMFYTYK ATEWRIAIRR RMNDSDSDAN 
QKAIDSLLNY ETVKYFGAEE REARRYDKSM ERYEDASVST YTSLAVLNAG QAVIFTCGLT 
ATMLMCAVGI RNGTNTVGDF VMINAMMIQF YQPLNFMGMV YREIKQAIID IEKMFAVLSR 
NPEVQDKADA KPLVVTDGVV KFEDVRFAYD PSRPILKGLS FEVPAGKTVA IVGPSGAGKS 
TISRLLFRLY DVSGGHIRID GQDIRDVTQT SLRAAIGMVP QDTVLFNDTI RYNIRYGRWN 
ASDAEVEEAA QTAQIDAFIK ASPKGYETEV GERGLKLSGG EKQRVAIART VLKSPPILVL 
DEATSALDSH TEHEIQGALE RVSQNRTSLV IAHRLSTIVG ADEIIVLDQG RISERGTHAQ 
LLEHGGLYAS MWNRQREAEE ARERLAMIGD QDSPVRSAII DDDLATSAAA E