Gene RPD_3941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3941
Symbol
ID	4024457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4380650
End bp	4382389
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	60%
IMG OID	637964145
Product	hypothetical protein
Protein accession	YP_571063
Protein GI	91978404
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCAGC TTCCCATCCA CAACTACAAG CTCTACCCGC GCATGGCTCA CTGGTTCAAT 
CCAGTGCTGC TTTTCAAGCT GCTGGTGAAC GTCGTCATCT CCTCGGTCTT CGGATCGTAC 
GCCGACAGGC GGCTGCTCAT CGCCGCGCTC GATACGACGG ACACGCAGAA GCTCCTGCAG 
CGCGCGCGGG AAACGAGAGA GATGCTTCAA CCGGGCCCGG ACGGAGCCCT CTGGCTCGAT 
TTCGTCGCTG ATCTCGGCGA CGGCTTCGAC AGCACGTACT CGGTCGCCAC CCTGCTCGCG 
CAGAAGCAAC TACGGGTCGG CGGCAGGGAT CTTCCGCGCG GCCAAGCCCT GATCATGGGC 
GGTGATGAAG TCTATCCGAA AGCCACCGCT GACGCCTACC GGTACCAACT ATATTGGCCT 
TACGCCTGGG CATCACCCGA TCCACATCCA GGAGAAGCGA CAGGCACGCC CCTCTTCGCC 
ATTCCGGGAA ACCACGACTG GTACGACGGG TTGTCGCTAT TCCTTGCCTG GTTCTGCCGC 
GCGAAGCCGG TGCGCTTCGG AAGCTGGCGC ACCGTCCAGC GACGCAGCTA TTTCGCCAAC 
CAGATCACGG ACACCTGGTG GATCTGGGCG ATCGACATCC AGCTTGCCGA CAACATGGAC 
CAGCCTCAGG CGGACTATTT CAAGACCATC GCCGAGAACA TGCCCGAGAA TTCGAAGATC 
ATCCTTTGCA GCGCCGAACC CGGTTGGCTG TACGTGGAGA CGTCGTCCGA ATCCACGTCT 
TGGGAGATCG TCGAATATGC GATCGAACTC GCCGAGAACG CGGGGAAAGG ACTGACGGTG 
CCGGTCGTGC TCTCCGGCGA CACCCACCAC TACAACCGGT ACACCGGCCT GAAAAATCAG 
CAGTACATCA CCTCCGGCGG GGGCGGCGCC TTCCTTCATC CAACGCACCA GTTGGAGGAC 
GTCATCCCGT TGAGGCGCTG CGGCGTAAAT CAATCGCTGA CCCTGGCCAG CGCCTCTGAT 
AAGGGAGCGG GACCCGCCGT CTATCCGGGC TTCGAACTCA GCAAGTCCCT GGTATGGCGC 
AATCTGTATT TCGCACTCAC GAATTGGGAT TTTTCGCTCC TTATGGGCAT GGTTTATTTC 
CTTTTCGGTG TAGCTATCTC GCTACGACCC CATTGGGACA TGTACCTCGC TACGGTCGCA 
ATCCTCGCAT GGTCCCTGAT GGGCTACACG ATCAAGCAGG AAAAATCGAA GAGGCGCGCG 
GTCGTCCTGA CAAGCGCCCT GCACTCGCTC GCACATGCGG CGGTCGTGAT CGGCGCCGGC 
ACGTACTTCG TGGCGCTGAA CGCTGCAATC TTCCTGTTTG AGGGTCCCTA CGCTGTGCAC 
CTGTGGCTGC TCGCGCTCCT CGTCGAGATG TTTCCGATCG GCTTCGCTTT GGGATCGAGC 
CTTTTCGGAT GGAACATGAT GCTGACCTGT CGATACCTGC AGATGAACCG GAACGATGCA 
TTCAGCGCGC TGCGGATCGG CGCGTACAAC AACTTCGTCC GGATGCGGAT CACCGAGGAC 
GACATAGAGT TCTTCGTCGT CGGCCTCGAC GCTGTCCCTT CGCGAGGTGA TTGGAAAGAA 
AATCCGAAGC ACGGCGCGCA TACGGCAGAT GAACCCCGCT TCATTCCGGC AACGCCCTTG 
ACGCCTCACC TCGTCGAAAG CTTCTCATTG AACAAGCCCG TCACGAAGCC CGAGGTCTGA

Protein sequence

MPQLPIHNYK LYPRMAHWFN PVLLFKLLVN VVISSVFGSY ADRRLLIAAL DTTDTQKLLQ 
RARETREMLQ PGPDGALWLD FVADLGDGFD STYSVATLLA QKQLRVGGRD LPRGQALIMG 
GDEVYPKATA DAYRYQLYWP YAWASPDPHP GEATGTPLFA IPGNHDWYDG LSLFLAWFCR 
AKPVRFGSWR TVQRRSYFAN QITDTWWIWA IDIQLADNMD QPQADYFKTI AENMPENSKI 
ILCSAEPGWL YVETSSESTS WEIVEYAIEL AENAGKGLTV PVVLSGDTHH YNRYTGLKNQ 
QYITSGGGGA FLHPTHQLED VIPLRRCGVN QSLTLASASD KGAGPAVYPG FELSKSLVWR 
NLYFALTNWD FSLLMGMVYF LFGVAISLRP HWDMYLATVA ILAWSLMGYT IKQEKSKRRA 
VVLTSALHSL AHAAVVIGAG TYFVALNAAI FLFEGPYAVH LWLLALLVEM FPIGFALGSS 
LFGWNMMLTC RYLQMNRNDA FSALRIGAYN NFVRMRITED DIEFFVVGLD AVPSRGDWKE 
NPKHGAHTAD EPRFIPATPL TPHLVESFSL NKPVTKPEV