Gene RPB_1964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1964
Symbol
ID	3908044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	2231096
End bp	2232631
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	67%
IMG OID	637883858
Product	hypothetical protein
Protein accession	YP_485583
Protein GI	86749087
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.611513
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTTTCA AGACCATCCT GATCGCATTG GCGATCATAG CACTCTCGTT CGGTGTCACG 
CTGAAGGCGT TCGACTGGCT GTCGCCGCGC GCCGTCAGCC CGCTGACGCT GCAGGCCCTG 
CCGCCGCTGC CGGCGATCCG ACAGTCCTCG GTCGTCGTGC CCGTGAGCGT GCCGCTGACC 
GCGATCCGCG ATCTGGTCGA CCGGAGCGCG CCGCGCAATT TTTCCGGCAG GGCCGACAAT 
CCGATGCCGC AGCTCGTGCA GAACGCCGAT ATCAGCTGGA CGGTGGCGCG CGGCGCCGTC 
GCGACCAAGG GCGCACCCGA GCAGGTCACC GTCACCGCCC CGCTGATCGG CACCCTCTCC 
GCCCGGGGCT CGCTCTCGAG CAGCGCCCAG AACCAGGTCG GTGATACGCT CGGCAAATTG 
TTCGGCGACA AGGTCGCCAA GCAGGTCGGC GTCAACATCA AGTCGTTCAA CGCCAGCGGC 
GAGATCAAGG GCATGATCGC GATCACCGCC CGTCCGAAAG TGCTGCCGGA CTGGCACGTC 
GACCCGAACC TCACCGCACA GGTGATCCTG TCCGACTCCA ATGTCGCGAT CGGCGGCGCG 
CGCATCAACG TGCCGGCGCA GGTCAAGCCG GTGATCGACA AGGCCGTCAA CGACCAGATC 
GCCCAGTTGC AACGGACCAT CCGCGACGAC GGCGCGCTGG AGCGCAGCGC GCGGCGCGAA 
TGGGCGCGGA TCTGCCGCTC GATTCCGCTG CAAGGCGCCG GCGTGCCGAA CGGCTTCTGG 
CTCGAACTGC GTCCGACCAA GGCGCTGGCC GCGCAGCCGC AGATCGACGG CGCGACGGTG 
GCGCTGACGC TCGGGATCGT CGCCGACAGC CGTATCACCA CGGCGCCGAC CAAGCCGGAA 
TGTCCGTTTC CCGCGCAGCT CGAAATGGTC GCGCCCGACA GCACCGGCGT CAAAGTCGCG 
GTGCCGATCG ATATTCCGTT CAAGGAGCTC GATCGCGTCA TCGAGCCGCA ATTCGTCGGC 
CGCACCTTTC CTGAAAACGG TGGGGCCGCC GCGATCACGG TGAAGCGCGT CAATGTCGCC 
GCCAGCGGCG ACCGGCTGCT GATCTCGATG CTGGTGGATG CCAAAGGCCA GAAGAGTCTG 
TTCAGCTTCG GCGGCGAAGC CACGCTGCAC ATCTGGGGGC GGCCGGTCCT GAACCAGGAG 
GATCAGACGC TGCGGCTGTC CGACATGCAG CTCGCGGTGG AATCCGAGGC GGCGTTCGGC 
CTGCTCGGCG AGGCGGCGCG CGCCGCCGTG CCCTATCTGC AGAAGGCGAT CGCCGAACGG 
GCGGTGATCG ATCTCAAGCC GGAATCGCTC AACGTGCAGC GCCGGATCGG CGCGGTGATC 
GCGGCGTATC AGCGCAACGA GGACGGCCTG CGCATTTCCT CGGAGATCTC CAGCCTGCGG 
CTGACCGATG TGGCGTTCGA CTCCACCATG CTGCGGGTGA CCGCAGAGGC CAACGGCATT 
CTCGAAGTCA CGATCACCAA GCTGAAGGCG CCCTGA

Protein sequence

MRFKTILIAL AIIALSFGVT LKAFDWLSPR AVSPLTLQAL PPLPAIRQSS VVVPVSVPLT 
AIRDLVDRSA PRNFSGRADN PMPQLVQNAD ISWTVARGAV ATKGAPEQVT VTAPLIGTLS 
ARGSLSSSAQ NQVGDTLGKL FGDKVAKQVG VNIKSFNASG EIKGMIAITA RPKVLPDWHV 
DPNLTAQVIL SDSNVAIGGA RINVPAQVKP VIDKAVNDQI AQLQRTIRDD GALERSARRE 
WARICRSIPL QGAGVPNGFW LELRPTKALA AQPQIDGATV ALTLGIVADS RITTAPTKPE 
CPFPAQLEMV APDSTGVKVA VPIDIPFKEL DRVIEPQFVG RTFPENGGAA AITVKRVNVA 
ASGDRLLISM LVDAKGQKSL FSFGGEATLH IWGRPVLNQE DQTLRLSDMQ LAVESEAAFG 
LLGEAARAAV PYLQKAIAER AVIDLKPESL NVQRRIGAVI AAYQRNEDGL RISSEISSLR 
LTDVAFDSTM LRVTAEANGI LEVTITKLKA P