Gene Rpal_1502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1502
Symbol
ID	6409160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1584699
End bp	1585880
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	54%
IMG OID	642711400
Product	restriction modification system DNA specificity domain
Protein accession	YP_001990515
Protein GI	192289910
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTATCC CTAAAGTCCC GCTTGGCGAA TTTGTTGAGA TCAAAGGGGG CGGAACACCA 
TCGAAATCCA ATGCGGCCTT TTGGGGTGGC AACATTCCTT GGGTCTCACC CAAGGACATG 
AAGACCTGGG AGATTTGCGA CTCTGAAGAC AAGATCACGG CTGAGGCGGT AAGAGAAAGC 
GCGACTAACC TGATCCCGCC GAATGCAACG CTCATCGTCA ACCGTTCTGG GATTTTGAAG 
CACACTTTGC CCGTCGGAAT CACTCGGCGG CCCGTCGCAA TCAATCAAGA TATCAAGGCC 
ATTCTGGTCA GCCCTCGTGC TCACCCAGAA TATGTGGCCC ACATTATCAA GGCCGCAGAG 
CCGATCGTCC TGAAATGGGT TAGAGCAACG ACCGCTGACA ACTTCCCCAT CGACAACCTC 
AGGGAGCTTG AAATCCCTCT TCCCCCGCTC GACGAGCAGC GGCGGATCGC GGCGATCCTG 
GACAAGGCGG ATGCGCTGCG CCGCAAGCGC AAGCGCACGA TCGAATTGAT CGAATGCCTT 
ATGCAGGCAA CCTATCGCAG GATGTTCGTT GAGCAAGCAT CGAACTCGTG GCCGAAGTGC 
ACGGTAGCTT CGCTGGCACG CGACATCCGA ACCGGGCCGT TCGGCAGTCA GTTACTACAT 
TCCGAATTTG TGGACGAAGG GATAGCCGTT CTTGGCATCG ATAATGTCGC AACGAACGAA 
TTTCGCTGGG GGGAGCGACG ACACATCCCC GAAGAAAAAT ATGAGAAACT AAGGCGCTAC 
ACCGTCTTTC CCGGGGACGT TCTTATTACC ATTATGGGAA CCTGCGGTCG CTGTGCAATT 
GTGCCCGAAA ACATTCCTCT GGCGATAAAT ACCAAGCACC TTTGTTGTAT TACTTTAGAC 
GAAGAGAAGT GTTTGCCAGA ATTCTTGCAG TCCACGTTCT TGCAACATCC GGATGTGCTC 
CTCCAGCTTG GTGTCCAGGC TAAGGGGGCG GTGATGCCCG GTCTGAACAT GGGAATCATC 
AAGTCTCTTC AGATCTCCTT GCCTCCGGTT CAGCTCCAGA GAGATTTCGT AATGAGGATT 
TCGAAATTGC GGTCGACTTT GATTTCTTCA CGGCACTGGG AAGCAGAAGG AGAACTTCTC 
TTCTCCTCCC TCCAACACCG CGCCTTTTCC GGCCAGCTTT GA

Protein sequence

MTIPKVPLGE FVEIKGGGTP SKSNAAFWGG NIPWVSPKDM KTWEICDSED KITAEAVRES 
ATNLIPPNAT LIVNRSGILK HTLPVGITRR PVAINQDIKA ILVSPRAHPE YVAHIIKAAE 
PIVLKWVRAT TADNFPIDNL RELEIPLPPL DEQRRIAAIL DKADALRRKR KRTIELIECL 
MQATYRRMFV EQASNSWPKC TVASLARDIR TGPFGSQLLH SEFVDEGIAV LGIDNVATNE 
FRWGERRHIP EEKYEKLRRY TVFPGDVLIT IMGTCGRCAI VPENIPLAIN TKHLCCITLD 
EEKCLPEFLQ STFLQHPDVL LQLGVQAKGA VMPGLNMGII KSLQISLPPV QLQRDFVMRI 
SKLRSTLISS RHWEAEGELL FSSLQHRAFS GQL