Gene Rpal_3303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3303
Symbol
ID	6410974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	3552021
End bp	3553274
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	64%
IMG OID	642713180
Product	peptidase T
Protein accession	YP_001992280
Protein GI	192291675
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGCGA TTAACTTCGA CTTCACCGTG TTGGAGCGTT TTCTCCGCTA CGTCACCATC 
GACACCCAAT CGGACCCGCA TTCCGGATCC TGCCCGTCCA CAGAAAAGCA GAAGGACCTC 
GGCGCGCTGC TGGCGCAGGA GCTGCGCGAA TTGGGCCTCG TCGATGCGCA TCTCGACCAG 
CACGGCTACG TCTACGCGAC GATTCCCGCG ACCACCGCGA AACAGAACGT TCCGGTAATC 
TGCTTCTGTG CCCACATGGA CACCTCGCCC GATTGTTCAG GAGCTGGCGT CAAACCGCAG 
GTCTGGAAGG ACTATCAGGG CGGCGACATC GTCCTGCCGG GTGATAAGTC GCAGGTGATT 
CGGCGCGCCG AGCACCCGGC GCTGTCGAAT CAGATCGGCC ACGACATCGT CACCAGCGAC 
GGCACCACCC TGCTCGGCGC CGACAACAAA GCCGGCGTCG CCGAGATCAT GGATGCGGCG 
CGGTTTCTGC TAGCGCACCC CGAGATTAAG CACGGCACGC TCAAGATCCT GTTCACCCCG 
GACGAAGAGA TCGGCCGCGG TGTCGACAAG GTCGACCTCG CCAAGCTCGG CGCCGATTTC 
GCCTTCACCA TGGACGGCGA AAGCGCCGGG CATATCGAGG ATGAGACGTT CTCGGCCGAC 
AGCGCGGTGA TCACCATCGA GGGCGTCAGC GCCCATCCGG GATTCGCCAA GGGCAAGATC 
GAGCACGCCA TCAAGATCGC CGCGGCGATC ATCGAGCGGC TGCCCAAGAC CGGATGCTCG 
CCGGAGACCA CCGAAGGACG CGAAGGCTTC CTGCATCCGA TCGGAATCAC CGGCACGCTG 
GAGAAGGCCA GCGTCAGCTT CATCGTCCGG GATTTCACAG AAGCCGGACT GAGGGACAAG 
GAAACGCTGC TGCAGAGCAT CGTCGAAGAG GTGATGCTGG ATTATCCGCG CTCGCGCGCC 
AAGATCGAGA TCCAGCCGCA ATATCGCAAC ATGAAGCAGG TGCTCGACCG CCATCCCGAG 
CTGGTCGAGA ACGCCCGTGA AGCGATCCGC CGTGCCGGCC TCACGCCGGT CACCGCCGCG 
ATCCGCGGCG GCACCGATGG CGCGCGGCTG TCGTTCATGG GCCTGCCCTG CCCCAACGTG 
TTCGCCGGCG AGCACGCCTT CCACTCCCGT CTGGAATGGG TCAGCCGCCA GGACATGGAG 
AAGGCGGTCG AGACCATCGT GCATCTGGCA ACGATCTTCG AAGAGCAGGC GTAA

Protein sequence

MTAINFDFTV LERFLRYVTI DTQSDPHSGS CPSTEKQKDL GALLAQELRE LGLVDAHLDQ 
HGYVYATIPA TTAKQNVPVI CFCAHMDTSP DCSGAGVKPQ VWKDYQGGDI VLPGDKSQVI 
RRAEHPALSN QIGHDIVTSD GTTLLGADNK AGVAEIMDAA RFLLAHPEIK HGTLKILFTP 
DEEIGRGVDK VDLAKLGADF AFTMDGESAG HIEDETFSAD SAVITIEGVS AHPGFAKGKI 
EHAIKIAAAI IERLPKTGCS PETTEGREGF LHPIGITGTL EKASVSFIVR DFTEAGLRDK 
ETLLQSIVEE VMLDYPRSRA KIEIQPQYRN MKQVLDRHPE LVENAREAIR RAGLTPVTAA 
IRGGTDGARL SFMGLPCPNV FAGEHAFHSR LEWVSRQDME KAVETIVHLA TIFEEQA