Gene RPD_2890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2890
Symbol
ID	4023389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3217294
End bp	3218586
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	64%
IMG OID	637963089
Product	peptidase T
Protein accession	YP_570019
Protein GI	91977360
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01882] peptidase T

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.223061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGTCTG GCGGTCCTGC AGTGAACTCT TCACCGATCC GCTCCAGCCA AATCGATTTC 
AGCCACGGCG TCATTGAGCG CTTTCTGCGC TATGTCGCGA TCGACACCCA GTCCGATCCC 
GCCTCTTCGA CCTGCCCCTC GACCGCGAAG CAGAAGACCC TCGGCGCCTT GCTGGCGCAG 
GAGCTGCGCG ATCTCGGGCT TTCGGACGCC CATCTCGACG AGCACGGCTA CGTCTACGCC 
ACGATCCCGG CGACCACTGA CAAAAACGTC CCGGTGATCT GCTTCTGCGC GCATATGGAC 
ACCTCACCCG ATTGTTCAGG CGAAGGCGTC AAGCCTCAGA TCGTGAAGAA CTATCAGGGT 
GGCGACATCG TCCTGCCGGC GGACCCGACG CAGGTCATCC GCGCGACCGA GCATCCAGCG 
CTGGCGCAGC AGATCGGCCA TGACATCGTC ACGACCGATG GCGTCACCTT GCTCGGGGCG 
GACAACAAGG CCGGAATCGC GGAGATCATG GACGCCGCGG CATTCCTGAT CGCCAATCCG 
CAGATCAGGC ATGGCACGCT CAAAGTCCTG TTCACGCCCG ACGAGGAGAT CGGCCGCGGC 
GTCGACAAGG TCGACCTCGC CAAACTCGGC GCTGATTTCG CCTACACCAT GGACGGCGAG 
ACCGCGGGCA ATATCGAGGA CGAAACCTTC TCCGCCGATT CGGCCGTCGT CACCATCACC 
GGCGTGAGCG CCCATCCGGG CTTCGCCAAG GGCAAGATGG AGCACGCCAT CAAGATCGCT 
GCGGCGATCG TGGAACGGCT TCCCAGGGAC GCCTGCTCGC CGGAAACCAC CGAGGGCCGC 
GAGGGCTTCC TGCATCCGGT CGGCATCACC GGCGCGCTGG AGCAGACCAC GCTGAGTTTC 
ATCGTCCGCG ACTTCACCCA GGCCGGACTG CAGCAGAAGG AAGCGCTGTT GCAGGGAATC 
GTCGACGAGG TGATGCGCGA CTATCCGCGC TCGACCGCGA CGATCGAGAT CAAGCAGCAG 
TATCGCAACA TGAAGCAGGT GCTCGACCGC CATCCCGAGC TGGTCGAGAA CGCCCGCGAG 
GCGATTCGGC GCGCCGGCCT GACGCCGGTC ACCACCGCGA TTCGCGGCGG CACCGACGGA 
TCGCGGCTGT CGTTCATGGG GCTGCCCTGC CCCAACATCT TCGCCGGCGA ACACGCCTTC 
CATTCAAGGC TCGAATGGGT CAGCCGCCAG GATATGGAGG CCGCCGTTCG CACCATCGTG 
CATCTGGCGA TGATCTTCGA GGAGCAGGCG TAA

Protein sequence

MRSGGPAVNS SPIRSSQIDF SHGVIERFLR YVAIDTQSDP ASSTCPSTAK QKTLGALLAQ 
ELRDLGLSDA HLDEHGYVYA TIPATTDKNV PVICFCAHMD TSPDCSGEGV KPQIVKNYQG 
GDIVLPADPT QVIRATEHPA LAQQIGHDIV TTDGVTLLGA DNKAGIAEIM DAAAFLIANP 
QIRHGTLKVL FTPDEEIGRG VDKVDLAKLG ADFAYTMDGE TAGNIEDETF SADSAVVTIT 
GVSAHPGFAK GKMEHAIKIA AAIVERLPRD ACSPETTEGR EGFLHPVGIT GALEQTTLSF 
IVRDFTQAGL QQKEALLQGI VDEVMRDYPR STATIEIKQQ YRNMKQVLDR HPELVENARE 
AIRRAGLTPV TTAIRGGTDG SRLSFMGLPC PNIFAGEHAF HSRLEWVSRQ DMEAAVRTIV 
HLAMIFEEQA