Gene RPD_1956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1956
Symbol
ID	4022438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2195992
End bp	2197059
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	63%
IMG OID	637962149
Product	twin-arginine translocation pathway signal
Protein accession	YP_569092
Protein GI	91976433
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3049] Penicillin V acylase and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.550247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.436051
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCGT TCAGGCGTCG TTTCGTCACC GCATCCGCCG CAGCGCTTCT GATCGGAGGC 
GCCCTGCTTC CGCCGGTGGC GCAGGCGTGC ACCCGTCTGG TCTATCTCGG CGCCGACAAT 
CAGGTGATCA CCGCCCGCTC GATGGACTGG TCGCGCGACA TCGGCACCAA TCTCTGGATC 
TTGCCGCGCG GTATCAAGCG CTCCGGCGAG GCCGGGCCGA ACTCGCTGCA ATGGACCGCG 
CGTTACGGCA GCGTGATCGC CTCGGCCTAT GACATCGCGA CCTCGGACGG CGTCAACGAG 
GCCGGGCTGG TCGCGAACGT GCTGTGGCTC GCGGAATCGA CCTATCCGAA ACTCGACGGC 
AGCAAGCCGG GTCTCGCGCT GTCGCTGTGG CCACAATATG TGCTCGATAG TTTCGGCACC 
GTGCAGGAGG CGGTCGAGGC GCTGGCGAAA CAGCCGTTCA CCGTCGTCAC AGCCCAGTTG 
CCCGACGAGA ACCGGCTGGC CACAGTACAT CTGTCGCTGT CGGATTCGAC CGGCGACAGC 
GCCATCATCG AATATATCGA TGGCCAGCAG GTGATCCATC ACGGCCGGCA ATATCAGGTG 
ATGACCAATT CGCCGACCTT CGATCAGCAG CTCGCGCTCA ACGCCTATTG GAAGCAGATC 
GGCGGCACCG TGATGCTACC CGGCACCAAC CGCGCGGCCG ACCGCTTCGC CCGCGCGTCG 
TTCTACGTCG ACGCGATCCC GAAGGCGGAA AACCCGGTCG AAGCGATCGC CAGCGTGTTC 
GGCGTGATCC GCAACGCCTC GGTGCCTTAC GGCATCACCA CGCCCGATCA GCCGAACATC 
TCCTCGACGC GCTGGCGCAC CGTCGTCGAC CACAAGCGCA AGCTCTACTT CTTCGAATCC 
GCGCTGACCC CGAACGTGTT CTGGGTCGAC CTCACCCGGA TCGATTTTTC CGCCGACAAA 
GGCGCGGTCA AGAAGCTCGA CCTCGGCGCC AACCAGACCA ACACCTTTTC GGGCGTGGTC 
AATGATCAGT TCAAGGTCAG TCCGCCGTTC AAATTTCTCG GGCTGTGA

Protein sequence

MIPFRRRFVT ASAAALLIGG ALLPPVAQAC TRLVYLGADN QVITARSMDW SRDIGTNLWI 
LPRGIKRSGE AGPNSLQWTA RYGSVIASAY DIATSDGVNE AGLVANVLWL AESTYPKLDG 
SKPGLALSLW PQYVLDSFGT VQEAVEALAK QPFTVVTAQL PDENRLATVH LSLSDSTGDS 
AIIEYIDGQQ VIHHGRQYQV MTNSPTFDQQ LALNAYWKQI GGTVMLPGTN RAADRFARAS 
FYVDAIPKAE NPVEAIASVF GVIRNASVPY GITTPDQPNI SSTRWRTVVD HKRKLYFFES 
ALTPNVFWVD LTRIDFSADK GAVKKLDLGA NQTNTFSGVV NDQFKVSPPF KFLGL