Gene Rpal_2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2733
Symbol
ID	6410397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	2969955
End bp	2971325
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	70%
IMG OID	642712609
Product	Peptidase M23
Protein accession	YP_001991717
Protein GI	192291112
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTACC GTTCCGGCCA CCCATCCGCA GCGATTCACC CCCACGGCCA CCAACAAGTC 
CAGGCGCCCC GGCCGGCGGC GCCACGCCCG GCACGTCCGC CTCAGCGGCC GGCGCCGACC 
GGTAACAGCT ACACCATCGC GCATGCCGGC CGTCAGGTGC GGATCGGGCC GGTGCTGTTC 
TGGATCGTGG TCGGCAGCAT CGTGCTACTC GGCTGCTGGA GCGCGGCGAC CGCTACGTAC 
TTCACCTTCC GTGACGACGT ACTGACGCGG CTGATCGCCC GCCAGGCCGA GATGCAGTAC 
GCGTATGAGG ATCGCATCGC CGAGCTGCGC GCCAAGGTCG ATCGCACCAC CAGCCGGCAG 
CTGCTCGACC AGGAGCAGTT CGACCAGAAG CTCGAACAGA TCATGCGGCG GCAGTCGCTG 
CTTGAGTCGC GCGCCGGCGC GCTCAGCGCC CTGCCCGACG TCGGCGTCAC AGGCAGCATC 
AAGCCGACCC GAACACCGTC GTTCGAAGCC GAGACCAACA GCCGGCCGAA GCCGTCGCCG 
ATCAACGACA CCGTGATCTT CGTGGCGCCG CCGGACCGCG AGGCGCGGCT GGAGTCGCGA 
ACGTCGCCGT CGGCACTCGA ACAGGCGCCA ACCCAATACG CCAAGAGCCA GGGCGTCGAG 
AGCGTCCTGA TGCGGCTGCA GACCTCGCTC GATCAGGTCG AGCGCCGCCA GGTAGCCTCG 
CTCGGCGCGG TCGAAGAGAG CTTCGAGTCG CGCGCGCGCC GGATGCGCGG CGTGCTGACC 
GATCTCGGCC TCGACGCCCG CGGCATCGAA GCCTCCGCGC CGCGCGCCGC CGTTGGCGGC 
CCGTTCGTGC CGGTGAAACA GCCGGGCGCC AACGCCAGCG CGTTCGACCG CCAGCTGTAC 
CGGATCTACA TCAGCCGCTC GCAGTTCGAA CGCCTCAACC GCGCCCTCGC CCTGGTGCCG 
TATCGCAAGC CGGTGCTCGG CGAAGTCGAA TTCTCCTCGG GCTTCGGCGT CCGCTCCGAT 
CCGTTCCTCG GCCGTCCGGC GATGCACACC GGGCTCGACT TCCGCGCCTC CACCGGCGAT 
CCCGTCCGCG CCACTGCGGT CGGCAAGGTG GTGAATGCCG GCTGGCAGGG CGGCTACGGC 
CAGATGGTCG AGATCGACCA CGGCAACGGC CTGTCGACCC GCTACGGCCA TCTGTCGAAG 
ATCATCGCCA AGGTCGGCCA GAGCATCCAG ATCGGCCAGG TGATCGGCGA AGTCGGCTCC 
ACCGGCCGGT CCACCGGTCC GCATCTGCAC TACGAAACCC GCATCGACGG CGAAGCCGTC 
GACCCGCAGA AATTCCTGCG CGCCGGCGTG CGGCTGGCGG GCGCGGGTTA G

Protein sequence

MSYRSGHPSA AIHPHGHQQV QAPRPAAPRP ARPPQRPAPT GNSYTIAHAG RQVRIGPVLF 
WIVVGSIVLL GCWSAATATY FTFRDDVLTR LIARQAEMQY AYEDRIAELR AKVDRTTSRQ 
LLDQEQFDQK LEQIMRRQSL LESRAGALSA LPDVGVTGSI KPTRTPSFEA ETNSRPKPSP 
INDTVIFVAP PDREARLESR TSPSALEQAP TQYAKSQGVE SVLMRLQTSL DQVERRQVAS 
LGAVEESFES RARRMRGVLT DLGLDARGIE ASAPRAAVGG PFVPVKQPGA NASAFDRQLY 
RIYISRSQFE RLNRALALVP YRKPVLGEVE FSSGFGVRSD PFLGRPAMHT GLDFRASTGD 
PVRATAVGKV VNAGWQGGYG QMVEIDHGNG LSTRYGHLSK IIAKVGQSIQ IGQVIGEVGS 
TGRSTGPHLH YETRIDGEAV DPQKFLRAGV RLAGAG