Gene RPC_3464 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3464
Symbol
ID	3971749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	3847802
End bp	3850009
Gene Length	2208 bp
Protein Length	735 aa
Translation table	11
GC content	67%
IMG OID	637926575
Product	twin-arginine translocation pathway signal
Protein accession	YP_533323
Protein GI	90424953
COG category	[C] Energy production and conversion
COG ID	[COG1529] Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCATG ACCGCGCCAT CCACGACCGG ACCACGCAGG CCAAATCCGC TCCCACGCTG 
TCGCGCCGCG CGCTGCTGCA GGCCGGCGCT GGCCTGGCGA TCGGCGTCTA TATCGCCGGC 
CGCACGCCGT CGTTCGCGCA GAACCGGCCG GCGCCGCAAA GCGTCAACAT CGTGCCGAAC 
ACCTTTTTGA TCATCGCGCC GGATGACACC GTGACGGTGC TGTGCAAGGC GATCGAATTC 
GGCCAGGGGC CGTTCACCGG CTTTGCCACG CTGGTCGCCG AAGAACTCGA CGCCGACTGG 
TCGCAGATGC GCGCCGCGCA CGCGCCGTCC AATCCGGCGC TGTACAAAAA TCTGTTGTTC 
GGCGTGCAGG GCACCGGCGG CTCCAGCGCG ATCGCCAATT CCTTCGAGCA GATGCGCAAG 
GTCGGCGCCG CCGCGCGGCA GATGTTGGTC GCCACGGCGG CCGAGCGCTG GCGGGTCGAG 
GCTTCCGAGA TCAGCGTCGA GAACGGCGTG ATCAAGCACG CGTCCGGCAA GCAGGGCCGG 
TTCGGCGAAT TCGCAACTGA AGCGATGCAG CGGCCGGTGC CGGGCGATCC GAAGTTGAAG 
GATCCGGCCG ACTTCAAGCT GATCGGCAAA GAGGGCGCGG TGCAGCGGCT CGACAGTGCC 
GCGAAATCGA ACGGCTCGGC GATCTTCACG CTCGACCTCG ACGAGCCCGA CATGCTCACC 
GTGCTGATCG CGCGCTCGCC GAAATTCGGT GGCGTGGTGA GTTCGTTCGA TGCCGGCGCC 
GCCAAGCAGA TCGCCGGCGT GGTCGACGTC AAACAGGTGC CGACCGGCGT CGCGGTCTAT 
GCCAAGGGTT TTTGGCCGGC GAAGACTGGT CGCGACGCGT TGAAGATCGT CTGGGACGAC 
AGCAAGGCGG AGCAGCGCGG CACGCCCGAG ATTCTGTCGC AGTTTCGCGC GCTGGCGAAG 
ACGCCGGGCA AGACCGTGAA GCAGCACGGC GACGTCGACG CCGAATTCGC CAAGGGCGGC 
CGGCTGATCG AAGCGGAATA TGTGTTTCCC TATCTGGCGC ATGCGGCGAT GGAGCCGCTC 
AACGGCTTCA TCAAATGGGA CGGCGACACC GCGCTGGCGC GCTACGGCTG CCAGTTTCCC 
ACCCCCGATC ACGGCGCCAT TGCGCAGGTC CTAGGGATCG GCGTCGACAA GGTGAAGCTG 
GAAGTGCTGC TGGCCGGCGG CAGCTTCGGC CGCCGCGCGC AGCAGACCGT GCACGCCGCG 
ATTGAACTCG CCGAAGTCGC CAAGGCGATC GGGCCGGGCA AGCCGCTGAA ACTGGTGTGG 
ACCCGCGAGG ACGACATGCG CGGCGGTTAT TACCGGCCGT TCGGCGTGCA TCGGATGCGC 
GGCGTGGTGC GCGACGGCAA GATCGAGGGC TGGACCGACA CCATCGTCGG GCAGTCGATC 
ATGAAGGGCA CGCCGTTCGA GGCGATGACC TTCAAGGACG GCATGGATTC CACCACCTAT 
GAGGGCTCCA ACGAGATCCC CTACGAGGTG GCGAATTTCC GCTGCGATCT GCATCAGGTC 
GATGTCGGCG TCCCGGTGCT GTGGTGGCGC TCGGTCGGCC ACACCCACAC CGGCTACGCG 
GTCGAAGCTT TTATCGACGA GTTGCTGGAG GTCGCCGGGC AGGACCCGGT CGACGGCCGG 
CTGGCGCTGA TGGGCGATCG GAAGCCGCGG CATGCTGGCG TGCTGAAGGC GGTCGCCGAA 
TTGGCGAACT GGAAGGGCGC CAAGATTGAA GCCGGACGCG CCCGCGGCGT CGCGGTGGTC 
GAGAGCTTCA ACACTTTCGT GGCGCAGGTG GTCGAGCTGT CGATGACCGC GGAGGGGCCG 
AAGCTGCACA AGGTGTGGTG CGCGGTGGAT TGCGGCGTCG CGGTCAATCC GGACATCATC 
CGCGCCCAGA TGGAGGGCGG CATCGGCTTT GCGCTCGGCC ACATCCTCTA TGCCGAGCAG 
ACCATCGAGG CGGGCGCGCC GGTGGCCGGC AATTTCGACA AATATCGCTC GCTGCGCATC 
AACGAGATGC CCGAAGTCGA AGTGGTGATC GTCAACTCCG GCGAAAAGCC GACCGGGGTC 
GGCGAGCCCG GCGTGCCGCC GCTCGGACCG GCAGTGGCGA ATGCGATGGC GAAACTGGGA 
CTGCCGCGGC CGCGGCAATT GCCGATCGTG CCGGGAGCCA CCGCATGA

Protein sequence

MIHDRAIHDR TTQAKSAPTL SRRALLQAGA GLAIGVYIAG RTPSFAQNRP APQSVNIVPN 
TFLIIAPDDT VTVLCKAIEF GQGPFTGFAT LVAEELDADW SQMRAAHAPS NPALYKNLLF 
GVQGTGGSSA IANSFEQMRK VGAAARQMLV ATAAERWRVE ASEISVENGV IKHASGKQGR 
FGEFATEAMQ RPVPGDPKLK DPADFKLIGK EGAVQRLDSA AKSNGSAIFT LDLDEPDMLT 
VLIARSPKFG GVVSSFDAGA AKQIAGVVDV KQVPTGVAVY AKGFWPAKTG RDALKIVWDD 
SKAEQRGTPE ILSQFRALAK TPGKTVKQHG DVDAEFAKGG RLIEAEYVFP YLAHAAMEPL 
NGFIKWDGDT ALARYGCQFP TPDHGAIAQV LGIGVDKVKL EVLLAGGSFG RRAQQTVHAA 
IELAEVAKAI GPGKPLKLVW TREDDMRGGY YRPFGVHRMR GVVRDGKIEG WTDTIVGQSI 
MKGTPFEAMT FKDGMDSTTY EGSNEIPYEV ANFRCDLHQV DVGVPVLWWR SVGHTHTGYA 
VEAFIDELLE VAGQDPVDGR LALMGDRKPR HAGVLKAVAE LANWKGAKIE AGRARGVAVV 
ESFNTFVAQV VELSMTAEGP KLHKVWCAVD CGVAVNPDII RAQMEGGIGF ALGHILYAEQ 
TIEAGAPVAG NFDKYRSLRI NEMPEVEVVI VNSGEKPTGV GEPGVPPLGP AVANAMAKLG 
LPRPRQLPIV PGATA