Gene RPB_4363 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4363
Symbol
ID	3912178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4946921
End bp	4948192
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	68%
IMG OID	637886269
Product	twin-arginine translocation pathway signal
Protein accession	YP_487961
Protein GI	86751465
COG category	[R] General function prediction only
COG ID	[COG0446] Uncharacterized NAD(FAD)-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0121845
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGAAAC CGATCCTGAT CAGCCGTCGC GGCGTGATCC GCGCCGCCGC GGCATCCACG 
GCGTTGCTCG CCTGCCCGGC GATCGCCAAA GCGCGTCCGA AGGTCGTGGT GATCGGCGGC 
GGCGCCGGCG GCGCCACCGC GGCGAAGTAT CTGCGCCACG GCGACGATTC CGTCGAGGTG 
ACGCTGGTCG AGGCCAACCG CATCTACGTC ACGCCGTTCA CGTCGAACCT GTATCTCGGC 
GGGCTGAAGC CGTTCGAGGC GTTGAACTAC GGCTATGAGG GCATTGCGGC GCGCGGCGTC 
GGCATGGTGT TCGACAGCGT CGCCGCGATC GACCGCGACG CCAAACAGGT GCGCACCGCG 
AGTGGGGCGC GGCTGTCCTA CGACCGCCTG GTGCTGTCGC CCGGCATCGA TTTCCGCTGG 
GACGCGATCC CCGGCTATTC CGAGGCCGCC GCCGAGACGA TGCCGCACGG CTATCGCGGC 
AGCGCGCAGT TCCAGTTGCT GAAGCGCCGG CTCGACGCGC TGTCCGACGG CGCGCTGATC 
GTGATCATCG CGCCGCCCAA TCCGTATCGC TGCCCGCCGG CGCCTTACGA GCGCGCCTCG 
ATGATGGCCC ATGCGCTGAA GAGCCGGGGC GTGAAGAACG CCCGCATCGT CATCCTCGAC 
GCCAAGGATC ATTTCGCGAT GCAGACGTTG TTCATCGACG GCTGGGAGCG GCATTATCCC 
GGCATGATCG AATGGCAGGA CCCGACCATC CACGGCGGCA TCAAGGCAGT CGATCCGAAG 
GCGATGACCG TGACCACCGA TTTCGAGACC CACAAGGCGG CGCTGGTCAA CGTCATCCCG 
CCGCAGATCG CGGGGAAGCT CGCGCGCGAT TCCGGCCTCG CCGACGCCAG CGGCTTCTGC 
CCGGTCGATG CCGGCACCAT GATCTCGCTG ATCGATCCGT CGATCCAGGT GATCGGCGAT 
TCCGCGACCG GCGGTGAATT TCCCAAATCC GGCTTCGCCG CCAACAACGA GGCGAAGGGC 
GCGGCGATGA TCCTGCGCGC CGAATTGCTC GGCGAGCGGC GGATGCCGAT CCGCTTCACC 
AACCATTGCT GGAGCGACAT CGCCCCCGAC GACGCCGTCA AGAACGGCGC CCGCTACACC 
CCGCAGGACG GCAAGATCGT GGCGTCCGAT CCCTACACCT CGCAGCTCGA CGAAAGCGCG 
GAGCTGCGCG CCAAGCAGGC GCGCGAGGCG GCGGGCTGGT ACATCGGCAT GACGACGGAC 
ATCTTCGGCT GA

Protein sequence

MPKPILISRR GVIRAAAAST ALLACPAIAK ARPKVVVIGG GAGGATAAKY LRHGDDSVEV 
TLVEANRIYV TPFTSNLYLG GLKPFEALNY GYEGIAARGV GMVFDSVAAI DRDAKQVRTA 
SGARLSYDRL VLSPGIDFRW DAIPGYSEAA AETMPHGYRG SAQFQLLKRR LDALSDGALI 
VIIAPPNPYR CPPAPYERAS MMAHALKSRG VKNARIVILD AKDHFAMQTL FIDGWERHYP 
GMIEWQDPTI HGGIKAVDPK AMTVTTDFET HKAALVNVIP PQIAGKLARD SGLADASGFC 
PVDAGTMISL IDPSIQVIGD SATGGEFPKS GFAANNEAKG AAMILRAELL GERRMPIRFT 
NHCWSDIAPD DAVKNGARYT PQDGKIVASD PYTSQLDESA ELRAKQAREA AGWYIGMTTD 
IFG