Gene RPC_3408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3408
Symbol
ID	3970452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	3793770
End bp	3795260
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	72%
IMG OID	637926519
Product	hypothetical protein
Protein accession	YP_533267
Protein GI	90424897
COG category	[S] Function unknown
COG ID	[COG1376] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0116345
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.112401
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGCT ACAAGACGCC GGCGATTGTG GCGCTGGCGG CGCTGCTGGC GTTCGCGGCG 
CTCACCGGGG ACGCCGCCGC CAAGCGGGCC CGCGCGCCGG CGCCGACCGA GACCGCGGCG 
CCGCGCCCGG CCGGCGAGCC GATCATGGCG ATCGTGTCGA TCTCCGCGCA GAAGGTCACG 
GTCTACGACG CCGACGGCTG GATCTTGCGG GCGCCGGTCT CCACCGGCAC CACCGGGCGC 
GAGACCCCGG CCGGGGTGTT CGCGGTGGTC GAGAAGGACA AGGACCACCA TTCGACGATG 
TATGACGACG CCTGGATGCC GAACATGCAG CGCATCACCT GGAACGGCAT CGCGCTGCAC 
GGCGGCCCGC TGCCGGGCTA CGCCGCCTCG CACGGCTGCG TGCGGATGCC GTATGATTTT 
GCCGAAAAAC TGTTCGACAA GACCAATATC GGGATGCGGG TGATCGTCGC GCCGAACGAC 
GCAGCGCCGG TGTCGTTCGC CCACCCGGCC CTGTTCACGC CGAAGGCCGA GGCGCTGGCG 
ACGGCGCCGG CGCGCGCCGA GATGCTGAGC CGCGAGGCCG CGGAGGCCAG CGCCACCGCC 
GAGGCGGCCA AGAAGGCCAA CGCCGCGGCA AGCCGCGACG CATCCGCGCT CGCCGCGGCG 
CTGCGCAAGC TGGAGAAGGC CAAAGCGCGC GCCGATGCCC AGCTGAAGGC GGCCGACAAG 
GCGCTCGCCG CCGCGACCGA GCCGAACAGG CCCCGACTGG ACGAGCGGCA GCAGATCGCC 
GCGCAAAACG CCGCGGACGC CGCGGCGCAG CTCGACGCCG CCCGCGCCGA CGCCGAGACC 
AAGCGCGCCG CCGCCTTGGC GGCCAAGGAC GCCGCGAAGT CCGCCGCCGC CGCCAAGGCC 
ACCGCCGTGA CGGCGGCCAA CGAGGCCAAG CTCGCGCTGG AGCCGGTGTC GATCTACATC 
AGCCGCGCGA CGCAGACGCT GTACGTCCGC CGCAACACCC ATAAGCCGTG GCCGGACGGC 
GGCGAGGTGT TCGACGCCAG CATCGAAATT CCGATCAGCA TCCGCGATCC CGATCGGCCG 
ATCGGCACCC ACGTGTTCAC CGCGATGGCG CGTGACGAGA GCGGGCTGCG CTGGAGCGCG 
GTGACGATCG ATCATGGCGA CGACGCCAAA GCCGCGCTCG ACCGCATCAG CTTTCCGCAG 
GACGAGCTTG CGCGGATCGG CGTCACCGCG ATGCCGCGGT CCTCGATCGT GGTCTCGGAC 
GAGCCGCTGA GCAAAGAGAC CAACTATCGC ACCGAATTCG TCGCGGTGCT GAGCAACCAG 
CCGCAGGGCG GCTTCATCAC CCGCAAGCCG ACCGTGCCTG CGCCTGCGCC TGCGATGGCC 
GAGCGCGACG ACGGCGACGA TTTCTTCAGC TTCTTCCAGC GCAACCAGGG CCCCGCCGTG 
CCGCAACGCC GCGGCCCGGG CTTTGCCCCC GGCCCGCGCG GCTGGTGGTA G

Protein sequence

MQRYKTPAIV ALAALLAFAA LTGDAAAKRA RAPAPTETAA PRPAGEPIMA IVSISAQKVT 
VYDADGWILR APVSTGTTGR ETPAGVFAVV EKDKDHHSTM YDDAWMPNMQ RITWNGIALH 
GGPLPGYAAS HGCVRMPYDF AEKLFDKTNI GMRVIVAPND AAPVSFAHPA LFTPKAEALA 
TAPARAEMLS REAAEASATA EAAKKANAAA SRDASALAAA LRKLEKAKAR ADAQLKAADK 
ALAAATEPNR PRLDERQQIA AQNAADAAAQ LDAARADAET KRAAALAAKD AAKSAAAAKA 
TAVTAANEAK LALEPVSIYI SRATQTLYVR RNTHKPWPDG GEVFDASIEI PISIRDPDRP 
IGTHVFTAMA RDESGLRWSA VTIDHGDDAK AALDRISFPQ DELARIGVTA MPRSSIVVSD 
EPLSKETNYR TEFVAVLSNQ PQGGFITRKP TVPAPAPAMA ERDDGDDFFS FFQRNQGPAV 
PQRRGPGFAP GPRGWW