Gene RPC_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2039
Symbol
ID	3973958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2221235
End bp	2222446
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	67%
IMG OID	637925148
Product	hypothetical protein
Protein accession	YP_531913
Protein GI	90423543
COG category	[V] Defense mechanisms
COG ID	[COG0577] ABC-type antimicrobial peptide transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.417724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTGC GATCGCTGAG CGCCAACCGG CTGCGCTCGG CGCTGACGAT GGTCGGCATC 
GTCGTCGGCG TCGCGGCGGT GATCGCGGTA ATGGCGGTGG GCGAGGGCGC ACGGGCGGCG 
GTCGCGCAAC AAATTCGCGC GCTCGGTGCT AGCCTGATCA TCGTGACCTC CGGCGCCGGC 
TTCCAGAGCG GCCTGCGCCT CGGTGCGGGC ACCACGTCTA ACCTGTCGGA AGCCGATGCC 
GATGCCATTC AGAACGAGAT TCCTGAGGCC GTCACCGCCT CGCCGTTCCT GCGCACTCAG 
GCGCAAGTCC TCGGCAATGG AACCAACACC GCGACCTCGG TGTTCGGCGC GGACAACCGC 
TTCCTGACCG CTAGAGAATG GGATGTGGAA ATCGGCCGGC GGTTCGATGC CGAGGAAAGC 
CGCAGCGGGG AAACCGTCGC GCTGATCGGG CGGACCGTGG CCGGCTTGCT GTTCCCCGAG 
CAGAATCCGA TCGACGAACA GATCATCATC CGCGGCGTTC CGCTGCGGAT CATCGGCGTG 
CTCGCGGTCA AAGGCCAGTC GATGGTGGCG CAGGATCAGG ACGACCTGGT GATCGTGCCG 
ATCGACGTCG TGCGGCGGCG CATCATTGGC GGCAACCCGA CTGGCGACGG CAGCGTCGGA 
GCGATCCTGG TCAAGGCCGA AGACGGCGCG GTGCTGTCCG AAACCAGCCA ATCGGTCCGC 
GCCTTGCTGC GGCAACGCCA CCGGCTGGTC TCCGATCAGG AGGACGATTT CCAGCTTCGA 
AATCTCACCG AAATCATGAA TGCGGTGGCC TCCAGCGCCA ACGCGGTGTC GTTGCTGCTG 
GCCGCCGTTG CGGCGATTTC GCTGTTCGTC GGCGGGGTTG GAATCATGAA CATGATGCTG 
GTCGCGGTGA CCGAACGGAT CCCGGAAATA GGACTGCGAC TGGCGATCGG GGCGACACGA 
GCCAACATCC TGGCGCAGTT TCTCGCCGAG GCCGGCCTGC TGGCTGCGAC CGGCGGCGCG 
GTCGGCGTGG CCATCGGCTG GGGATTGGCG GCGGCGATCG CGGCGATCGC CGCGTGGCCG 
ACACTGATCG CTGCGCATCA TGTGCTGGGC GCGCTGTTGT TCTCCGCCCT GGTTGGCCTG 
GTGTTCGGGT TCGTGCCGGC GCTGCGGGCC TCCCGGCTCG ATCCGATCGT CGCGCTGAGA 
AGCCTGTCAT GA

Protein sequence

MALRSLSANR LRSALTMVGI VVGVAAVIAV MAVGEGARAA VAQQIRALGA SLIIVTSGAG 
FQSGLRLGAG TTSNLSEADA DAIQNEIPEA VTASPFLRTQ AQVLGNGTNT ATSVFGADNR 
FLTAREWDVE IGRRFDAEES RSGETVALIG RTVAGLLFPE QNPIDEQIII RGVPLRIIGV 
LAVKGQSMVA QDQDDLVIVP IDVVRRRIIG GNPTGDGSVG AILVKAEDGA VLSETSQSVR 
ALLRQRHRLV SDQEDDFQLR NLTEIMNAVA SSANAVSLLL AAVAAISLFV GGVGIMNMML 
VAVTERIPEI GLRLAIGATR ANILAQFLAE AGLLAATGGA VGVAIGWGLA AAIAAIAAWP 
TLIAAHHVLG ALLFSALVGL VFGFVPALRA SRLDPIVALR SLS