Gene RPC_4624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4624
Symbol
ID	3972134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	5165247
End bp	5166617
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	66%
IMG OID	637927735
Product	agarase
Protein accession	YP_534465
Protein GI	90426095
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTGTG AACAAGGAGA TAGATGGGTG CGACGAACCA AATGGGGCGG CCTTGCCGAT 
GGCTGTTTCG AACCCAGCGG CTTCTTTCGG GTGGAGCAGG ACGATGGCGT ATTCTGGTTC 
GTCGATCCCG ATGGCGGCCG GTTTCTGTCC AAGGGCGTCA ACAACGTCCA GTTCGCTCCG 
GATCAGATTC GCGGCACCGA TCGGACGCCC TATGCCGAGG CCTGCCTGGC GAAATACGGC 
AGCCGCAACG AATGGCGTCG CGCGGCGGCG GAGCGATTGA CCGGCTGGGA TTTCAACACG 
CTGGGCTGCT GGTCGGATGA GATCGTCGCC GGCGCAGGCG CCTTGCCGCT GGCCACCGCG 
CCGATCGTCG ACCTCGGCGC TTCGTTCTGG CTGCATCGTC ACGGCCAGCG CTTTCCCGAC 
GTGTTCGACG CCGAATTCGA CAATCACATC CGGCAACGCG CCAAGGACCT GTGCACGCCG 
CGCCGCAATG CTCCGGAATT GCTCGGCACC TTCATCGACA ACGAGCTGTA CTGGTCGCCT 
GACTGGCGCG GCCACGACGA GTTGCTGACC ACGTTCTTGA ATTTTCCGCC CGGACGCGCC 
GGCCGCGTCA CCGCGATCAC CGCGCTGCAG CAGCACTATG GCGAGTTCGC CCACTTCAAC 
GTGATCTGGC ACACGCCGGT GCGGTCCTGG GAGGCACTGC ATGCGCTCGA GACCATCGCG 
GCGCCGTTTG TGCGCGCGGC GCCGGGCGGC GATTATGCCG TGCTCGAAGC GGAGGCCAAC 
CGCAACCCGC GGCGCGCGGC GTTCGCCGCC GATTGCGACG CCTTTGCCGC GGTGGTGGCC 
GACCGCTATT TCGAACTCTG CACGGCGGCG ATCAAGGCCG CCGATCCCAA CCATCTGGTG 
CTCGGCGCAA GGCTCGGCGC GCTGCCGCAC GACGGCGTGG TCGCCGCCGC CGGCCGCCAT 
CTCGACGTGA TTTCGTTCAA TTGCTACGGC TTCGACCCAT CGGCCTTGCT CGACGCCTAT 
GCGGTGACCG GCAAGCCCTG CCTGATCACG GAGTTTTCGT TTCGCGGCGA CGATGCAGGC 
CTGCCGAACA GTTGCGGCGG CGGTCCGCGG GTCGCCACCC AGGCCGACCG CGCCCACGCC 
TTCGAGCGCT ATGTCGCCGC GGCGCTGATC AAGCCGAATC TGGTCGGCTA CCACTGGTTC 
GAGCATGCCG ATCAGCCGGC CGAAGGCCGC TTCGACGGCG AGGACTGCAA TTACGGCACG 
GTGACGATCA AAGACGAGGT CTATCCGGAA CTCACGGCAT CGATGAGCCG GTTGAATGCG 
GCGGCGGAGA GCATCCATCG CAAGGCCGTG GCGGCGCGAC CGGCGGCTTG A

Protein sequence

MRCEQGDRWV RRTKWGGLAD GCFEPSGFFR VEQDDGVFWF VDPDGGRFLS KGVNNVQFAP 
DQIRGTDRTP YAEACLAKYG SRNEWRRAAA ERLTGWDFNT LGCWSDEIVA GAGALPLATA 
PIVDLGASFW LHRHGQRFPD VFDAEFDNHI RQRAKDLCTP RRNAPELLGT FIDNELYWSP 
DWRGHDELLT TFLNFPPGRA GRVTAITALQ QHYGEFAHFN VIWHTPVRSW EALHALETIA 
APFVRAAPGG DYAVLEAEAN RNPRRAAFAA DCDAFAAVVA DRYFELCTAA IKAADPNHLV 
LGARLGALPH DGVVAAAGRH LDVISFNCYG FDPSALLDAY AVTGKPCLIT EFSFRGDDAG 
LPNSCGGGPR VATQADRAHA FERYVAAALI KPNLVGYHWF EHADQPAEGR FDGEDCNYGT 
VTIKDEVYPE LTASMSRLNA AAESIHRKAV AARPAA