Gene Rpal_4300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4300
Symbol
ID	6411984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4628869
End bp	4630428
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	69%
IMG OID	642714182
Product	hypothetical protein
Protein accession	YP_001993271
Protein GI	192292666
COG category	[S] Function unknown
COG ID	[COG1376] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACCGAC CGACGATCAA GCATGGCACC TCGCGGCGCT TCAGGACGCC CGCCCTCCTC 
ACCCTGGCGA CGCTGCTCGC CGTGGCAGCC CCGGCGCCCG ACGCGGACGC CAAGCGGGCG 
CGCCCGGCGG CCACCACCGA GGCGACCGCG CCGCGCGAAG CCGGTGAGCC GATCATGGCG 
ATCGTCTCGA TCAAGGGTCA GCGGGTGACG TTGTACGACT CCGAAGGCTG GATCTATCGC 
GCGCCGGTCT CGACCGGCAC CACCGGTCGC GAAACCCCGG CCGGCGTGTT CGCCGTGGTC 
GAGAAGGACA AGGACCACCG TTCGACGATG TACGACGACG CCTGGATGCC GAACATGCAG 
CGCATCACCT GGAACGGCGT CGCGCTGCAC GGTGGTCCGC TGCCCGGCTA TCCCGCGTCA 
CACGGCTGCG TCCGGATGCC GTACGAGTTC GCCGAGAAGC TGTTCGACAA GACCCGGATC 
GGGATGCGGG TGATCGTGTC GCCGGAGGAC GTCGAGCCGG CCGATATCAG CCATCCGGTG 
CTGTTTTCGC CGAGTGCCGA GGCGCTGGCC GCCGCGCCGA CGCGCGCCGA GACCGCTGTG 
CGTGAGGCCG AGCAGGCCGC GCAGGCGGCC GACGAGGCCA AGACCGCCGC GGCCGCTGCC 
GCCCGTGCGG TAAAACCGCT CAAAGACAGC TTACGCAAGC TGGAGCGCGC CAAGGCGCGG 
GCCGAAGCCG CGCTGAAGGC CGCCGACAAG GTGCTGGTCG CCGCCGCCAC CGATGAAGCC 
AAGGCCAAGG CGGAAGAGCG TCAGCAGCAG GCCGCGCAGC AACTCGGCGA AGCCACGACC 
CAGCTCGAAA CCGCCAAAGC GGATGCCGAC GCCAAGCACG CCGCCGCGGC CGCCACCAAG 
GAGGCGGCCA AAGCTACCGC GGCGAAGAAA GCGGAAACCG CGAAGCTCGC GACCGACGCC 
AAGCTGGCGC AGGAGCCGGT GTCGATCTAC ATCAGCCGGG CGACGCAGAA GCTCTACGTC 
CGCCGCAACA CCCGCAAGCC GCTGCCCGAT GGCGGCGAGC TGTTCGACTT CTCGATCGAA 
GTGCCGGTGG CGATCCTCGA TCCGGAGCGG CCGATCGGCA CTCACATCTT CACCGCGACG 
GCGCGCAACG ACGCCGGCCT GCGCTGGAGC GCGGTGACGA TCGAGAGCGC CGACAATGCC 
AAGAGCGCGC TCGACCGCGT CACGATCCCG CCGGAGGTGC TGGAGCGGAT CGGCCCGACC 
GCGCTGCCGC GCTCCTCGAT CATCATCTCC GATGAGCCGC TGAGCGCAGA GACTAACTAC 
CGCACCGAAT TCGTCGCGGT GCTGAGCGAT CAACCGCAGG GCGGCTTCAT CACCCGCAAG 
CCGACCAGCA GCGACGTTCC GGTGGCCAGC AGCGATGACT GGAACGATGG TGGCTTCGGC 
TTCTTCTTCC AGCCGAGGGA GCAACGCGTC CCTGCGCAGT CCCGGCGCGG CCGCTACGGC 
GAAGGCTATT ACCGCCAGCC GCAAGACTAC TACCGCCAGG AGCAGCCGGG CTGGTGGTAG

Protein sequence

MNRPTIKHGT SRRFRTPALL TLATLLAVAA PAPDADAKRA RPAATTEATA PREAGEPIMA 
IVSIKGQRVT LYDSEGWIYR APVSTGTTGR ETPAGVFAVV EKDKDHRSTM YDDAWMPNMQ 
RITWNGVALH GGPLPGYPAS HGCVRMPYEF AEKLFDKTRI GMRVIVSPED VEPADISHPV 
LFSPSAEALA AAPTRAETAV REAEQAAQAA DEAKTAAAAA ARAVKPLKDS LRKLERAKAR 
AEAALKAADK VLVAAATDEA KAKAEERQQQ AAQQLGEATT QLETAKADAD AKHAAAAATK 
EAAKATAAKK AETAKLATDA KLAQEPVSIY ISRATQKLYV RRNTRKPLPD GGELFDFSIE 
VPVAILDPER PIGTHIFTAT ARNDAGLRWS AVTIESADNA KSALDRVTIP PEVLERIGPT 
ALPRSSIIIS DEPLSAETNY RTEFVAVLSD QPQGGFITRK PTSSDVPVAS SDDWNDGGFG 
FFFQPREQRV PAQSRRGRYG EGYYRQPQDY YRQEQPGWW