Gene Rpal_0444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0444
Symbol
ID	6408092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	479406
End bp	480491
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	67%
IMG OID	642710356
Product	hypothetical protein
Protein accession	YP_001989480
Protein GI	192288875
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.71629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGCCG CTACATCTCT GCTTCCTGAA CTCGATGACA TTGTCAGGCA GGGCGATCCC 
GTCCGGCGCG CCGACGCCGT GCGCCGGATT TCCGACCTGT ATATTCGGGG CGCTGAGAGC 
TTCCAGCCCG ATCATGTCGC GCTGTTTGAT GGCATCCTGC TGACGCTGGT GCCGGAGATC 
GACGTCGAAG TTCGCAGCGA ACTGGCACAG CGGTTTTCGG AAATCACCAA TGCGCCGCCC 
GAACTGGTCC GGCAGCTCGT GCATGACGAA GACATCGGTA TCGCCGGGCC GCTGTTGCGG 
CGCTCGACGA TGCTCGATGA TCCAACGCTC GTCGAACTCG CCAGGCTGCG TGGTCAGACG 
CATCTCCTGG CGATCTCCGA GCGGCTGAGC ATTTCGCCGC CGATCACCGA CGTGATCGTG 
CGCCGGGGTG ACCGCGATGT GGTGCGCAAG GTCGCCGGCA ACGCGGGCGC CGAATTCTCC 
GCCACCGGTT TCAACGGCCT GATCCGCCGT GCCGCGCAGG ACGGTGTGCT GGCGGTCGCG 
GTTGGCACGC GGGACGATCT GTCGCCGCCG CGGCTGAAGG ATCTCTTGGC GTGCTCGACC 
GATCTGGTGC GCCGGCGCTT GTTCGAAAGT GCGCGGCCGA GTGCGCGGAT CGCGATCAAC 
CGGGCGATGC GCGAGCTCGC TGGCGAGTCG CGGCAGCCGT CGGTGCAGCG CGATTTCGAT 
GCCGCACAGC GCTCGGTGGT GGAGTTGCAC AACAGGGGTG AACTCAACGA AGCGACCGTG 
ATCGGCTTCG CGCGGGCGCA TCAATACGAG GAGACCGTGG CGGCGCTGTC GGCGATGACC 
GGCACGCGAA TCTCCACCCT CGACCAGATG ATGTCCGGCG AGCGGCACGA CCCGGTGCTG 
ATCCTCGGCA AAGCGCTCGG CTTCGGCTGG GCGACCGTAC GAGCCCTGAT CGGGCTGCGG 
CTCGGGCCGG ACCGCTCGGT GGCCTGCCCC GACGTCGAAG AAGCGCAGCA CAATTTCGAG 
CGCCTGGCGC TGTCCACGGC GCAGCGTGTG CTCGGCTTCT GGAAGATGCG ACAGGCTGAC 
GCCTGA

Protein sequence

MPAATSLLPE LDDIVRQGDP VRRADAVRRI SDLYIRGAES FQPDHVALFD GILLTLVPEI 
DVEVRSELAQ RFSEITNAPP ELVRQLVHDE DIGIAGPLLR RSTMLDDPTL VELARLRGQT 
HLLAISERLS ISPPITDVIV RRGDRDVVRK VAGNAGAEFS ATGFNGLIRR AAQDGVLAVA 
VGTRDDLSPP RLKDLLACST DLVRRRLFES ARPSARIAIN RAMRELAGES RQPSVQRDFD 
AAQRSVVELH NRGELNEATV IGFARAHQYE ETVAALSAMT GTRISTLDQM MSGERHDPVL 
ILGKALGFGW ATVRALIGLR LGPDRSVACP DVEEAQHNFE RLALSTAQRV LGFWKMRQAD 
A