Gene Rpal_4669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4669
Symbol
ID	6412355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5030926
End bp	5032548
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	70%
IMG OID	642714548
Product	protein of unknown function DUF882
Protein accession	YP_001993635
Protein GI	192293030
COG category	[S] Function unknown
COG ID	[COG3108] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.227252
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCAGGG CCGGTTACGG CGCCGTGCTG ACGACGGCAT TGCTGCTGGC GGGCGCCGGA 
TCGGTCCATG ACGCATCCGC CGTCGGCGAC AGCCGGACCC TGTCGTTCCA CCACACCCAT 
TCGGGCGAGA GCCTCACCGT CACCTTCAAG CGCAGCGGCC GCTACGACGA AGATGCGCTG 
AAGCAGCTCA ATCACTTCCT GCGTGACTGG CGATCCCAGG AACAGACTGT GATGGACCGC 
CAGCTGTTCG ACATCCTGTG GGAAGTTTAC CGGGACGTCG ACGCCAAACA GCCTATCCAG 
ATCATCTCCG CCTATCGCTC CCCTGCCACC AACGCCATGC TGCGCCGCCG CTCCTCGGGA 
GTGGCGCGCC ACAGCCAGCA CATGCAGGGC CACGCGATGG ACTTCTTCAT CCCCGGCGTG 
GCGCTGGAGC AGATCCGGTT TGCCGGCCTG CGGCTGCAGC GCGGCGGTGT CGGCTTCTAT 
CCGACCTCCG GCTCGCCGTT CGTGCATCTC GATACCGGCG GCATCCGGCA CTGGCCGCGG 
ATGACCCCCG ACCAGCTCGC CCGCGTGTTC CCGGATGGCC GCACCGTGCA CATCCCCACC 
AACGGCAAGC CGCTGCGCGG CTACGAGCTG GCGCTGGCGG ACATCGAAAA GCGCCGCGAC 
GGCAGCACTG TCGCACCGGC CAAGACCAAC TTCCTGGCAA CGCTGTTCGG CGGCAAGTCG 
CGTGACGACG AGGACGAAAC CGCAGCGACG GCGGCACCGT CCGGCGCCAA GCCGATGGCC 
GACATCAAGG CCGCGGCCGC CGACGCGGTC GCGGCTGCGG CCGGCGTGAA GCCGGCCGAC 
GTGGGCTCCA GCGATCCGGT GCCGATGCCC CGCGCCAAGC CCGCCGCCGC TATCCAGATC 
GCCTCCGCCG GCGACGTCGT GCTGCCGGCG CCCCGCCCGG CTCAGGCTGC TAAAGCCGAG 
GCCAAGACCG CGGAACCGAG GACGGCAGAG TCGAAGACGG CTGACGCCAA GCCGCAAAGC 
CCCGCCGACA TCATCAACGC CCGCGGGTTT TGGGACGACA TCCCCGTAGC ACCGAAGCAG 
GCGAGCCCGG CCCAGGTCGC CGCCATCAGC GCCCGGCAGG CATTGGCCGC CGCCGACAAA 
TCCGAACAGG CCGCCGCGAT GAACGCGCTG GCCTACGCGC CGATGGCGCA GGAAAATTCC 
TCGAAGCACG CCCCGACCCG CCATCCGCAC GTCGTGACCG CCAGCGCCCC GCTGCCGCCG 
ACGCGCGCAT CGCTGCAGCG GCAGGCGGCG GTGTCGGGCA AGGTCGACAG CGTGATCGGC 
AAGTCGTCCG GTCAGGGCAA GACGGTGATC GCGACCTCGG CGCGACTCGC CGCCGCCGGC 
AGCCGCGACA ACGACGTCTG GATCCGCGCC ATGATCCTGA TGCCGCGGGC GATGCACACC 
GCCGCCACCG TGATTGGCGA TCCCGACATG ACGCTGCTGA GCGGCTATCT GGCCAAGCCC 
GAGGCGACGC TGGCCACCAG CTTCGCCGAC GATCCGCAGC CGGGCCTCTA CGCCGACGCC 
TTCAGCGGCT CGGCGGTGGC GACGCTGACC ACCACGGCAT TCCCGGGCGA CGCGTCGCGC 
TGA

Protein sequence

MPRAGYGAVL TTALLLAGAG SVHDASAVGD SRTLSFHHTH SGESLTVTFK RSGRYDEDAL 
KQLNHFLRDW RSQEQTVMDR QLFDILWEVY RDVDAKQPIQ IISAYRSPAT NAMLRRRSSG 
VARHSQHMQG HAMDFFIPGV ALEQIRFAGL RLQRGGVGFY PTSGSPFVHL DTGGIRHWPR 
MTPDQLARVF PDGRTVHIPT NGKPLRGYEL ALADIEKRRD GSTVAPAKTN FLATLFGGKS 
RDDEDETAAT AAPSGAKPMA DIKAAAADAV AAAAGVKPAD VGSSDPVPMP RAKPAAAIQI 
ASAGDVVLPA PRPAQAAKAE AKTAEPRTAE SKTADAKPQS PADIINARGF WDDIPVAPKQ 
ASPAQVAAIS ARQALAAADK SEQAAAMNAL AYAPMAQENS SKHAPTRHPH VVTASAPLPP 
TRASLQRQAA VSGKVDSVIG KSSGQGKTVI ATSARLAAAG SRDNDVWIRA MILMPRAMHT 
AATVIGDPDM TLLSGYLAKP EATLATSFAD DPQPGLYADA FSGSAVATLT TTAFPGDASR