Gene Rpal_1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1008
Symbol
ID	6408663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1071230
End bp	1072321
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	69%
IMG OID	642710922
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_001990040
Protein GI	192289435
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCGC TGCGCGCGTT CGCGATTGTT GCGGCTTCAC TGCTGCTTGC CACCGGCGCG 
GCGGCGCAAG TTTCGCTGTC GCCGCCGTCT GGCCCCAACC CATTCCCGAA GCCGCTGGAG 
CCGGAAAAGC CGAAGCCCAG GCCGCCGGCC CCGGCCAAGG CACCCGCCAC CGAGGCGAAG 
GACAAGGCCA AGAAGCCGGG AGACAAACCC GACGCCAAGG CCGCCCCCGA GGGCGGCGCG 
GCCGCGGCCG AAGACCCCAA CGTCGACCTG GTGTACGGCG CCTATCAGCG CGGCTTCTAC 
AAGACCGCGT TCGAACTGGC GCAGAAGCGC GCCGCCGACA ACGACGCCAA GGCCATGACC 
ATGCTGGGCG AGCTCTATGC CAATGCCCTC GGCGTGAAGC GCGACTACAA GAAGGCGGCG 
GAGTGGTACT CGCGAGCGGC CGATCTCGGC GACCGCGAGG CGATGTTTGC CCTCGCCATG 
GCCCGGATGG GCGGCCGCGG CGGCCCGCCG AACCGCGAGG AAGCCGCCAA ATGGCTGGCG 
CAGGCTGCCA AGCTTGGCGA GCCGAAGGCA GCCTATAATC TGGCGCTGCT CTATCTCGAC 
GGCCAGACCT TCCCGCAGGA CGTCAAGCGC GCTGCCGAAC TGCTGCGGAT GGCCGCCGAT 
GCCGGCAACC CGGAAGCCCA ATACGCGCTG GCGACCTTCT ACAAGGAAGG TACCGGGGTA 
ACCAAGAGCA TCGAGCAGTC GGTGCGGCTG CTGCAGGCCG CCGCACTGGC CGGCAACGTC 
CCAGCCCAGG TCGAATACGC CATCGCGCTG TACAACGGTA CCGGCACCCC GAAGAACGAG 
CCGGCCGCCG TCGCGCTGCT GCGCAAGGCG GCGCGCGCCA ACAACCCGAT CGCCCAGAAC 
CGCCTCGCCC ATGTGTTGGT CTCCGGCCAG GGCGCGCCGC GCGACATCAA CGAGGCGATG 
AAATGGCACC TGATCGCCAA GACCGCCGGC AAGGGCGATC TGCAGCTCGA CCAGACGCTG 
GCCCAGATGT CGGCCGAGGA TCGCGCCAAG GCCGAAGAGG CGGCGCGCAC CTGGATTGGC 
GGCGGCAAAT GA

Protein sequence

MKALRAFAIV AASLLLATGA AAQVSLSPPS GPNPFPKPLE PEKPKPRPPA PAKAPATEAK 
DKAKKPGDKP DAKAAPEGGA AAAEDPNVDL VYGAYQRGFY KTAFELAQKR AADNDAKAMT 
MLGELYANAL GVKRDYKKAA EWYSRAADLG DREAMFALAM ARMGGRGGPP NREEAAKWLA 
QAAKLGEPKA AYNLALLYLD GQTFPQDVKR AAELLRMAAD AGNPEAQYAL ATFYKEGTGV 
TKSIEQSVRL LQAAALAGNV PAQVEYAIAL YNGTGTPKNE PAAVALLRKA ARANNPIAQN 
RLAHVLVSGQ GAPRDINEAM KWHLIAKTAG KGDLQLDQTL AQMSAEDRAK AEEAARTWIG 
GGK