Gene Rpal_3358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3358
Symbol
ID	6411032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	3612762
End bp	3613868
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	68%
IMG OID	642713238
Product	Mu-like prophage I protein-like protein
Protein accession	YP_001992335
Protein GI	192291730
COG category	[R] General function prediction only
COG ID	[COG4388] Mu-like prophage I protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGGAC ACCAATCCAA ACCAGTTTTG AATGTGGCGC GCGGCGTCGG TCAGCCGATC 
GCGCTGAACG CCGACGGCTC GGCGCCGGAA TGGATCATGC TGATCCCGGC CGGCGACGGC 
GGTGTGATCC ACACCGTCGA TGGCCGTGGT CCGTATCGCG TCGCAGATCC GGCGGCGCTC 
GCGGCGCAGA GCCTGGCGGC GGTCGGTGGC CGCGCGCCGC TCGACGAGAA CCATGCGACG 
GATCTCGCTG CGCCGAATGG CGAGCCGTCG CCGGCGCGCG GCTGGATCGT CGGCGCCGAG 
GCGCGTGACG GCGCCATCTG GGGGCGTATC GACTGGAACG CATCCGGCGC GGCGCTGATG 
GCGGATCGTG CCTACCGGTT CATCTCTCCC GTCTTCACCC ACGACAAGGC CGGCAACGTG 
CTGACGCTGC TGCGTGCCTC TCTGACCAAC GTCCCAAACC TGCGCGGCAT GGCCGCTCTG 
CACCAACAGG AGAATGCAAT GGATCTGCTC GCTCAGCTGC GCGCGCTGCT CGGCCTCGAC 
GACACTGCGG ACGAAGCTGC GGTGATCGCC AAGATCAAGG ATCTGAAGGG CGGCGGCGAT 
GCAACCGCGA TGAACGCGGC TGTTAGCAAG GCGCTCAACG CCGCGCTGTC GCCGATCGCG 
GCGGTCGTCG GCCTCGCTGC CGACGCCGAT GCCCAGGCGA TTGCGCAGGC AGTGTCGAAG 
GCGGCGGCGC CCGAGGGTAA TCCGATCGTC AAGTCGCTGC AGTCCGAACT GGCGACCGTC 
ACCACAAAGC TCAACGATCT GCTCGGCAGC GCCGCCAAGG AGAAGGCGAC CGCTTTCGTC 
GATGGCGCGA TCCGGGATCT GCGCGTCGGC GTGAAGCCGC TGCGCGAGCA CTACATCGCG 
CGCCACATGG CAGACCCCGC CGCGGTCGAG AAGGAAATCA ATTCATTCCC GAAACTCGGC 
GAGTCCGGCC AGACGCTGTT GCCGACCGAT CCGCCGAAGG ACGGCCAGGT CTCGCTCAAT 
GCCGAGCAGC TGACTGCCGC CAAGGTGCTG GGCATCAAGC CCGAGGACTA CGCCAAGACG 
CTGGCGGCCG AACGCGCCGC AAGCTGA

Protein sequence

MSGHQSKPVL NVARGVGQPI ALNADGSAPE WIMLIPAGDG GVIHTVDGRG PYRVADPAAL 
AAQSLAAVGG RAPLDENHAT DLAAPNGEPS PARGWIVGAE ARDGAIWGRI DWNASGAALM 
ADRAYRFISP VFTHDKAGNV LTLLRASLTN VPNLRGMAAL HQQENAMDLL AQLRALLGLD 
DTADEAAVIA KIKDLKGGGD ATAMNAAVSK ALNAALSPIA AVVGLAADAD AQAIAQAVSK 
AAAPEGNPIV KSLQSELATV TTKLNDLLGS AAKEKATAFV DGAIRDLRVG VKPLREHYIA 
RHMADPAAVE KEINSFPKLG ESGQTLLPTD PPKDGQVSLN AEQLTAAKVL GIKPEDYAKT 
LAAERAAS