Gene Rpal_3989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3989
Symbol
ID	6411671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4275486
End bp	4277108
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	62%
IMG OID	642713871
Product	Terminase
Protein accession	YP_001992960
Protein GI	192292355
COG category	[R] General function prediction only
COG ID	[COG4626] Phage terminase-like protein, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACCC GCTCAACGTA TCCTGATTGG CTGTTCGACG GCTCACCGAT CGACGACCCG 
CTCGGCTATG GCGAGCGCGC CGTCAATTTC CTGCGCCTAC TCAAGCACCC CAAAAGTGCG 
GCGCCTAAGC GCGCGCTGAT GCTGGACGAA TGGCAGGACC GGATCGTCCG CCGCATCTAT 
GGTCCGCGGG ACCAGAACGG CCACCGGATT GTCAAGACGG TGGTCCTGCT ACTCCCGCGC 
GGCAACCGTA AGACGTCGTT GGCGGCGGCG CTTTCGCTTC TGCACACCAT CGGCCCGGAA 
CGACGGCCCG GCGGCGAGGC AATCTTCGCA GCGGGCGACC GGCCGCAAGC AAGCCTCGGT 
TTCAAAGAGG CCGCCGGCAT CATTCGGGAA GACAAGCGAC TGGTGAAAGC CACGCGTATC 
TATGACGCTC ACAACAGCGT CAAGAAAATC GTCTTCAACA AGGATGGCTC TTTCCTCGAA 
GCCATCAGCG GCGAAGGAGC GCCGGCCCAC GGCCGCACCC CAGCCTTCGC CTTCGTTGAC 
GAACTGCACA TTTGGAAGAA CGCGGACCTC TGGACCGCGA TCAAGTCGGG CCTGCCCAAG 
ACCCAAGGCT CTCTGCTGAT CATCGCGACC ACTGCCGGCC GCGGTCAGGA CAACATCGCT 
CACGAGATCG TCGACCGCGC CCGCAAGGTT GCGCGCGGCG ACATCGATGA TCCGTCGTTG 
CTTCCGATCC TGTTCGAAAC GCCCGATGAT GCCGATTGGA GAGACGAAGC CCTTTGGCAC 
CGCGCAAATC CTGGCCTTGC ACTCGGCTAT CAGGACATTG AGGGACTGCG CCAGCTCGCG 
CGCGAGGGTG AAACCAGCAT CACTGCCCGT GAGACATTCC GGCAATACAA TCTGAATGTC 
TGGCTCGACC GCTCAACTGA CCCGTTCGTG GAGATGGCGG TCTATGATCA GGGCGCAGAC 
CCGGTCGACC TTGAGGCGCT GAAGGGGCGC CCGTGTTGGC TCGGTGTCGA TCTCTCGTCA 
CAAACCGACC TCACCGTGAT CGTTGCCGCG TGGCGCGATG ACGATGGCGG GTTCACCGTT 
CTGCCCATTT TCTTCTGTCC GAAGATGAAC CTTCGCGAGC GGGAAGAGCA AACCGGTGCC 
CCATATCTCG AATGGGAACG ACAAGGGCTG ATCACCGCGA CCGACGGCAA CGTGGTGGAC 
TTTGATGCGG TGGAAGCCGC TATTCGCGAC CTCTGCGATC GCTTCGAAGT CACGGAGATT 
GCGTTCGATC CTGCTCTTGC GCGAAGCGTG CTCAACAGCT TGCAGAAAGA CGGCTATCCA 
GCGGTGGAAA TGCGCCAGGG TGCGCTCACC ATGATGCCCG CCATCGCCGA GCTTGAACGC 
GCGATCGTTG CCGGCAAGTT TCGGCACGGT GGCAACCCCG TGCTACGGTT CAACTTCGCC 
AATGTCGAGG TAGAGCGGAA CAAGCAACAG CACGCCGTTC GGTTCGTCAA ATCCAAGAGG 
TGGTTGAGTA TCGACGGTGC GGTTGCGGCG GCGATGGCAG TCTCGCGCGC CGCGGCCGGC 
GAGAGCGGCC GGTCCCTTTA CGACGATCCG GCCCTCAAAC CCGAAGATTT CGTGTGGAGC 
TGA

Protein sequence

MTTRSTYPDW LFDGSPIDDP LGYGERAVNF LRLLKHPKSA APKRALMLDE WQDRIVRRIY 
GPRDQNGHRI VKTVVLLLPR GNRKTSLAAA LSLLHTIGPE RRPGGEAIFA AGDRPQASLG 
FKEAAGIIRE DKRLVKATRI YDAHNSVKKI VFNKDGSFLE AISGEGAPAH GRTPAFAFVD 
ELHIWKNADL WTAIKSGLPK TQGSLLIIAT TAGRGQDNIA HEIVDRARKV ARGDIDDPSL 
LPILFETPDD ADWRDEALWH RANPGLALGY QDIEGLRQLA REGETSITAR ETFRQYNLNV 
WLDRSTDPFV EMAVYDQGAD PVDLEALKGR PCWLGVDLSS QTDLTVIVAA WRDDDGGFTV 
LPIFFCPKMN LREREEQTGA PYLEWERQGL ITATDGNVVD FDAVEAAIRD LCDRFEVTEI 
AFDPALARSV LNSLQKDGYP AVEMRQGALT MMPAIAELER AIVAGKFRHG GNPVLRFNFA 
NVEVERNKQQ HAVRFVKSKR WLSIDGAVAA AMAVSRAAAG ESGRSLYDDP ALKPEDFVWS