Gene RPB_2102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2102
Symbol
ID	3908516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2390044
End bp	2391570
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	68%
IMG OID	637883995
Product	AMP-dependent synthetase and ligase
Protein accession	YP_485719
Protein GI	86749223
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0103698
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00738947
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATCTGT CCGAATGGCT CGCCGCGAGC GCACGGCTGC GGCCGTCCGC GCCGGCCTTG 
CTCACCGGCA CCACGATCGA GGCGGACTAC GCGACGTTCG CGCAGCGCGC CGCCTCGTTC 
GCTGCAGCGC TGCAGCGCGA CTACGGCATC GTCTCCGGCG ACCGCGTCGC GCTGTTCGCG 
CATAATTGCA CGCAATATCT CGAGGCACTG TACGGCATCT GGTGGGCGGG CGCGGTGGCG 
GTGCCGATCA ACGCCAAGCT GCACGGCAAG GAAGCGGCGT GGATCTGCAG CAATTCCGGC 
GCCAAGCTGG CGCTGATCTG CGACGACACC GCGGACACTT TCAACGAGGC CGCGGGCGAA 
TTGCCGGCCC GCATGGCGAC GCTGGCGCTC GACAGCGACG CCTACATTCG CGCCCGTAGC 
GGCGACGGGC CGGCGGCGCC GGCGGCGCGC GAGGACGGCG ATCTCGCCTG GCTGTTCTAC 
ACCTCCGGCA CCACCGGCCG GCCGAAGGGG GTGATGCTCA GCCACGGCAA TCTGATCGCG 
ATGTCGCTGT GCTATTTGGC CGATGTCGAC ACGGTGTCGT CCGATGACGC CGCGCTCTAT 
GCCGCGCCGA TCTCGCACGG TGCCGGGCTC TACAACATGA TCCACACCCG GTTCGGCGCG 
CGTCACGTCG TGCCCGCCTC CAAGGGCTTC GACCCCGACG AGGTGCTGAC GCTCGGCAAG 
CAGCTCGGCA ACGTCGCGAT GTTCGCCGCG CCCACCATGG TGAAGCGGCT GGTCGAGGCC 
GCAAGGCGCC GCGGCGAGCG CGGCGAGGGA CTGCGCACCA TCGTCTACGG CGGCGGCCCG 
ATGTATCTCG CCGACATCCG CGACGCGCTC GACGTGATGG GCCAGCGCTT CGTGCAGATC 
TACGGCCAGG GCGAATCGCC GATGGCGATC ACGTCGCTGA AGCGCGAGTT GCACGCCGAT 
GTCGATCATC CGCGCTATCT GCAGCGGCTG GCCTCGGTCG GCACCGCGCA GAGCGCGCTG 
TCGGTGCGGA TCACCGGGCC TGACGGCGAG GTGCTGCCGG CCGGCGAGAC CGGCGAGATC 
GAGGCCAAGG GCCCGACCGT GATGCTCGGC TACTGGAACA ATTCGGACGC CAACGCCGAG 
ACGCTGAAAG ACGGCTGGCT GCGCACCGGC GATGTCGGGC GCCTGGACGA GGACGGCTTT 
CTCACGCTGT CGGACCGCTC CAAGGACGTG ATCATCTCCG GCGGCACCAA CATCTATCCG 
CGCGAAGTGG AAGAAGCGCT GCTGACGCAT CCCGCGGTGC GCGAGGTCTC GGCGATCGGC 
GTCGCCGATC CGGAATGGGG CGAGACCGTG GTCGCCTGTG TGGTGCTGGC GGACGGATCG 
GAGCCCAGCG ACACTGCGCT CGACGCGCAT TGCCTCGCCG CCATCGCCCG CTTCAAGCGG 
CCGAAGCGCT ACGTCTATCT GGAAGCGTTG CCGAAGAACA ATTACGGCAA GGTGCTGAAG 
ACCGAGCTGC GCAAGATGGT GACTTAG

Protein sequence

MNLSEWLAAS ARLRPSAPAL LTGTTIEADY ATFAQRAASF AAALQRDYGI VSGDRVALFA 
HNCTQYLEAL YGIWWAGAVA VPINAKLHGK EAAWICSNSG AKLALICDDT ADTFNEAAGE 
LPARMATLAL DSDAYIRARS GDGPAAPAAR EDGDLAWLFY TSGTTGRPKG VMLSHGNLIA 
MSLCYLADVD TVSSDDAALY AAPISHGAGL YNMIHTRFGA RHVVPASKGF DPDEVLTLGK 
QLGNVAMFAA PTMVKRLVEA ARRRGERGEG LRTIVYGGGP MYLADIRDAL DVMGQRFVQI 
YGQGESPMAI TSLKRELHAD VDHPRYLQRL ASVGTAQSAL SVRITGPDGE VLPAGETGEI 
EAKGPTVMLG YWNNSDANAE TLKDGWLRTG DVGRLDEDGF LTLSDRSKDV IISGGTNIYP 
REVEEALLTH PAVREVSAIG VADPEWGETV VACVVLADGS EPSDTALDAH CLAAIARFKR 
PKRYVYLEAL PKNNYGKVLK TELRKMVT