Gene Rsph17029_3671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3671
Symbol
ID	4899015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	772679
End bp	773914
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	68%
IMG OID	640114279
Product	4-coumarate--CoA ligase
Protein accession	YP_001045533
Protein GI	126464420
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR02372] 4-coumarate--CoA ligase, photoactive yellow protein activation family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.180666
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0402717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCCG AGGGGCCTCT GGCACTGGAA GATCGGGTGC TCGACCGGGA GGCGGTCGGG 
CGCCTCTGCG TCTCCCTGAT CGCGGCCGAG CAGCAGGACC TGCTGCGGGA AGGGCGCGTC 
GGTCATCATC AGATGATCGG CGCGCGCCTC CTGACGGCAG GGCATCCGTC GCCCGACGAC 
CTGCTGATCG ACGAAGACAC GCTGGGGCTC GACAGTCTGC TCATGCTCTC GCTCGTCACC 
CGCGTGGCGG GCTTCTTCCA TCTGTCGGAT TCGAACACCG AGGATTATCT CCTCGTGCGG 
CGCCGTCTGG GAGAGTGGGT GGATCTGATC GATCATCACC ACACCCTGAT GGGGCCGAAG 
GCGCGCTTCA CCTTCGCGAC CTCGGGAAGC ATCGCAGGAC CGAAGCCCGT GACCCATAGC 
GCCGCGGCAC TGCTCTCGGA AGGGCAGGCC ATCGCGAAGA TCCTCACGGA GCGGCCTCCC 
GAGTTGCGCC GCGTCCTGTC CTGCGTTCCG GCCCACCACA TCTACGGCTT CCTCTGGTCC 
TGCCTGTTTC CCTCCCGCCG CGGTCTCGAG GCGAAGCAAC TGGCGAACCT GTCCGCTTCC 
GGCATCATGC GGCACGCGCG CTCCGGCGAT CTGGTGGTGG GCACGCCCTT CATCTGGGAG 
CAGTTCGCGG ATCTGGACTA CCGGCTGCCC GACGACGTGG TCGGGGTGAC GTCCGGCGCA 
CCCTCGACGG CCGAGACATG GCGCTGCGCC TCTGCGCTCG GCCCGGCGCG GATGCTGGAC 
ATCTATGGCT CGACCGAAAC CGGGGGCATC GGCTGGCGCG AGCGCCGGGA CGACCCTTTC 
CGAACCCTGC CCGATCTCGC CTGCTGCCAC GACACGTTGA GCAGGCTGGG CCGGCGGCTG 
GACCTGCAGG ACGAGATCGC CTGGGACAAG GACGGCGGCT TCACGATTCT CGGCCGCAAG 
GACGAGATCC TGCAGGTCGC GGGATCGAAC GTCTCTCCTG CCGCGGTCCG AGAGATCCTG 
CTCCGGAACC CGCGTGTCCG GGATGCGGCG GTGCGGCTCG ACGGACGCAG GCTGAAGGCC 
GTGATCTCTG TGGCGGAGGG CGCTGACGAG GCAGAGATCG AGATCGAACT GCGCGCGACT 
GCGGCGCGGC ATCTTCCGGC ACCTGCCAGG CCGGACCGGT TCCTTTTCGC GACGCAACTC 
CCGCGCACGG GTGCAGGGAA ATTGGCGGAC TGGTAG

Protein sequence

MTAEGPLALE DRVLDREAVG RLCVSLIAAE QQDLLREGRV GHHQMIGARL LTAGHPSPDD 
LLIDEDTLGL DSLLMLSLVT RVAGFFHLSD SNTEDYLLVR RRLGEWVDLI DHHHTLMGPK 
ARFTFATSGS IAGPKPVTHS AAALLSEGQA IAKILTERPP ELRRVLSCVP AHHIYGFLWS 
CLFPSRRGLE AKQLANLSAS GIMRHARSGD LVVGTPFIWE QFADLDYRLP DDVVGVTSGA 
PSTAETWRCA SALGPARMLD IYGSTETGGI GWRERRDDPF RTLPDLACCH DTLSRLGRRL 
DLQDEIAWDK DGGFTILGRK DEILQVAGSN VSPAAVREIL LRNPRVRDAA VRLDGRRLKA 
VISVAEGADE AEIEIELRAT AARHLPAPAR PDRFLFATQL PRTGAGKLAD W