Gene RPB_4072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4072
Symbol
ID	3911879
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4644034
End bp	4645560
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	67%
IMG OID	637885976
Product	AMP-dependent synthetase and ligase
Protein accession	YP_487676
Protein GI	86751180
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01923] O-succinylbenzoate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.979079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTCG CCTATTTCGA CTGGATCACC CATCACGCCG AAGTTCGTCC CGACCGGATC 
GCGTTGATCG ATCTCGCCAC GCAACGCCGG CTGACCTATC GCGCGCTCGA TGATCGGATC 
GATCGCCTGG CGTCGCACCT CGCGTCGCTC GGCGTCGGCC GTGGCGATCG CGTCGCGGTG 
CTGGCCGCCA ACACCACCGA CACGCTGGAG GTGCAATTCG CCTGCTTCCG GCTCGGCGCG 
ATCTTCGTGC CGCTGAATGT GCGGCTGACC GTGCACGAAT TGTCGTTCAT CGTCGGCGAC 
GCCGCACCGC TTGTGCTGGC GCATGATTCC GATTTCGCCG CGATGGCCGG CGATCTTCAG 
AGCAAATGCG GCATCGCGCA TCTCCTGCAG TTCGGCGCGC CCTACGAGGC CGCGCTGTCG 
GCTGCGCCGC GGCTCGCCCG CGCCGAGGCG GTGACGCTCG ATGACGTCTC GACCATCATG 
TACACCTCGG GGACGACGGG AAAACCGAAG GGCGCGATGA TCACGCACCT GATGACCTTC 
ATCAACGCGG TCAATCTCGG CATCCCGGCC TTCATCACCC AGCGCACCGT GTTTCTCTGC 
GTGATGCCGC TGTTCCACAC CGGCGGGCTG AATTGCTACA CCAACCCGGT GCTGCACGCC 
GGCGGCACGG TGATCCTGAT GCGCGCCTTC GATCCCGGCG AAACGCTGCG GCTGATCGGC 
GACGCTGGCA TCGGCCTGAC GCATTTCTTC GGCGTGCCGT CGATCTATCA GTTCATGTGC 
CAGCATCCCG CCTTCGCAGA CACCGATCTG TCGCGGCTGC AGATGGCGGG CGTCGGCGGG 
GCGCCGATGC CGGTGCCGCT GCTCAGGATC TGGCAGGAGC GCGGCTGCAC CCTGGTGCAA 
GGCTACGGCA TGACGGAAAC CAGCCCCGCG GTGATGATGC TGGATTCCGA CGACGCCGCG 
CGCAAGGCGG GCTCGGCCGG CAAGCCGGTG CTGCACGCCG ATCTGAAGAT CGTCGGCCCC 
GATGGCGAGC CGGTCGCGCC CGGCGAGATG GGCGAGCTCT GGGTGAAAGG CCCCAACATC 
ACCCCCGGCT ACTGGAACCG GCCGGAGGCC AACCGCACCT CGTTCACCGA CGGCTGGCTG 
CACACCGGCG ATGCCGCACG CGTCGACGGC GAAGGCTTCT ACTACATCGT CGACCGCACC 
AAGGACATGT ACATCTCCGG CGGCGAGAAC GTCTATCCGG CCGAAGTCGA GGACGTGCTG 
TATCAGCTGC CGGAGATCGC CGAGGCCGCC GTGATCGGCG CACCCGATCC GCAATGGGGC 
GAGACCGGCG TGGCGATCAT CGCGGTCAAG ACCGGCCACG ACCTTCCGGA AGCGAAGCTG 
CACACCCATT GCCGCGAGCG ACTGGCCCGG TTCAAATGCC CGCAGCGGGT GGTCTTCGTC 
GAGGCGCTGC CACGCAACGC CACCGGCAAG GTGCACAAGC CGACCCTGCG CGAGCGCTTC 
CTGGTGCGGG AGACGATGGA CGCGTAA

Protein sequence

MSFAYFDWIT HHAEVRPDRI ALIDLATQRR LTYRALDDRI DRLASHLASL GVGRGDRVAV 
LAANTTDTLE VQFACFRLGA IFVPLNVRLT VHELSFIVGD AAPLVLAHDS DFAAMAGDLQ 
SKCGIAHLLQ FGAPYEAALS AAPRLARAEA VTLDDVSTIM YTSGTTGKPK GAMITHLMTF 
INAVNLGIPA FITQRTVFLC VMPLFHTGGL NCYTNPVLHA GGTVILMRAF DPGETLRLIG 
DAGIGLTHFF GVPSIYQFMC QHPAFADTDL SRLQMAGVGG APMPVPLLRI WQERGCTLVQ 
GYGMTETSPA VMMLDSDDAA RKAGSAGKPV LHADLKIVGP DGEPVAPGEM GELWVKGPNI 
TPGYWNRPEA NRTSFTDGWL HTGDAARVDG EGFYYIVDRT KDMYISGGEN VYPAEVEDVL 
YQLPEIAEAA VIGAPDPQWG ETGVAIIAVK TGHDLPEAKL HTHCRERLAR FKCPQRVVFV 
EALPRNATGK VHKPTLRERF LVRETMDA