Gene RPD_4081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4081
Symbol
ID	4024598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4536848
End bp	4538386
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	66%
IMG OID	637964284
Product	AMP-dependent synthetase and ligase
Protein accession	YP_571201
Protein GI	91978542
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGACT TCATCACCCT CGATGCGCTG GTGCGCAACA CCGCGCAAGC ACGTCCGGAC 
CGCATTGCGG TGATCGATGG CGAGCGGAAA TTGCGTTACG CGGAATTCGA CGCGCTGATT 
GACCGTATCG CTGCGGCCCT GCAGCGCGAC GGCGTGAAGC CGACCGATGC GATTTCGATC 
TGCGCCTTGT CGTCGATCGA ATATGCCGCG ACATTCCTCG GCGCGTTGCG GGTCGGCGTC 
GCCGTGGCGC CGCTGGCGCC GTCCTCGACC GCGCAGGACT TTGCCGCGAT GGTGAAGGAT 
TCCAGCGCCA AGATTCTTTT CACCGACGAC TTCGCCGCCG AGGCGATGAA GGACGCCGCT 
ATCGACGCCT CCGTGCGACG CGTCGCACTC GACGGCGGTG CGAGCGGCGC GGCGTTCTCG 
GGCTGGCTCG CAGCCGAAGG CGCGAAGGCG GCGCCGGTCT CAGTCGATCC GGAATGGGTG 
TTCAACATCA TCTATTCGTC GGGCACCACC GGCACGCCGA AGGGCATCGT GCACACCCAC 
AGTCTGCGCT GGCGGCAATA CGGCCAGCTC GATCCGCTCG GTTACGGCCC CGAGGCCGTG 
ACGCTGCTGT CGACGCCGCT TTATTCCAAC ACCACGCTGG TCTGTTTCAA TCCGACGCTG 
GCCGGTGGCG GCACGCTGGT GCTGATGAAG AAGTTCGACG CCCGCGGCTT TCTCGACCTC 
GCCCAACAGC ACCGCGTCAC CCACGCGATG CTGGTGCCGG TGCAGTATCG GCGGATCATG 
GCGCTGCCGG AATTCGGTTC CTACGAGCTG TCGTCGTTCG TGATGAAGTT CTGCACCTCG 
GCGCCGTTCG CGGCCGAGCT GAAGCGCGAC ATCCTTGCGC GCTGGCCGGG AGGCCTCACC 
GAGTTTTATG GCATGACCGA GGGCGGCGGT TCCTGCGCGC TGCTCGCGCA CGAACATCCC 
GACAAGCTCG GAACCGTCGG CCAACCGATG CCCGACCACA TCATCCGGCT GATCGACGAG 
GACGGCAATT TCTTGCCGCA GGGCAGCATC GGCGAGATCG TCGGCCGCTC GGCGGTGGTG 
ATGACGGGCT ATCTCAACCA ACCACAGAAA ACCGCCGAGA CGTTCTGGAC CGACAAGGAC 
GGCCAGCGCT GGGTGCGCAC CGGCGACGTC GGACGTTTCG ATCAGGACGG CTTCCTGACG 
CTGATGGACC GCAAGAAGGA CATGATCATC TCCGGCGGCT TCAACATCTA TCCGAGCGAC 
ATCGAGGCGA TCGCGAGCCA GCATCCCGCG GTGCTCGAAG TCGCCGTCGT TGGTATGCCG 
TCCGAAGATT GGGGCGAGAC GCCGGTGGCG TTCGTTGTGG CGCGGCCGGG CGCGATGCTC 
GATCCGGCGG AGCTGAAGGC GTGGACCAAT GCGAAGGTCG GCAAGACCCA GCGGCTGTCC 
GAGGTCGTCC TCTCCGAAGC GCTGCCGCGC AGCGCGATCG GCAAGGTGCT GAAACGCGAG 
CTCCGCGATC AGCGGCTGGC GGCGGGCGCC GTGTCGTGA

Protein sequence

MPDFITLDAL VRNTAQARPD RIAVIDGERK LRYAEFDALI DRIAAALQRD GVKPTDAISI 
CALSSIEYAA TFLGALRVGV AVAPLAPSST AQDFAAMVKD SSAKILFTDD FAAEAMKDAA 
IDASVRRVAL DGGASGAAFS GWLAAEGAKA APVSVDPEWV FNIIYSSGTT GTPKGIVHTH 
SLRWRQYGQL DPLGYGPEAV TLLSTPLYSN TTLVCFNPTL AGGGTLVLMK KFDARGFLDL 
AQQHRVTHAM LVPVQYRRIM ALPEFGSYEL SSFVMKFCTS APFAAELKRD ILARWPGGLT 
EFYGMTEGGG SCALLAHEHP DKLGTVGQPM PDHIIRLIDE DGNFLPQGSI GEIVGRSAVV 
MTGYLNQPQK TAETFWTDKD GQRWVRTGDV GRFDQDGFLT LMDRKKDMII SGGFNIYPSD 
IEAIASQHPA VLEVAVVGMP SEDWGETPVA FVVARPGAML DPAELKAWTN AKVGKTQRLS 
EVVLSEALPR SAIGKVLKRE LRDQRLAAGA VS