Gene Rcas_3967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3967
Symbol
ID	5541473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5172161
End bp	5173504
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	59%
IMG OID	640896075
Product	AMP-dependent synthetase and ligase
Protein accession	YP_001434018
Protein GI	156743889
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.923272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0394514
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATCG AATGGCTGAT AGATCGTATG GCACAATTGC GCAATGATAC GGCCATCGTC 
TGGCAGGGGG CGTCGGTTTC CTACGGCGAC CTGATCGACC GTGTGGCGCG CTGGCGCGTG 
ATACTCGACG AGGCCGGCAT TGCCGAAGGG CAGGTGGTCA GCATCGAAGG GGACTATTCA 
CCCGGCGCGA TTTCGCTCCT GCTGGCGCTG ATTGCGCGCA ATGCCATCAT TGTGCCGCTC 
ACGGCGTCGG TTGCAGCGCA CCGTGACGAG TTCCTGTCCA TCGCCGAAGT GCAGGCGGTC 
ATCAGTTTCG ATGCTGGCGA TGGATGGCGC ATTGAACGCC GCGACATCCC GGTGACGCAT 
GCGTTGACCT GCACACTCAT CACGCGCGGG CATCCCGGTC TGGTGCTCTT CTCATCCGGT 
TCAACCGGCA AGAGCAAAGC GGCGTTGCAC GACTTCGTGC CGCTGCTGGA GAAGTTCAAA 
GTGCCGCGCC ATCGCCAAGT GACGCTGACC TTTCTGCTGC TCGACCACAT TGGCGGGATT 
AACACGTTGT TCTACACACT CTCCAATGGT GGAACCGCCG TGTCGGTGCG CAGCCGCGAT 
CCTGATGAGG TTTGCGCTGC GATTGAACGC TATGCGGTCG AATTGCTGCC CACGTCGCCA 
ACCTTCCTGA ACCTGATTCT GATGTCAGAG GCATATCGGC GCTACGATCT ATCGTCGCTG 
AAACTGATTA CCTATGGCAC CGAAGTGATG CCCGAAACGA CGCTTCAGCG TGTCCGTGAA 
GCGTTTCCCG GCGTGCGCCT CCAGCAAACC TACGGTCTCT CCGAACTTGG CATTCTCCGC 
TCGAAGTCGC GCGACGACGG TTCGTTGTGG GTCAAAGTCG GCGGCGAAGG GTTCGAGACG 
AAGGTGGTGG ATGGCGTGCT CTATGTCCGC GCGAAATCGG CGATGCTCGG GTATCTCAAT 
GCGCCAAGCC CCTTCGACGA GGAAGGGTGG ATGAACACAC AGGACATGGT AGAAGTCGAT 
GGTGAGTACA TACGGATTCT GGGGCGGCGT ACCGAAATCA TCAATGTCGG CGGGCAGAAA 
GTCTACCCGG CGGAGGTCGA AAGTGTGCTC ATGCAATTGC CCAACGTGCG CGATGCAACG 
GTCTACGGCG AGAAAAATCC GATCACGGGG CAGATTGTTG CAGCTCGCTT GAACCTGATC 
GAACCGGAAG ACCTCGACTC GCTCAAGAAA CGGGTGCGCG CCTGGTGCCG CGAGCATCTG 
GCGCCGTTCA AAACGCCGGT CAAAATTACG ATTGCCGACG GCGAACAGTT CAGCGCACGC 
TTCAAGAAGA TGCGGCGCGC CTGA

Protein sequence

MAIEWLIDRM AQLRNDTAIV WQGASVSYGD LIDRVARWRV ILDEAGIAEG QVVSIEGDYS 
PGAISLLLAL IARNAIIVPL TASVAAHRDE FLSIAEVQAV ISFDAGDGWR IERRDIPVTH 
ALTCTLITRG HPGLVLFSSG STGKSKAALH DFVPLLEKFK VPRHRQVTLT FLLLDHIGGI 
NTLFYTLSNG GTAVSVRSRD PDEVCAAIER YAVELLPTSP TFLNLILMSE AYRRYDLSSL 
KLITYGTEVM PETTLQRVRE AFPGVRLQQT YGLSELGILR SKSRDDGSLW VKVGGEGFET 
KVVDGVLYVR AKSAMLGYLN APSPFDEEGW MNTQDMVEVD GEYIRILGRR TEIINVGGQK 
VYPAEVESVL MQLPNVRDAT VYGEKNPITG QIVAARLNLI EPEDLDSLKK RVRAWCREHL 
APFKTPVKIT IADGEQFSAR FKKMRRA