Gene Rcas_4219 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4219
Symbol
ID	5541730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5458140
End bp	5459615
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	65%
IMG OID	640896326
Product	O-succinylbenzoate-CoA ligase
Protein accession	YP_001434264
Protein GI	156744135
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01923] O-succinylbenzoate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.121755
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGCG ATTGGCTCTC GGCGCAGGCG CAGGCGCGTC CCGAAGGTGC GGCGCTGATC 
ATCGGCGACA CAACACTGAC GTACCGCGCT CTGCACGAGC AAACGGCGAC GTTCGCTTCC 
CGCCTCGCTG CGGCTGGCGT CGAGCAAGGC GCGGTTGTCG GCGTGCTGTT GTCGAATCGT 
CTCGAAGCGG CGCTGGCGGT GCATGCCGCG CCGCGCCTCG GCGTGACGCT GGCGCTGTTC 
AACACCCGCC TGACCCCTGC CGAACTCGAT GCGCAGGTGC GCGCAGCAGT GTGTCGCATC 
CTCGTGTGTG AGCGCGACAC GCTGTTGGCA GCGCTGGCGC TTCCTTCGGC GCCCCATGTG 
CTGTGCGTCG ATCCGGTCGA CGACCCACGC CTGACGCCGG TTGACCGGAT TTCCGGGGAT 
AGCGCCGCAT ACTGCGAAGG CGCCATCGAC CTCGATGCGC CGTTTGTGAT GATGTTCACT 
TCGGGGACAA CGGGGACGCC ACGGGGAGTA GTGCTGACCT ACGGCGCATT CTTCGCCAGC 
GCGATGGCGT CGGCATACCG CATCGGCGTT CTGCCGGGCG ACCGCTGGCT CTGTGTGTTG 
CCACTCTATC ACATTGGCGG TCTCAGCATT CTGCTGCGGT CCTGCCTCTA CGGCACGGCA 
GTGGATCTCT GGCAACGTTT CGACGCTCCG GCAATCACAG AACGTTTGAA GGCGACACCG 
ATCACACTCA TTTCGCTGGT GCCGACGATG CTCTACCGCC TGCTCGATGA CGCTGGCGAT 
GCGCCACCGA ACCTGCGGCT CGTGCTGCTT GGCGGAGCTG CTGCGCCAAC CGATCTGCTG 
GAGCGCGCAC TGGAAGCAGG ATGGCCCATT GCCACAACCT ACGGGCTGAC CGAGGCAGCG 
TCGCAGGTGG CGACGGCGCT GCCCGACGAG GTACGGCGCA AGCCCGGCAG CGTCGGGCGA 
CCGCTGATCT TCACCCACGT GCGTGTGACG AACGAACAGG GACGCGACCA ACCACCCGGC 
GTCTACGGCA ACATCCTGGT GCGGGGTCCG ACCCTGATGC GCGGATACCT CGGCGAAACG 
CCGCTCGACG CCGACGCCTG GTTTGCCACC GGAGACATCG GCTATCTCGA CGCCGACGGC 
GACTTGTGGG TAGTGCAGCG ACGCAGCGAC CTGATTATCA GCGGCGGGGA GAATATCTAT 
CCGGCGGAAG TCGAACAGGC GCTGCGCCAG CACCCCGCAG TCGCCGATGT TGCAGTCGTT 
GGCGTGCCAT CAGCGGAGTG GGGGCAGCAG GTCGGCGCTG CCATCGTCCT GCGCGACCCA 
TCGGTGAGCG TCGAAGCAAT CCTGGCGTTC AGCCGCACTC GTCTGGCGGG ATACAAACAA 
CCGCGCGTCG TTCGCATCGT CGCTGAGTTG CCGCGCACCG CATCGGGAAA GATTCAGCGG 
GAAGCGGTGA TCAATCTGTT GAAGGTTGCA GGTTAA

Protein sequence

MMRDWLSAQA QARPEGAALI IGDTTLTYRA LHEQTATFAS RLAAAGVEQG AVVGVLLSNR 
LEAALAVHAA PRLGVTLALF NTRLTPAELD AQVRAAVCRI LVCERDTLLA ALALPSAPHV 
LCVDPVDDPR LTPVDRISGD SAAYCEGAID LDAPFVMMFT SGTTGTPRGV VLTYGAFFAS 
AMASAYRIGV LPGDRWLCVL PLYHIGGLSI LLRSCLYGTA VDLWQRFDAP AITERLKATP 
ITLISLVPTM LYRLLDDAGD APPNLRLVLL GGAAAPTDLL ERALEAGWPI ATTYGLTEAA 
SQVATALPDE VRRKPGSVGR PLIFTHVRVT NEQGRDQPPG VYGNILVRGP TLMRGYLGET 
PLDADAWFAT GDIGYLDADG DLWVVQRRSD LIISGGENIY PAEVEQALRQ HPAVADVAVV 
GVPSAEWGQQ VGAAIVLRDP SVSVEAILAF SRTRLAGYKQ PRVVRIVAEL PRTASGKIQR 
EAVINLLKVA G