Gene Rcas_3716 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3716
Symbol
ID	5541218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4875108
End bp	4876097
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	65%
IMG OID	640895827
Product	peptidase S58 DmpA
Protein accession	YP_001433774
Protein GI	156743645
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00511947
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTCCTT CGATAACCGA TGTTTCGGGT GTTCTGGTGG GGCACGCACA GGACGGTGCA 
GCGTTGACCG GGTGTACAGT TGTGCTCGCG CCCGAAGGGG CGGTCGGTGC AGTGGATGTT 
CGTGGCGGCG CTCCAGGGAC GCGCGAGACC GATCTGCTCG CGCCGGTTGC AACCGTCGAT 
ATGGTGCATG CCGTGGCACT GTGTGGCGGG AGCGCCTTCG GTCTGGCGGC AGCCACCGGT 
GTGGTGCAGT GGCTCTCTGA ACAGGGAATT GGTTTCCCGA CCGGGGTTCG TCCGGTGCCA 
ATCGTGCCGG CTGCCGTGAT CTTCGATCTT GCGATTGGCG ACGCAGATCG TTTCCCCGAT 
GCTGCGATGG GGTATGCGGC GTGTAGCGCT GCCGGCGCGT CGGTGAGCGA GGGATGTGTC 
GGCGCAGGCA TTGGCGCGAC GGTAGGGAAA ATTCGTGGCA TGCAGTACGC GATGAAATCC 
GGCGTCGGTA CGTGGAGCGA ACGCCTGGTG GATGGCGTGG TCGTGGGTGC GCTGGCGGTT 
TGCAATGCGT TTGGCGATGT GTACGATGAG CGGAGTGGTC GTCTGCTGGC GGGGGCGCGC 
GCTGACGATG GTTCGTTCGT CGATGCAATG GCGCTGCTAC GTGGCGCAGG TCCGGCGTTG 
CTGTGGTCGG CGGCATCGGA AGGGCAGAAT ACCACCCTGG CGGTGATTGC GACCGATGCG 
CGTCTGACGA AAGCGGAAGC GACGAAGGTG GCGCAGATGG CGCAGGATGC GCTGGCGCGA 
ACAATTCGCC CGGTGCATAC GCCGTTCGAT GGCGATACCG TCTTTGTGCT CGCTACCGGG 
AGGCGCGCGT CACCGGGGGT GTTGCCGCTT GGCGCCATCG CTGCCGAGGT TCTGGCGCGC 
GCCATTGAAC GCAGTGTGAC GCAGGCGTGG TCGCTCGGCG GTGTGCCTGG GATGAGGCGA 
GACGCGGGAG GCGAGAGGCG AGAGGGGTGA

Protein sequence

MSPSITDVSG VLVGHAQDGA ALTGCTVVLA PEGAVGAVDV RGGAPGTRET DLLAPVATVD 
MVHAVALCGG SAFGLAAATG VVQWLSEQGI GFPTGVRPVP IVPAAVIFDL AIGDADRFPD 
AAMGYAACSA AGASVSEGCV GAGIGATVGK IRGMQYAMKS GVGTWSERLV DGVVVGALAV 
CNAFGDVYDE RSGRLLAGAR ADDGSFVDAM ALLRGAGPAL LWSAASEGQN TTLAVIATDA 
RLTKAEATKV AQMAQDALAR TIRPVHTPFD GDTVFVLATG RRASPGVLPL GAIAAEVLAR 
AIERSVTQAW SLGGVPGMRR DAGGERREG