Gene Rcas_4452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4452
Symbol
ID	5541965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5721435
End bp	5722556
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	63%
IMG OID	640896550
Product	peptidase M24
Protein accession	YP_001434486
Protein GI	156744357
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0539466
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000000869693
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCACAGG TGACACTTAC GTCTCCACGA ATCCCACGCA TTCAGGCGGC TCTGCGCCGT 
CATGGTTTCG ACGCGCTGGC TGTAGTTCCA GGAAGCAACC TGCGCTATCT TGCCGGTCTG 
ACATTCCACG CCGGTCTGCG ACTGACCGTA ATGGTGACGC CGGTTGAGGG GCAACCAGCG 
CTGGTGGTTC CCGGGTTGGA GTATGGGCGC GTGGCTGAGA CCACGGGCGC TGTGTTTCGA 
TCCTATCCGT GGGGCGATGA TGAGGGACCG GGAAATGCCC TGATGCGCGC GGTGCGTGAT 
ACCGGTCTGG GGCAGGGAAG CGTCGTCGGC ATCGAGCATA CCGTTATGCG CGTGTTTGAA 
CTGCGTGCGC TGGAACAGGC GCTTCCCGGC GCACAGTTCG TTGATGCCAC GCCTCTCCTG 
GCAGAACTGC GGATGGTTAA GGATGCGGCG GAACTGGAAG CGATGCGTGT TGCGGTGCAG 
GTCATCGAAG CGACGTTGCA CCAGACGTTA ACACAGGTGC GGGCAGGCAT GCGCGAACGC 
GACATCGCCG ATCTGTGGGA ACGCGCCATT CGCGCGGCTG GATGCCAGCC CGCCTTTGAG 
ACGACGGTCG CCAGCGGACC GAACAGCGCC AACCCGCACC ATACCAGCGG TGATCGGGCG 
TTGCAGGATG GCGACATGGT CGTGTTCGAC GGAGGCGCTA TGTATCAGGG ATATGTATCG 
GACATTACCC GCACATGTGT AGTCGGGCAT CCATCGGACG AGATGCGTCG CGTGTACGAT 
CTGGTGCTGG CGGCAAATGC GGCCGGACGG GACGCGGCGG CGCAACCCGG CGCGACCGGC 
GCGTCGATCG ATGCCGCAGC GCGCCAGGTC ATTGAACGCG GCGGGTACGG ACCGTTCTTC 
ATCCATCGCA CCGGGCACGG CATCGGTCTC GATGTGCATG AGCCGCCGTT CATCGTTGCC 
GGAAGCCAGG CGCCGCTGCC GATTGGTGCG ACGTTTACCG TCGAGCCTGG CATCTACCTG 
CGTGGCATAG GTGGTGTGCG CATCGAAGAT GACGTGGTCA TCACGGCTGA TGGCGCCGAG 
TCGCTGACGA CATTCCCGCG TGAGATTCAC TCTATATCGT AA

Protein sequence

MAQVTLTSPR IPRIQAALRR HGFDALAVVP GSNLRYLAGL TFHAGLRLTV MVTPVEGQPA 
LVVPGLEYGR VAETTGAVFR SYPWGDDEGP GNALMRAVRD TGLGQGSVVG IEHTVMRVFE 
LRALEQALPG AQFVDATPLL AELRMVKDAA ELEAMRVAVQ VIEATLHQTL TQVRAGMRER 
DIADLWERAI RAAGCQPAFE TTVASGPNSA NPHHTSGDRA LQDGDMVVFD GGAMYQGYVS 
DITRTCVVGH PSDEMRRVYD LVLAANAAGR DAAAQPGATG ASIDAAARQV IERGGYGPFF 
IHRTGHGIGL DVHEPPFIVA GSQAPLPIGA TFTVEPGIYL RGIGGVRIED DVVITADGAE 
SLTTFPREIH SIS