Gene RoseRS_1789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1789
Symbol
ID	5208748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	2209059
End bp	2210237
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	60%
IMG OID	640595397
Product	peptidase M24
Protein accession	YP_001276129
Protein GI	148655924
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0357979
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTACC ACCAGAAGGC TGCTCAGGCG CAGGCATTGC TCGCTGAAAC CGGTATCGAT 
GCCTGGTTGA TTTTTGTCCG CGAAAGCGCC ATTCGACCCG ATCCCGGCAT CGAACTTGCG 
ATTGGCGTCG ATGTCACATG GGATTCGGCG TTTGTGTTTG GTCGCAACGG GCAGCGGGTT 
GCGATTGTCG GGCGCTATGA TGTCGCCGGT GTACGCGCGT CCGGTCTGTT CGATACGATT 
GTCGGCTACG ACGAAAGCAT CAGGGAATAC CTGATCGAAG CTCTGCGACG CCTCGATCCG 
CTCACGATCG GTCTGAATTA CAGCCTCGAT GATCCAACTG CTGATGGACT GACATACGGA 
ATGTTTCTCC ATCTCTGCGA TCTGCTGGCG GATACGCCCT TTCCTTCGCG TTTCGTGAGC 
GCGGCGCCGC TGCTGGCAAA ACTGCGCTCG CGCAAGGTGC CAGCCGAAAT TGAGCGCATT 
CGCGCAGCAG TTGCCGTCAC CGAAGAGATT GTCGATCTGG TTGAGCAACA GATCCGGCCC 
GGCGTCAGCG AGGCGCAGAT CGCGGCTTTC ATCCACGATG AGTTTCGGCG TCGCCATCTG 
GGGAGCGCAT GGGCATGGGA TGCCTGCCCG ATCGTGAACA GCGGTCCCGA ATCGGAAGCC 
GGTCATGGCG GTCCGCGTGA TGATATTCTG GTGCAGCCGG GTCATCTGGT GCATATCGAT 
CTTGGCGTGC AGCTCGATGG CTACTGTTCG GATATTCAGC GCATGTGGTA TGTCCGTCGC 
GCTGGCGAAG ATGCGCCGCC GCAAGAAGTG CAGCGCGCGT TTGAGACGGT CATTCGAGCG 
ATCGAGGCGG GCGCAGCGGC GCTACGCCCC GGCGTGTACG GCTACGAAGT TGATGCCGCT 
GCACGTCGGG TTATTGTCGA TGCCGGGTAT GACGAGTACA AACACGCGCT GGGACATGGT 
CTGGGACGTG CATGTCACGA CGGCGGTCCG TTGCTCGGTC CGCGCTGGCC CCGCTATGGT 
CGCACCCCGG AGATGCAGGT CGAGGCGGGC AATGTGTACA CCCTCGAACT CGGCGTTACC 
ACTTCCGCCG GGTACATTGG CATTGAAGAA GATGTGCTGG TGACCGATCA CGGCGTTGAG 
TTTCTCTCGC GCTTCCAGCG CACGCTGCGG GAGGTGTAG

Protein sequence

MLYHQKAAQA QALLAETGID AWLIFVRESA IRPDPGIELA IGVDVTWDSA FVFGRNGQRV 
AIVGRYDVAG VRASGLFDTI VGYDESIREY LIEALRRLDP LTIGLNYSLD DPTADGLTYG 
MFLHLCDLLA DTPFPSRFVS AAPLLAKLRS RKVPAEIERI RAAVAVTEEI VDLVEQQIRP 
GVSEAQIAAF IHDEFRRRHL GSAWAWDACP IVNSGPESEA GHGGPRDDIL VQPGHLVHID 
LGVQLDGYCS DIQRMWYVRR AGEDAPPQEV QRAFETVIRA IEAGAAALRP GVYGYEVDAA 
ARRVIVDAGY DEYKHALGHG LGRACHDGGP LLGPRWPRYG RTPEMQVEAG NVYTLELGVT 
TSAGYIGIEE DVLVTDHGVE FLSRFQRTLR EV