Gene RoseRS_4305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4305
Symbol
ID	5211289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	5408017
End bp	5409258
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	60%
IMG OID	640597891
Product	dipeptidyl aminopeptidase/acylaminoacyl-peptidase-like protein
Protein accession	YP_001278595
Protein GI	148658390
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0350755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.767198
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGAGC AGGACGTCAT CCTGAAGCGG CAGAAGTACA ACACGCGGTT CAAGAACGGC 
GATATGGACT TCATGTTCAA CTGGGCGCTG GGTGTGAGCC AGATTGTCGG TATGTCGCCA 
TCACAGGTCT TCTACGCCGT CCACGATATC AGAGACGGCG ATCCAGACGG TTGGCGCGAT 
GGTTTCTGGC GTCAGGGCGA TTATCAGGTC GAACGGGCGC GAGAGTTTCT CAAACACGGT 
CAGCAACTGG CGGCTGGACA GTTGCACCTC GGTGCCGCAT ATGCGTACCG TTCGGCGTTG 
CAATACACCC ACCCCAGCGC CAGCGATTTC AATACGCGCG TGCAAACAAT GGAGCGCGCG 
TTTCAGCAGG GTGTCCACCT GATCGGCATC CCGATGCGTC CTATCGAGAT TCCGTTCGAG 
CACGCCGCAC TGCCGGGTTA TTATCTGGAG CACGATGAGC AGTCGCGCCC GGTTGTGATG 
ATGGTCGGCG GCGGGGATAC ATTCCGTGAA GACCTGTTCT ACTTTGCGGG GTACCCTGGC 
TGGAAACGCG GCTACAACGT GGTGATGGTC GATCTGCCGG GGCAGGGTGT CACGCCAGAC 
CGGGGGCTGC ACTTCCGTGC AGACATGGAA CGACCGATCA GCGCCGTGCT GGACTGGCTC 
GAAGCGCACT CCGCCGCTCG TCCCACGCAG ATCGCCATCT ACGGCGTCAG CGGAGGCGGA 
TACACGACGG CGCTGGCAGT GTCGTCCGAC CCGCGCATCA GCGCCTGGAT TGCCAGCACT 
CCCATTTTCG ATCTGGTCGA AGTGTTCCGA CGCGAGTTCG GCAGCGCGAT GAAAGCGCCC 
GGCTGGGTGA TCAACACGTT CATGCGGTTG GCGGGCATGC TGAACAAAAG TGCGGAGATC 
AATCTCGACA AGTATGCCTG GCAATTTGGC GCAACCGATT TCAAGAGCGT CGTTGATGGC 
GTCGTTGCCC TGGCAAAGCG AGTGGACTAC ACGGGGATCG CCACGCCATC ATTGTTTCTC 
ATGAGCGAAG GGGAAGGCGA TGAACTCAAG CGCCAGACGC TCGAAATATA CCATGATCTC 
CGTCGACGCG GCGTCGACGT CACTCTCTGC GAATTTACCG CCGCCGAAGG TGCAGACGGT 
CACTGCCAGG TGAACAATCT GCGGCTGGCG CACCTGGTCA TCTTCGACTG GCTCGACCGC 
GTGTTTGGGC ATACGCCAGG CGATAGGCGA CTGTGGGTGT GA

Protein sequence

MQEQDVILKR QKYNTRFKNG DMDFMFNWAL GVSQIVGMSP SQVFYAVHDI RDGDPDGWRD 
GFWRQGDYQV ERAREFLKHG QQLAAGQLHL GAAYAYRSAL QYTHPSASDF NTRVQTMERA 
FQQGVHLIGI PMRPIEIPFE HAALPGYYLE HDEQSRPVVM MVGGGDTFRE DLFYFAGYPG 
WKRGYNVVMV DLPGQGVTPD RGLHFRADME RPISAVLDWL EAHSAARPTQ IAIYGVSGGG 
YTTALAVSSD PRISAWIAST PIFDLVEVFR REFGSAMKAP GWVINTFMRL AGMLNKSAEI 
NLDKYAWQFG ATDFKSVVDG VVALAKRVDY TGIATPSLFL MSEGEGDELK RQTLEIYHDL 
RRRGVDVTLC EFTAAEGADG HCQVNNLRLA HLVIFDWLDR VFGHTPGDRR LWV