Gene RoseRS_0349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_0349
Symbol
ID	5207284
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	445412
End bp	446470
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	61%
IMG OID	640593975
Product	peptidase M42 family protein
Protein accession	YP_001274731
Protein GI	148654526
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.326281
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACC ATTCGCTTGC ATTTTTGAAA CATCTGCTTG CCACGCCCGG TCCCTCCGGC 
GATGAAGTGG CTGTCGGGCG CATCTGGCGG CGCGAAGCCG AAACCTTTGC CGATCGGGTC 
TACGCCGATG TGCGGGGCAA TTCGTATGCC GTGCTGGAAG GCGGATCACC GCGTGTGCTG 
CTTGCCGGTC ATATCGACGA GATCGGCGTC ATGGTGAGTT CCATTGATGA CGACGGCTTT 
CTGTGGTTCT CGCCCATCGG CGGATGGGAT CCGCAGGTGC TGGTCGGGCA GCGGGTGCGT 
CTGGCGGGGC GCACCGGTGA TGTTATTGGC GTTATCGGGA AGAAACCGAT CCATCAGATG 
AAACCCGACG AGCGCGAGAA AGCCAGCAAG ATCGAGGACC TCTGGATCGA CATCGGCGTG 
ACGAGTCGGG CGGAAGCCAG AGAACTGGTG CGTGTCGGCG CCACCGGCGT GATCGATGCG 
CCGATCTACG ATCTGCCGGG CGGGAGGATC GTTTCACGCA GCATCGACGA CCGGATTGGC 
GCATTCACGG TACTGGAGGC GCTCCGCTTG CTGGAGCGCG ATCGTCCGCG CGCAACGGTG 
GCGGCAGTGG CAACGTCGCA GGAGGAAATC ACGTTTGCCG GCGCGCATAC CGCAGCCTTC 
AGTTTCGAGC CGCAGGTCGC TATTGCGGTT GATGTGACCT TTGCAACTGA CCATCCGAAC 
GCCGACCGCC GGCAGTATGG CAATGTGCGG CTTGGCGGCG GACCGGTGCT GTCGCGCGGT 
TCTGCCAATA GTCCGGTGGT GTACGATATG CTGACGGCGA TTGCAGAACG CGAGGGCATT 
CCATACAGCA TCCAGGTGAA TCCGCGCTAC ACCGGAACCG ATGCCGATGC CATTCACCTG 
TCGCGCGGCG GGGTCGCCAC TGCTGTGATC TCGATCCCCA ACCGTTATAT GCACTCTCCG 
AATGAAATGA TCGCTCTGAG CGATGTCGAG TATGCCGCAC GTCTGATCGC TGCATTCGTG 
CGCAGTCTGA CGCCGGAGAC CAGTTTTATC CCGATCTGA

Protein sequence

MNDHSLAFLK HLLATPGPSG DEVAVGRIWR REAETFADRV YADVRGNSYA VLEGGSPRVL 
LAGHIDEIGV MVSSIDDDGF LWFSPIGGWD PQVLVGQRVR LAGRTGDVIG VIGKKPIHQM 
KPDEREKASK IEDLWIDIGV TSRAEARELV RVGATGVIDA PIYDLPGGRI VSRSIDDRIG 
AFTVLEALRL LERDRPRATV AAVATSQEEI TFAGAHTAAF SFEPQVAIAV DVTFATDHPN 
ADRRQYGNVR LGGGPVLSRG SANSPVVYDM LTAIAEREGI PYSIQVNPRY TGTDADAIHL 
SRGGVATAVI SIPNRYMHSP NEMIALSDVE YAARLIAAFV RSLTPETSFI PI