Gene RoseRS_3310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3310
Symbol
ID	5210285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4158451
End bp	4160178
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	61%
IMG OID	640596906
Product	alpha amylase, catalytic region
Protein accession	YP_001277621
Protein GI	148657416
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID	[TIGR02456] trehalose synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATCGC TCACATGGTG GCAGACGGCA GTGTTCTACC AGATCTATCC GCGCAGTTTC 
GCCGACGGTA ATGGCGACGG CATCGGCGAC TTTGCGGGCA TGATCGACAG ACTCGACTAC 
CTGCGCGATC TGGGGGTCGG GGCGCTCTGG CTCTCGCCGC ACTATCCTTC CCCGAATGCG 
GACTGTGGCT ACGACATCTC GGACTATACC GGCGTCGCGC CTGAATACGG AACGCTTGAT 
GATTTCCGGC GTTTTCTCGA CGGCGCCCAC GCGCGCGGTA TGCGGGTGCT GCTCGATCTG 
GTGCTCAACC ATACGTCCGT GGAGCATCCC TGGTTCAGGG AGTCGCGGTC GAGCCGGGAT 
AACCCGAAGC GCGACTGGTA TATCTGGCGC GACCCTGCAC CTGACGGCGG TCCGCCGAAT 
AACTGGTATT CGGCGTTCGG CGGTTCTGCC TGGACATTCG ATGAGACGAC CGGACAGTAC 
TACTACCACT TTTTCTTCAA GGAACAACCC GACCTGAACT GGCGCAACCC GGATGTGAAG 
CGGGCGATGT GGCAGGCGAT TCGTTTCTGG CTCGATATGG GAGTGGACGG TTTTCGTCTC 
GATGCGATCG ACACCATCTT TGAGGACCCC GCGCTCACCC CGCACGAATC GCGGTTGTCG 
CAGGTTGAGA TGCTGCGCAT CTGGCGCGAA AACCGTCCGC CGGAAGAGAC GAAAGAACTC 
TGGGAGCAGT TTGCGCTGAT GTTTCGGTAT CAGGTGCAGC AACCAGGGTT GCACGAGTTG 
ATGAAAGAAT TGCGCGCATT GGTGGACGAA TATCCAGGAA ATCGGGTGCT GATCGGCGAA 
GGGGACGACA TTGCATACTA CGGCAACGGC AGTGATGAAC TGCACCTGGT GTTCAATTTT 
CCGCTTATGC GCACCAATCG GTTGACGCCA GCATGGGTGC GTGCCAATCA GGCGGAACGT 
CTGGCAGCGT TGCCCCCCGG CGCCTGGCCC TGCAACACAT TGGGGAATCA CGATGTCGGG 
CGCATGTGGA CGTCATACGG CGATGGGGTG AACGATGCGG CGCTTGCCCG TCTGCACGCG 
GCGATGCTGC TGACGCTGAA GGGCACGCCG GTGCTCTACA ACGGCGAAGA GATCGGCATG 
ACCGATCTGT TGCTCGAACG GTTTGAACAG TTGCGCGACA ATCAGGCGGT CAATCTGTAT 
CACCTGGCGG TCGGCGATGG CATCGATCCC GCTGAGGCAA TGAAGATGGC AGCAGCGATC 
AGCCGTGACC GCTGTCGCAC GCCGTTCCAG TGGGCGAATG CGCCGAATGC TGGATTCAGT 
CCGCCGGGCG TGGCAACCTG GTTGCCGGTC AACCCCAACT ACGCGCAGGG CGTGAATGTT 
GCCGATCAGG AACAGAACCC GGATTCGCTG CTCAACTACT ACCGCCGCCT GATCGGTGCG 
CGCCAGGCGA TACCGGCATT GCTGGCGGGC GACTATGCGC CGCTCCATCC TGACGAGGAT 
CGCTATCTGG CGTTTCTACG CACAACGCCG GATCAGCGCT GCCTGGTTGT GCTCAACTTC 
TCGCCGGAGC CGGTCACAAC CGGCTTCGAT CTGAACGGCG CCCGTTTGCG CACACTCTTT 
TCAAGCCACC CCCGCCCGAC CCGCGACGAA CATCCGGAGC GCCTGACCCT GGCGCCGTTC 
GAGGCATACA TCGGCGAGGT GATACGGATT GGGACAGATT GGGAATAG

Protein sequence

MQSLTWWQTA VFYQIYPRSF ADGNGDGIGD FAGMIDRLDY LRDLGVGALW LSPHYPSPNA 
DCGYDISDYT GVAPEYGTLD DFRRFLDGAH ARGMRVLLDL VLNHTSVEHP WFRESRSSRD 
NPKRDWYIWR DPAPDGGPPN NWYSAFGGSA WTFDETTGQY YYHFFFKEQP DLNWRNPDVK 
RAMWQAIRFW LDMGVDGFRL DAIDTIFEDP ALTPHESRLS QVEMLRIWRE NRPPEETKEL 
WEQFALMFRY QVQQPGLHEL MKELRALVDE YPGNRVLIGE GDDIAYYGNG SDELHLVFNF 
PLMRTNRLTP AWVRANQAER LAALPPGAWP CNTLGNHDVG RMWTSYGDGV NDAALARLHA 
AMLLTLKGTP VLYNGEEIGM TDLLLERFEQ LRDNQAVNLY HLAVGDGIDP AEAMKMAAAI 
SRDRCRTPFQ WANAPNAGFS PPGVATWLPV NPNYAQGVNV ADQEQNPDSL LNYYRRLIGA 
RQAIPALLAG DYAPLHPDED RYLAFLRTTP DQRCLVVLNF SPEPVTTGFD LNGARLRTLF 
SSHPRPTRDE HPERLTLAPF EAYIGEVIRI GTDWE