Gene RoseRS_3722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3722
Symbol
ID	5210703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4658678
End bp	4660618
Gene Length	1941 bp
Protein Length	646 aa
Translation table	11
GC content	62%
IMG OID	640597317
Product	alpha amylase, catalytic region
Protein accession	YP_001278026
Protein GI	148657821
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0146408
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTCG TCCGCGATAT GTTAAGCCGA CCACGCCCGC CACGCATCAG GCATGATGTT 
CAGTTGCCGC GTCGGGTTGC ATACTACCCG TCACCGGTCG ACTGGCGTGA CGAGGTGATC 
TACTTTTTGA TGGTTGATCG CTTCAGCGAT GGACAGGAAG ATACCCGCCC GTTGCTCGAC 
CGGCGCTACC TGGCGGCAGC GCGACCGGCG CTGCCCAACG GCGACCCCTG GCGCTGGGAT 
CGCTGGGCGT TGTCGGGCGG TGAACGATTT CAGGGCGGCA CGTTGCGTGG AATCATATCG 
AAACTCGGCT ATCTGCAGCG GCTCGGCATC ACCACCCTGT GGCTCAGCCC GGTCTGCAAA 
CAGCGCGTCC ACCTCGACAC CTATCACGGC TATGCCATTC AGGATTTTCT GGATGTCGAT 
CCGCGCTTCG GCACGCGCCA GGACCTGGTC GATCTGGTGA GCGCTGCGCA TGAGCGTGGC 
ATGCGGGTAT TGCTCGACAT CGTGTTCCAG CACACCGGTC CCAACTGGCG CTACCCGCCC 
GATGTTCCCG GTGGCGCAGA CATGCCGCGC TATACGAGCG GGCGCTACCC GTTCGGCAGT 
TGGGTCGATG CTGCGGGTGC GCCGCTCGTG GGCATTCCTG ATGTGAACGA TGCTGCCTGG 
CCCGAAGAGA TGCGCACGAT CGACTATTAT ACGCGCGCTG GCGCCGGCGA TCTGGGCGCT 
GGCGCTATCG ATGATCCGGA TGCCGAGCAT AAACGGTCGG ACTTTTTCAC GCTGCGCGAC 
ATCAATCTCG ATGCGCCGGG CGCGCTCACC GATCTGGCGC TGTGCTACAA ATACTGGATT 
GCGTTGACCG ACTGCGATGG GTTTCGAATC GATACGCTCA AACATGTCTC ATTCGAGCAG 
GCGCGCAATT TCTGCGGCAC GATCAAGGAG TTCGCCGCCA ACCTGGGCAA AGCGAACTTC 
TTCCTGGTCG GCGAAGTCGC CGGGGGCGAT TTTGCCGCAA CACGCTACCT CGACGCGCTG 
GAGCGCAACC TGAATGCCGC ACTCGATATC GGCGAAATGC GCCTGGCGCT CGGAGATGTT 
GCAAAGGGGC TGGCGCCAGC GCGCGCCTAT TTCGACGGGT TCGTGCCGGG GCTGGCAATC 
ATGGGGTCGC ACCGCAATCT CGGCAGTCGC CATATCTCAA TCCTCGACGA TCACGACCAC 
GTTTTTGGAA CAAAACTCCG TTTCTCAACC GATGTGATGT CGCAGCATCA TGCGGCGGCA 
GCAGTCGCAC TGCAACTCTT CACGCTCGGC ATTCCATGCA TCTATTACGG CACCGAACAG 
GCGCTCGGCG GTCCTGAACC ATCGGAGCGA CAGTGGTTGC CGGAGTGGGG ACGCGCCGAC 
CGCTACCTGC GCGAGGCGAT GTTCGGTCCA CTCCACCCGC GCGCGTCCGG TCGCGCCGGG 
ATCGACCCCC AGGCGCTCGA TACATCGTTG CCAGGATTTG GACCTTTTGG CACTGCCGGG 
CATCACTGCT TCGACGAGCG CTTTCCAGTC TACCTGCGCA TCGCGGCGCT GGCAGCCCTG 
CGCGCCGCCT TCCCGGTGTT ACGCCACGGT CGCCAGTATC TGCGCCCGAT TTCAAACTTC 
AACCAGCCAT TCGCATTCCC GCCAGCCGGA GAAATCGTCG CCTGGTCGCG CATCCTCGAT 
GACGAGGAGG CGTTGTGCGT GATCAATCCG AATGGTCTGG CGGCACGTGG CGGCGATGTA 
GTGGTCGATG CCGCACTGAA CCGCCCCGGT GATACCATGA CGGTCATCCT GAATACCGCC 
CAGGCCGCTG ATCCAGACGG CTATGACGGT CTGTATCCCA AAGGACGGCA ATTGACGGTT 
AGAGAGCGGA ATGGAACGTC GTATGTTGAA ATTCGCAACC TGCCGCCAGC CGAGACGCTG 
GTGCTGACAA ACCGACCATA G

Protein sequence

MTFVRDMLSR PRPPRIRHDV QLPRRVAYYP SPVDWRDEVI YFLMVDRFSD GQEDTRPLLD 
RRYLAAARPA LPNGDPWRWD RWALSGGERF QGGTLRGIIS KLGYLQRLGI TTLWLSPVCK 
QRVHLDTYHG YAIQDFLDVD PRFGTRQDLV DLVSAAHERG MRVLLDIVFQ HTGPNWRYPP 
DVPGGADMPR YTSGRYPFGS WVDAAGAPLV GIPDVNDAAW PEEMRTIDYY TRAGAGDLGA 
GAIDDPDAEH KRSDFFTLRD INLDAPGALT DLALCYKYWI ALTDCDGFRI DTLKHVSFEQ 
ARNFCGTIKE FAANLGKANF FLVGEVAGGD FAATRYLDAL ERNLNAALDI GEMRLALGDV 
AKGLAPARAY FDGFVPGLAI MGSHRNLGSR HISILDDHDH VFGTKLRFST DVMSQHHAAA 
AVALQLFTLG IPCIYYGTEQ ALGGPEPSER QWLPEWGRAD RYLREAMFGP LHPRASGRAG 
IDPQALDTSL PGFGPFGTAG HHCFDERFPV YLRIAALAAL RAAFPVLRHG RQYLRPISNF 
NQPFAFPPAG EIVAWSRILD DEEALCVINP NGLAARGGDV VVDAALNRPG DTMTVILNTA 
QAADPDGYDG LYPKGRQLTV RERNGTSYVE IRNLPPAETL VLTNRP