Gene Rleg_3102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3102
Symbol
ID	8014010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3100571
End bp	3102217
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	62%
IMG OID	644825669
Product	alpha amylase catalytic region
Protein accession	YP_002976897
Protein GI	241205801
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.355967
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.289712
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTGC AGGCAGGCGG GAGTGCGGAC TGGTGGCGCG GCGCGGTGAT CTATCAAGTC 
TATCCGCGCT CGTTTCAGGA CACCAACAGC GATGGTCTCG GCGATCTCAG GGGAATTACC 
CGCCGGCTGC CGCATATTGC CAGCCTCGGC GTCGACGCGA TCTGGCTCTC GCCCTTCTTC 
AAGTCGCCGA TGGCCGACAT GGGCTACGAC GTTTCCGATT ATTGCGACGT CGATCCGATC 
TTCGGGACAC TCGCCGATTT CGACGAGATG ATGGCCGAGG CGCACAAGCT CGGCATCAAG 
GTTGTTATCG ACCAGGTGAT CTCGCACACC TCCGACCGGC ATCCCTGGTT CGTCGAGAGC 
CGATCGAGCC GGACCAATCC CAAGGCGGAT TGGTATGTCT GGGCCGATCC GAAGCCTGAC 
GGCACGGCGC CGAACAACTG GCTGTCGATC TTCGGCGGGC CGGGCTGGGA ATGGGATGGC 
GTGCGCCGGC AATATTACCA GCATAATTTC CTGACCTCGC AGCCGGATCT CAACTTCCAC 
AGCGAGGCCG TGCAGGATGC GGTGCTGGAG ACGGTGAAGT TCTGGCTCGA CCGCGGCGTC 
GACGGCTTCC GCCTGGATAC GGTCAACTAT TATTTCTGCG ACAAGCTGCT CAGGAGCAAT 
CCGCCGCACG AGCCGGATGA GGATGACGCA GGCCTCGATG CGCCCGACAG CAATCCCTAC 
GGCATGCAGA ACCACCTCTA TGACAAGACG CAGCCGGAAA ATGTCGATTT CCTCAAACGC 
TTCCGGGCGC TGCTCAACCA GTACGAGGAT CGCACGACCG TCGGCGAAGT CGGCGATGGG 
GCGCGTTCGC TGAAGACGGT TGGCGCCTAT ACGAGTGGCG GCGACAAGCT GCACATGTGC 
TACACATTTG ATCTGCTGGG GCCGGAATTC ACCGCCGAGC ATATTCGCGG CTGCGTCGAG 
GCCTTCCAGA AAGCAGTCAC GGACGGCTGG GTCTGCTGGG CTTTTTCCAA CCACGACGTC 
ATGCGCCATG TCAGCCGTTT TGCGCGGACG GAGGAAGAGC GGCCTGTCAT CGCCAAGCTG 
GCGATCTCGG TGCTTGCGGC ACTACGTGGC TCGATCTGCC TCTATCAAGG CGAGGAACTC 
GGCCTGCCCG AGGCGGAGCT CGCCTTCGAG GATCTGCGCG ATCCCTACGG CATCCGCTTC 
TGGCCGGCCT TCAAGGGCCG CGACGGATGC CGCACGCCGA TGCCCTGGGA AGCCGGCAAG 
GCGCATGCGG GCTTCACGTC GGCCGAGAAG AGCTGGCTGC CGGTACCTTA CGAGCAGGCA 
GCGCTTTCCG TGGATACGCA GGAGACGAGC GACAGCTCGG TGCTGCATCA CTACCGCAGG 
ACGCTCGCAT TCCGGAGGAG CCACCTGGCG CTGATCGACG GCGAGATGAC CTTCATCGGC 
ACCAACCAGG ATCTGCTCGC CTTCACCCGC GAAAAGGGCG GAGAAAAACT GCTCTTCATT 
TTCAACCTGA CGCGCAAACC GGCGGAATTC CGCCTGCCTG ACGGCATCGT GCTCGGGGAA 
CCGCTTGCGA TGCCGGGCTT CGAGGCGGTG GCTGACGCGG GATTGGTGAA GCTTGCGGCG 
TTGGATGGGT TTTGTGCGCG GGTTTGA

Protein sequence

MALQAGGSAD WWRGAVIYQV YPRSFQDTNS DGLGDLRGIT RRLPHIASLG VDAIWLSPFF 
KSPMADMGYD VSDYCDVDPI FGTLADFDEM MAEAHKLGIK VVIDQVISHT SDRHPWFVES 
RSSRTNPKAD WYVWADPKPD GTAPNNWLSI FGGPGWEWDG VRRQYYQHNF LTSQPDLNFH 
SEAVQDAVLE TVKFWLDRGV DGFRLDTVNY YFCDKLLRSN PPHEPDEDDA GLDAPDSNPY 
GMQNHLYDKT QPENVDFLKR FRALLNQYED RTTVGEVGDG ARSLKTVGAY TSGGDKLHMC 
YTFDLLGPEF TAEHIRGCVE AFQKAVTDGW VCWAFSNHDV MRHVSRFART EEERPVIAKL 
AISVLAALRG SICLYQGEEL GLPEAELAFE DLRDPYGIRF WPAFKGRDGC RTPMPWEAGK 
AHAGFTSAEK SWLPVPYEQA ALSVDTQETS DSSVLHHYRR TLAFRRSHLA LIDGEMTFIG 
TNQDLLAFTR EKGGEKLLFI FNLTRKPAEF RLPDGIVLGE PLAMPGFEAV ADAGLVKLAA 
LDGFCARV