Gene Rpal_4163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4163
Symbol
ID	6411847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	4458907
End bp	4460862
Gene Length	1956 bp
Protein Length	651 aa
Translation table	11
GC content	63%
IMG OID	642714045
Product	alpha amylase catalytic region
Protein accession	YP_001993134
Protein GI	192292529
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACAAGT CGACACAAAC GCTTCAGGCC GCCGCTCATG GCGGCGCTTT TCACATCGAA 
GACATCTATC CGCTGATCGA CGGCGGACGC TTTGCGGTGA AGCGGATCGT CGGCGAGCCG 
ATTGAGGTTT GGGCTGACAT TTATCGCGAC GGCCATGAGG TCATCGCCGC GGCCTTGATC 
TGGCGACGCG AGCAGGACAG CGCCTGGCAA CGCGTGCCGA TGACGCATGT CGTCAACGAT 
CGCTGGTCGG CGACCTTCAC GCCGCAGCAG CTCGGCCGTC ACGTTTATGC GATCGAAGCC 
TGGACCGACG AATTCGCAAC TTGGCGCCAC GGCGCCGAGC TCAAGCTGAA GGCTGGCCAG 
GATCTATCGC TCGAAGCACT CGAAGGCGCG GGCCTGCTGA CCAAGGCACA AACCGACGAT 
CCAGAAGTGC TGCGGCTGAT TCAGCAGCGC TGCGAAGAAT ATCTACGGAC CGGTGATATC 
ACGCCGCTGC TCTCGCCGGA ATTGCGCGAC GCGATGGCAA CCAGTCAGGT GCGGCAAGAC 
CTCACCCGCA CCGATCCGCT GCCGCTGACG ATCGACCGGC CGCGTGCCCG CTACGGCGCC 
TGGTACGAGA TGGTGCCGCG CAGCCAGAGC TCCGAGCCCG GCCGCCACGG CACCTTCCGC 
GACTGCATCG CCCGGCTGCC GGACGTCGCC GCGATGGGCT TCGACGTGGT GTATTTCACC 
CCGATCCATC CGATCGGCGC CACCAACCGC AAGGGCCGCA ACAACGCGCT GAAGGCCGAG 
CCCGGCGATC CGGGCAGCCC CTATGCGATC GGCGCCGAGC ACGGCGGACA TGATGCGATT 
CACCCGGAGC TCGGCACGCT GGCAGACTTC CGCGCCTTTA TCGATGCCTG CGAGGTCGTC 
GGCATCGAGG TTGCGCTCGA CATCGCCGTG CAGTGCTCGC CGGATCATCC GTGGCTGAAG 
CAGCATCCGG ACTGGTTCAA GCGCCGTCCC GACGGCTCGA TGAAATACGC CGAGAATCCG 
CCGAAGAAAT ACGAAGACAT CGTCAACCCG GACTTCTCCT GCGAAGACGC CGGTTCGCTG 
TGGAACGCGC TGCGCGACGT CATCCTGTTC TGGGCCGAAC AGGGTGTGAA GATTTTCCGG 
GTCGACAATC CCCACACCAA ACCGCTGCGG TTCTGGGAAT GGCTGATCCG CGAGGTGCAG 
CTTCGTCACC CCGACGTCAT CTTCCTGGCT GAAGCCTTCA CCCGCCCGAA ACTGATGAAG 
GGACTGGCCA AGCTCGGCTT CACCCAGTCC TATACTTACT TCACCTGGCG TACCCAGAAG 
TGGGAGATCG AGCAATATTT GCGCGAGCTT ACCGACTATC CCGAACGCGA CTTCTACCGG 
CCGAACTTCT TCACCAATAC GCCGGACATC CTGCCCTTCC ACCTGCAGGG CGGCGAACCG 
TGGATGTTCA AGTCGCGCCT CGTTCTCGCC GCAACGCTGT CATCGACCTA TGGCATCTAC 
AACGGCTTCG AGCTGCTCGA GCACGAGCCG ATCCCCGGCA AGGAAGAGTA TCTCGATTCC 
GAAAAATACG AGATCAAGGT GCGCGACTGG GACAAGCCGG GCAACATCAA GCCTTACATT 
CGCGACATCA ACCGCATCCG CGCCGCCAAC CCGGCCTTGC AGCAGACCAG CAATCTTCGC 
TTCCTCGAGG TGCAGGACCC GAATGTGACC GGCTTCGTCA AGACATCGGT CGACGGCACC 
AGTGCGGTCG CGGTGGCGAT CGCGCTCAGC AGCGACTACC ATGAATTCTG GCTACCGCTC 
GGCGACGTCC AGATCGAGGT TGCCGGCGAG CGACGACCGG TCGTTGCGGT CGAGAACTTG 
CTGACTGGCG AGCGCCACGC GCTCGATTGG GGCGGGATCA ACCTGCGGAT CGATCCGCAT 
CGTGACCCGG CGCTGCTGTT CCGTTGCCTG GCGTGA

Protein sequence

MNKSTQTLQA AAHGGAFHIE DIYPLIDGGR FAVKRIVGEP IEVWADIYRD GHEVIAAALI 
WRREQDSAWQ RVPMTHVVND RWSATFTPQQ LGRHVYAIEA WTDEFATWRH GAELKLKAGQ 
DLSLEALEGA GLLTKAQTDD PEVLRLIQQR CEEYLRTGDI TPLLSPELRD AMATSQVRQD 
LTRTDPLPLT IDRPRARYGA WYEMVPRSQS SEPGRHGTFR DCIARLPDVA AMGFDVVYFT 
PIHPIGATNR KGRNNALKAE PGDPGSPYAI GAEHGGHDAI HPELGTLADF RAFIDACEVV 
GIEVALDIAV QCSPDHPWLK QHPDWFKRRP DGSMKYAENP PKKYEDIVNP DFSCEDAGSL 
WNALRDVILF WAEQGVKIFR VDNPHTKPLR FWEWLIREVQ LRHPDVIFLA EAFTRPKLMK 
GLAKLGFTQS YTYFTWRTQK WEIEQYLREL TDYPERDFYR PNFFTNTPDI LPFHLQGGEP 
WMFKSRLVLA ATLSSTYGIY NGFELLEHEP IPGKEEYLDS EKYEIKVRDW DKPGNIKPYI 
RDINRIRAAN PALQQTSNLR FLEVQDPNVT GFVKTSVDGT SAVAVAIALS SDYHEFWLPL 
GDVQIEVAGE RRPVVAVENL LTGERHALDW GGINLRIDPH RDPALLFRCL A