Gene Cagg_1307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1307
Symbol
ID	7268598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1606139
End bp	1608097
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	54%
IMG OID	643566150
Product	alpha amylase catalytic region
Protein accession	YP_002462651
Protein GI	219848218
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000323164
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGTATGA GTGACCGGGA ATATCTATCA CGTGAGGCAG CGCGGTCGTT GGCGCGCCTA 
TTGCCGCGCG TGGAGCAATC GTTTACGGCT GCCGGTGGTA ATGCTGCTGA TTGGGCTGCA 
TTCGAGCAGC GATTGCGCCG GGAATGGCCT CGTCTGTTTG GGTTGTTGCT GAGCTTGTAC 
GGACACCAGT ACGACTTTTT TTACCATCTT GAACAGTTGT TAATCACGAT GGCCAACAGT 
TGGTACGAGC GCCCAGATTG GCTCAAGCAG CGCGATGCAG TACGCGAAGC TGATCATGAG 
TGGTTCCAAT CGGAACGGAT GATAGGTGGC GTACTCTATG TCGATCGCTT CTGTGGCACC 
CTCCATCGGC TGCGCGAGTT TATCCCCTAT TTCAATGAGC TAGGTTTGAC CTATCTGCAT 
TTGATGCCGT TGTTTGAAGC ACCGGCAGGC AATAACGATG GTGGCTATGC AGTCAGTAGC 
TACCGGCGGG TGAATTCGCA GATCGGTACT ACGGAAGAGT TGGCGGCATT GGCCCGTGAA 
CTTGAGTGCG CCGGTATCAG TCTGGTGTTG GATTTCGTCT TCAACCACAC CTCTGACGAA 
CACGAATGGG CGCAGCGGGC GCAGGCCGGT GATCCAGATT ATCAAGAGTT CTATTTCCTC 
TTCTCTGATC GTACTTTGCC TGATGCATAC GAGCGCACAC TACGCGAGAT ATTCCCGACG 
GTACGGCGCG GTAGCTTTAC GTGGCGACCC GATATGCAGC GCTGGGTGTG GACGACCTTC 
AACAGTTTTC AATGGGACCT CAACTATGCC AATCCAGCCG TGTTTCGGGC GATGGCTGCC 
GAGATGCTCT TTCTTGCTAA TCTGGGGGTG GCCGTTCTGC GGCTTGATGC GGTACCGTTC 
ATTTGGAAGC GGATGGGCAC CAACTGTGAG AATCAGCCGG AAGCACATCA GATTATCCAA 
GCGTTTAATG CGATTGCTCG CATTGCTGCA CCGGCTCTGC TCTTTAAATC AGAGGCAATT 
GTCCATCCTG ATGATGTCTT GAGTTATATC AGTCCGCATG AGTGTCAATT ATCGTATAAC 
CCACTCTTGA TGGCATTACT GTGGGAAACG TTAGCGACGC GCGAAGTAAA ATTGTTAGCT 
CACTCACTGA GCCATCGCTT CCGGTTACCG GCGGGTTGTG CGTGGATCAA CTATCTCCGT 
TCACACGACG ACATTGGCTG GACGTTTGAT GACAACGATG CGCGTGCGGT TGGGATTGAT 
CCGTGGGGCC ACCGTCAGTT TCTCAACGCT TTCTATACCG GGCGTTTTCC CGGTTCGTTT 
GCTCGCGGTT TACCATTCCA AGAAAACCCT GATACCGGTG ATGCGCGTGT ATCGGGGACA 
CTGGCATCGT TGGCGGGGCT GGAACAGGCT CTCAGTAATG GTGATCCGAC CGCTATCGAG 
ACGGCAATCC GGCGGATTCT CTTGCTGCAC AGCGTTATCC TGAGTATCGG TGGGATTCCG 
CTGATCTATC TGGGTGATGA GGTAGGGACA CTCAACGATT ATGGGTATGT CAACGATCCG 
GCCAAAGCCG ATGACAGTCG TTGGGTGCAT CGTCCGGTAC GTAATCAAGC GGCGATGGAT 
CGGCGCCACG ATCCGTCAAC GGTACCGGGA CGGATTTTTA GTGAATTAGT CAAGTTGATT 
CGATTGCGGA CTTCGTTGCC GGCGTTGCGC GATGGTGCAA TGGAAGTTGT GCGTAGCGAT 
AATCGGCACG TATTGGCGTA TGTGCGGCAA ACCGGCGCTC AGCGCGTGTT GGTACTGACC 
AACTTCTCGG AGTATCCGCA GACCATTGCC GGTAATTTGC TACGTATGTA TGGCCCCGGT 
GTGGAACTGT TCGATCTGGT GAGTGATCAA CCGGTTTCGG CGAATGAAGC GCTCGTACTG 
CCACCGTACC GATTTGTCTG GTTGACGCCG GTGCGTTAG

Protein sequence

MGMSDREYLS REAARSLARL LPRVEQSFTA AGGNAADWAA FEQRLRREWP RLFGLLLSLY 
GHQYDFFYHL EQLLITMANS WYERPDWLKQ RDAVREADHE WFQSERMIGG VLYVDRFCGT 
LHRLREFIPY FNELGLTYLH LMPLFEAPAG NNDGGYAVSS YRRVNSQIGT TEELAALARE 
LECAGISLVL DFVFNHTSDE HEWAQRAQAG DPDYQEFYFL FSDRTLPDAY ERTLREIFPT 
VRRGSFTWRP DMQRWVWTTF NSFQWDLNYA NPAVFRAMAA EMLFLANLGV AVLRLDAVPF 
IWKRMGTNCE NQPEAHQIIQ AFNAIARIAA PALLFKSEAI VHPDDVLSYI SPHECQLSYN 
PLLMALLWET LATREVKLLA HSLSHRFRLP AGCAWINYLR SHDDIGWTFD DNDARAVGID 
PWGHRQFLNA FYTGRFPGSF ARGLPFQENP DTGDARVSGT LASLAGLEQA LSNGDPTAIE 
TAIRRILLLH SVILSIGGIP LIYLGDEVGT LNDYGYVNDP AKADDSRWVH RPVRNQAAMD 
RRHDPSTVPG RIFSELVKLI RLRTSLPALR DGAMEVVRSD NRHVLAYVRQ TGAQRVLVLT 
NFSEYPQTIA GNLLRMYGPG VELFDLVSDQ PVSANEALVL PPYRFVWLTP VR