Gene TM1040_0418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0418
Symbol
ID	4076178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	428354
End bp	430087
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	59%
IMG OID	638005713
Product	alpha amylase, catalytic region
Protein accession	YP_612413
Protein GI	99080259
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.537622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.197095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACAT CCTTTGCTGC ACGCCTGTCG CAACTGCTGA CCCAAATCTA TCCGGATTTG 
GACACGGAGA TCCTTGGCTC CAAAGTGGTT GAGGCGTTTT GGCCCGAAGG CAGTCACCGG 
CGCAAGCGCC CGCGCAGGCC TGGAAATTCT CTTTGGTCAG AACGCGACGC ATTGCTGATC 
ACCTATGGCA ACACCATGCG TGATGGGGCG CATAAGCCGT TAGACCTGCT GCATGATTTC 
CTGCTGACTT ATATGAAGGG TGTTGTGAAT GGCGTGCATA TCCTGCCGTT TTTTCCCTTC 
ACTTCGGACG ACGGGTTTGC CGTCACGGAC TATCGCAAGG TGAATCCTGA GCTGGGTGAT 
TGGGCCGACA TTCGCCGGAT CGGCGGCGCG TTTCACCTGA TGTCTGACAT GGTGCTCAAC 
CATGTGTCCT CGCAGAGCGC CTGGTTCAAC GCCTACCGGC AGGGGCAGCC GCCTTATGAC 
CGCTTCTTCT ACGAGGCTTC GCCCTCGGAC GATCTGAGCG CAGTGGTGCG TCCACGCACA 
ACGCCGCTGC TGCAGGAGGT AGAGACAGCC ACGGGCGCGA AACATGTGTG GTGCACCTTC 
AGCCACGATC AGGTTGATCT CAATTTTGAG AACCCGGAGG TCCTGCTGGA AATCCTTCGG 
ATCATTCGCC TGCATATCGA TCAGGGGGTC CGCATTATCC GGCTCGATGC GGTGGCCTTT 
ATATGGAAAG AGGTTGGGAC CAGTTCGATC CACCTGCCGC AAACCCATGC GATTGTACAG 
CTGCTGCGCC TGCTGGCAGA TTATGCGACC GAGACGGTGG TACTGCTGAC CGAGACCAAC 
GTGCCGCGGG CTGAGAATCT CAGCTACTTT GGCAATCGCA ACGAGGCCCA TGTGGTCTAT 
AATTTTCCGC TGCCGCCATT GATCCTGCAC GCGATGATGG CGGGCTCGGC GCGCTACCTG 
CTGAATTGGG CACGGGCGAT GCCGCCGGCG CCCCTGGGAT GCGCCTATTT GAATTTCACC 
GCGAGCCACG ATGGAATCGG GATGCGCCCG GCGGAGGGGG TGTTGCCGCA GGAGGAAATC 
GACCAGATGA TCGCCTGCGT GCGGGCGGTA GGGGGTCTTG TGTCCATGCG GGCCTTGCCG 
GGGGGTGGTG AAGCGCCCTA CGAGGTGAAC TGCACCTATT TTGACGCGCT TGGCCGAACC 
TTTGACAGGG GCGAAGCGCG AAAGGTGGAT CGATTCATCT GTGCGCAGAC CATTCCCATG 
AGCCTTGAGG GAATTCCGGC GTTTTACATT CACGCGATGC TGGCGACGGC CAATGATCAT 
GATGCGGTGG CGCGGCGCGG TATGAACCGG GCGATCAACC GCCACCGGTG GGATTACGGC 
GAGCTGAAGG CGCGTCTGAA TGACGCGGAC AGCGCGCAGG CTCAGGTGAT GTCGGCGCTC 
TCCGAACGGC TGCGGGTCCG GGCCGAGCAG CCGGCGTTTC ACCCCAATGC TACCCAGTTC 
ACTTTGCAGC TGGATGATCG TGTCTTTGCG CTCTGGCGGC AGTCGCTGGA CCGGGCGCAG 
TCGATCTTTG CGCTGCACAA TGTCAGCGGA GATGGGGTGA TCCTGCATCC CGGCGCGCTG 
AACCTTATTG AAGGTGAGAC ATGGCGGGAT CTGTTGTCCG GTGACATGTT TGAAAGCGAT 
GCAGAGATCA CACTGGCACC CTATCAATGC CGTTGGATCA CCAATCAGGC TTGA

Protein sequence

MATSFAARLS QLLTQIYPDL DTEILGSKVV EAFWPEGSHR RKRPRRPGNS LWSERDALLI 
TYGNTMRDGA HKPLDLLHDF LLTYMKGVVN GVHILPFFPF TSDDGFAVTD YRKVNPELGD 
WADIRRIGGA FHLMSDMVLN HVSSQSAWFN AYRQGQPPYD RFFYEASPSD DLSAVVRPRT 
TPLLQEVETA TGAKHVWCTF SHDQVDLNFE NPEVLLEILR IIRLHIDQGV RIIRLDAVAF 
IWKEVGTSSI HLPQTHAIVQ LLRLLADYAT ETVVLLTETN VPRAENLSYF GNRNEAHVVY 
NFPLPPLILH AMMAGSARYL LNWARAMPPA PLGCAYLNFT ASHDGIGMRP AEGVLPQEEI 
DQMIACVRAV GGLVSMRALP GGGEAPYEVN CTYFDALGRT FDRGEARKVD RFICAQTIPM 
SLEGIPAFYI HAMLATANDH DAVARRGMNR AINRHRWDYG ELKARLNDAD SAQAQVMSAL 
SERLRVRAEQ PAFHPNATQF TLQLDDRVFA LWRQSLDRAQ SIFALHNVSG DGVILHPGAL 
NLIEGETWRD LLSGDMFESD AEITLAPYQC RWITNQA