Gene TM1040_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3304
Symbol
ID	4075708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	311182
End bp	312834
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	59%
IMG OID	638004812
Product	alpha amylase, catalytic region
Protein accession	YP_611538
Protein GI	99078280
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.251779
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.854548
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCTC AGACCACAAT CAACCCTGCT TCGGTGCTGT CCAATGACCC GGATTGGTGG 
CGCGGTGCGG TGATCTACCA GATTTATCCG CGCAGCTACC AAGACAGCAA TGGCGACGGC 
ATCGGGGATC TGCAGGGTAT CACGTCACGT CTGGACCACA TCGCCTCTCT TGGGGTGGAT 
GCCATCTGGA TTTCGCCCTT TTTCACGTCA CCGATGAAAG ACTATGGCTA CGATGTCAGC 
GACTACTGCG ATGTTGATCC GATGTTTGGC AACCTCGCAG ATTTTGACGC GCTGGTGGCG 
CGGGCGCATG ATCTCGGCCT GCGGGTGATG ATCGATCTGG TGCTGTCGCA TAGTTCGGAT 
CAGCACCCTT GGTTCGCCGA GAGCCGTCAG AGCCGCGACA ACCCAAAGGC CGACTGGTAC 
GTCTGGGCCG ATCCCCAAGA AGACGGCACG CCGCCGAACA ACTGGCTGTC GATCTTTGGC 
GGTTCCGCCT GGCATTGGGA CGCGCGCCGC GAGCAATATT ATCTGCACAA TTTTCTGGTC 
TCGCAGCCTG ACCTAAATTT CCATTGTCCG GACGTGCAGA ATGCGCTTTT GGATGTGACC 
CGCTTCTGGC TCGAGCGGGG AGTCGATGGG TTCCGCTTGG ACACCATCAA TTTCTACATC 
CACGACAAGG AGTTGCGGTC GAACCCAGCG CTTCCCAAGG ATCAGCGCAA TGCCAATATC 
GCCCCTTCGG TGAACCCCTA TAACCATCAG GAACACCTCT ACTCCAAGAA CCAGCCGGAA 
AACCTCGATT TTCTCGCGCG GTTCCGTGCG CTTTTGGACG AATACCCGGC CAAGACCGCG 
GTTGGCGAAG TCGGCGATGC GCAGCGCGGG CTGGAACTAT TGGGACAGTA CACGGCCGGC 
AACACCGGTG TCCACATGTG CTATGCCTTC GAGTTCCTGG CCAAAGATCC GCTAACCGCC 
GCGCGCGTGG CTGAGGTTTT TGAGCGCACA GATGAGGTAG CAGCCGATGG TTGGGCCTGT 
TGGGCCTTCT CCAACCATGA TGTTCAGCGG CACGTCAGCC GATGGGGGTT GTCGGACGCT 
GCGCTGCGCC TCCATGCGAC TTTGATCATG TGCCTCCGCG GCTCTGTCTG CATCTATCAG 
GGCGAAGAAC TGGGGCTGCC AGAGGCCGAT ATTTCCTTTG AAGATCTGCA AGATCCCTAT 
GGGATTGAGT TCTGGCCTGA ATTCAAAGGA CGCGATGGAT GCCGCACTCC GATGGTCTGG 
CGCAGCGACA ATACGCATGG CGGCTTCTCC GAGGCGCGTC CTTGGCTGCC GGTCAGCCTC 
GAGCATGCGG CGCTGTCCGT AGCAGAGCAA GAAGCAAACC CCGATGCGTT GCTGCACCAC 
TACCGCCGCG TGATTGCCCT GCGACGCGCC CACGCGGCAC TGTCGCACGG AACCCACGAC 
AAGGTCGTGG CAAGCGGGTC TGTCGTTCAT TTTCTGCGCA GCGCCGAGTC CGAGGACATC 
TTCTGTGCCT TCAATCTTGG CGAGGCGGCG GCAGAGGTCA GCTTGCCCGC GGGAACGTGG 
GAGCAGCTTG GTGCTGACAT CGGCACTGCC GAAATCAATG GTGATCTGGT GAAACTTGGC 
CCTTGGCAAG CCTGCCTCGT ACGGCGCGTA TAA

Protein sequence

MNAQTTINPA SVLSNDPDWW RGAVIYQIYP RSYQDSNGDG IGDLQGITSR LDHIASLGVD 
AIWISPFFTS PMKDYGYDVS DYCDVDPMFG NLADFDALVA RAHDLGLRVM IDLVLSHSSD 
QHPWFAESRQ SRDNPKADWY VWADPQEDGT PPNNWLSIFG GSAWHWDARR EQYYLHNFLV 
SQPDLNFHCP DVQNALLDVT RFWLERGVDG FRLDTINFYI HDKELRSNPA LPKDQRNANI 
APSVNPYNHQ EHLYSKNQPE NLDFLARFRA LLDEYPAKTA VGEVGDAQRG LELLGQYTAG 
NTGVHMCYAF EFLAKDPLTA ARVAEVFERT DEVAADGWAC WAFSNHDVQR HVSRWGLSDA 
ALRLHATLIM CLRGSVCIYQ GEELGLPEAD ISFEDLQDPY GIEFWPEFKG RDGCRTPMVW 
RSDNTHGGFS EARPWLPVSL EHAALSVAEQ EANPDALLHH YRRVIALRRA HAALSHGTHD 
KVVASGSVVH FLRSAESEDI FCAFNLGEAA AEVSLPAGTW EQLGADIGTA EINGDLVKLG 
PWQACLVRRV