Gene Acid345_2519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2519
Symbol
ID	4069888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2974203
End bp	2975951
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	56%
IMG OID	637984536
Product	alpha amylase
Protein accession	YP_591594
Protein GI	94969546
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.252753
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTACT CCGCGCGCAT CGCGCTCGCC TTCTTTTCCC TATTCCTCTT CCTCCCGAAA 
ATCAGTTTCG CCGTCGATCA AGCCCTCAAC GGCTACGAGC CCAAGTGGTG GAAAGAAGCA 
GTTGTATACC AGGTCTATCC GCGCTCGTTC AAAGACTCCA ACGGCGATGG CATTGGCGAC 
CTGAAGGGCA TCACCTCGAA GCTCGATTAC CTGCAATCGC TCGGCGTGGA CGTCATCTGG 
CTGAGCCCGC ACTACGATTC CCCCAACGCC GACAACGGCT ACGACATCCG CGATTACGAG 
AAAGTGATGA AGGAGTTCGG CACCATGGCC GACTTCGACG AACTTCTCAA AGGCGTGAAG 
GCTCGCGGCA TGCGCCTGGT GCTCGATCTC GTGGTGAACC ACACTAGCGA CGAGCATCGC 
TGGTTCGTCG AGAGCCGCAA GTCGAAGGAC AATCCGTATC GCGATTACTA CATCTGGCGC 
CCCGGCAAAG ACGGTGGCCC GCCGAATAAT TACACCTCAT TCTTCTCCGG CTCCGCGTGG 
ACGCTCGATC CCACGACCAA CGAGTACTAC CTGCACTGCT TCGCGGTGAA GCAGCCTGAC 
TTGAACTGGG ACAACCCAAA AGTCCGCCAG GAAGTGTATT CCCTGATGAA GTTCTGGCTC 
GACAAGGGCG TGGACGGATT CCGCATGGAC GTCATCCCCT TCATCTCGAA ACTGCCCGAT 
CTGCCGGACA TCCCGCCCGA GTATCGCGAA CGTCCGCAGT ACTTCTACAC CCAGGGGCCG 
CATCTGCATG AATATCTGCA GGAAATGAAT AAAGAGGTTC TCTCGAAGTA CGACATGATG 
ACGGTCGGTG AGGCGTTCGG CGTCACGCTC GAGGGCACTC CGATGCTGGT GGATGAGCGC 
CGTCACGAAC TCAACATGAT CTTCAACTTC GATGCGGTGC GAATTGGACA TCCCTCGACA 
CCATGGATCG GCTGGACACT GCCAAAGCTG AAAGCGATCT ATACCGACGA AGACCAGAAG 
CTGGATCAAC ACAGTTGGAA TACGGTCTTC CTGTCAAACC ACGACAATCC CCGCGTAGTC 
TCTGCCTTTG GCGACGACTC TCCGGAGTGG CGCGAGAAAT CAGCGAAGCT GCTCGCGACG 
ATGGTCCTCA CCCTCAAGGG CACTCCGTTC ATCTATCAGG GCGACGAACT CGGCATGACC 
AATTATCCGT TCAAGGGCAT CGAGGACTTC GACGACATCG AAGTAAAGAA CGCGTGGAAG 
GAATACGTGG AGACTGGACG CATCAGCAAA GAACACTTCC TCGACAACGC CCGGCGGGTG 
GCACGCGACA ACTCGCGCAC TCCGATCCAG TGGGATGATT CGAGCAATGG TGGCTTCACC 
ACCGGCAAGC CCTGGCTCGC GGTAAACCCG AATTACAAGA AAATCAATGC TGCAGAGGAG 
CAGAAAGACA AAGACTCCGT CTACCAATAC TTCCAGCGCA TGCTGGCCTT CCGCAAGACG 
ACCAAGGCTT TCAGCTACGG CGATTACAAG GACCTCGATC CGCAAAACGA AAAGATCTTC 
GCCTACACGC GAACGCTCGG AAAAGAGAAG TATCTCGTCG TGCTTAATTT TTCGAAGGAT 
GCGCTGAAGT ATTCCCTGCC CGGAGTGAAG GCGGGAAAAC TGGTGATGTC GAACGAAGGT 
GCGGCGGAGG AGAACGCGAC CACGCTAATG ATGAAAGGCT GGGAAGCCCG GGTTTACAGA 
GTCGAGTAA

Protein sequence

MTYSARIALA FFSLFLFLPK ISFAVDQALN GYEPKWWKEA VVYQVYPRSF KDSNGDGIGD 
LKGITSKLDY LQSLGVDVIW LSPHYDSPNA DNGYDIRDYE KVMKEFGTMA DFDELLKGVK 
ARGMRLVLDL VVNHTSDEHR WFVESRKSKD NPYRDYYIWR PGKDGGPPNN YTSFFSGSAW 
TLDPTTNEYY LHCFAVKQPD LNWDNPKVRQ EVYSLMKFWL DKGVDGFRMD VIPFISKLPD 
LPDIPPEYRE RPQYFYTQGP HLHEYLQEMN KEVLSKYDMM TVGEAFGVTL EGTPMLVDER 
RHELNMIFNF DAVRIGHPST PWIGWTLPKL KAIYTDEDQK LDQHSWNTVF LSNHDNPRVV 
SAFGDDSPEW REKSAKLLAT MVLTLKGTPF IYQGDELGMT NYPFKGIEDF DDIEVKNAWK 
EYVETGRISK EHFLDNARRV ARDNSRTPIQ WDDSSNGGFT TGKPWLAVNP NYKKINAAEE 
QKDKDSVYQY FQRMLAFRKT TKAFSYGDYK DLDPQNEKIF AYTRTLGKEK YLVVLNFSKD 
ALKYSLPGVK AGKLVMSNEG AAEENATTLM MKGWEARVYR VE