Gene Clim_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0834
Symbol
ID	6353904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	915887
End bp	917839
Gene Length	1953 bp
Protein Length	650 aa
Translation table	11
GC content	52%
IMG OID	642668457
Product	alpha amylase catalytic region
Protein accession	YP_001942892
Protein GI	189346363
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGATA ATCCTGTATT TACAGAAAAA CGGCCTGTCG AACGCACTCT CAGGGAGATT 
GATTTTTCAG AACTTGTCAA AGGAAAACAG TTTTATCCTT CCCCGGCTTC GTGGGAGGAT 
GAGGTGCTTT ATTTTCTTTT TCTCGACCGT TTTTCTGACG GCCTTGAATC CGGCGGTTTT 
GCATCTCTTG ACGGAATGCC GGTTGAAGGA AACGATTCAG GCAGAACGAC GTTGCTTTTT 
TCACCGCAGA CCGATGCCGG AACAGCTGAC CGGGATGCGT GGTTTGAAGC GGGAAGAAAC 
TGGTGCGGCG GAACTATTGC AGGCATGAAG GATAAACTGG GTTATCTGAA ACGACTCGGA 
ATTACGTCCG TATGGGTCAG TCCGGTGTTC AGGCAGGTTA CGGGGAGCGG CGATTATCAT 
GGTTACGGAA TCCAGAATTT TCTCGATGTC GATCCGCATT TCGGAACAAG GGAAGAGCTG 
AGGGATTTTG TTGCCGCTGC GCATCAGTCC GGCATCAGGG TTATTCTTGA TATTATCATC 
AATCATGCGG GTGATGTGTT CGCTTATGAG GGCAATGCGC AGTATACCTA TCAGGATGGA 
TGTGAATGGC CAGTGCAGGG ATACCGCCGG CACAGCGGTG ATCCGGGAAG CCTGCCGTTC 
GGCAGGATGG ATTTCGAAAA TACCGATGGA GCTGTCTGGC CGGTGGAACT GCAGGACGAG 
AGTACCTGGT CAAAGCATGG CGAAATCAGG AACTGGGACT GTTTTCCGGA ATTTCTCGAC 
GGAGATTTCT GTACCCTCAA GGATGTCCAT CTCGGCGATG CCCCTAAAGA TCCTGCCCTG 
GCCTGGGATC TGCAGCGTCG TATTCGCGAG TTCAGACCTT CGAATGCGCT CAGGCATCTT 
ACGGAGATCT ATCAGTTCTG GATTGCCTAT GCCGATATTG ACGGGTATCG GCTTGATACG 
GTCAAACATA TGGAGCCTGG AGCAGTACGG TATTTTGCAA CTGCCGTGCA TGAGTTTGCC 
ATTTCGGCAG GCAAGGAAAA TTTCTATATC ATCGGCGAGA TTACCGGAGG ACGCTCCTAT 
GCGGCATCTA TTCTCGACAG CACAGGTCTC GATGCCGCAC TGGGCATCAA CGACATTCCC 
GATAAGCTGG AGTTCATGGT GAAAGGGTGG CGCAGTCCCG GCAATCCCGA TACCGATGAG 
CAGGAAGGGT ATTTCGATCT TTTTCGCAAC AGTCTGCTCG ACAACAAGCA TACCCGGCAG 
TGGTACGGCA AGCATATCGT CACCATGTTC GACGATCACG ACCAGGTTGG AGTCAGGCAC 
AAGTTCCGTT TTGCGGGCGA TGATTTCCGA AGCGAACTGC TTCTGCCGGT TGTGCTTGGC 
CTGAACCTCG CTTCAGCAGG GATTCCCTGT ATTTATTATG GAACCGAGCA GGCGTTCAAC 
GGTGCCGATC ATCGTCGGGA TGACGACTCG TACAGCGACG TTTTTCTGCG TGAGTGCATG 
TTCGGCGGAC CATTCGGTTC GAGGCAGAGT GTCGGCAGAC ATTTTTTCAA CGAATCGCAT 
CCGGTTTACC GGTTTATCCG CGATGTGACC GCGTTACGTC ATGATCATAT CGAGTTGAGG 
CGTGGGCGGC AGTACCTGCG TCAGGTTTCT GCTACGGGTT TCGATGGTGA TTTTTACTAT 
CCGCAGCCGA TGAACGGTCA ATTGCACTGG ATTATCGCCT GGTCCCGCAT TTTTGCACAG 
AGGGAGCTGC TTTGTGCCGT CAATACCGAT ACGGATAACG GGTTGACTGT TTTCGTCGTG 
GTTGACAGTT CGATACATCC TCCCGGCTCC TCCATGCAGT GTCTTTATAC AACCGCAGAT 
GATTTTCAGC ATCATGCCGT TACGGTGGAA GCGAGGCAGG GTTCTTCGAT TCGAATTACG 
GTTCCGGCTG GAGGTTTTGT GGTGTACGGA TGA

Protein sequence

MSDNPVFTEK RPVERTLREI DFSELVKGKQ FYPSPASWED EVLYFLFLDR FSDGLESGGF 
ASLDGMPVEG NDSGRTTLLF SPQTDAGTAD RDAWFEAGRN WCGGTIAGMK DKLGYLKRLG 
ITSVWVSPVF RQVTGSGDYH GYGIQNFLDV DPHFGTREEL RDFVAAAHQS GIRVILDIII 
NHAGDVFAYE GNAQYTYQDG CEWPVQGYRR HSGDPGSLPF GRMDFENTDG AVWPVELQDE 
STWSKHGEIR NWDCFPEFLD GDFCTLKDVH LGDAPKDPAL AWDLQRRIRE FRPSNALRHL 
TEIYQFWIAY ADIDGYRLDT VKHMEPGAVR YFATAVHEFA ISAGKENFYI IGEITGGRSY 
AASILDSTGL DAALGINDIP DKLEFMVKGW RSPGNPDTDE QEGYFDLFRN SLLDNKHTRQ 
WYGKHIVTMF DDHDQVGVRH KFRFAGDDFR SELLLPVVLG LNLASAGIPC IYYGTEQAFN 
GADHRRDDDS YSDVFLRECM FGGPFGSRQS VGRHFFNESH PVYRFIRDVT ALRHDHIELR 
RGRQYLRQVS ATGFDGDFYY PQPMNGQLHW IIAWSRIFAQ RELLCAVNTD TDNGLTVFVV 
VDSSIHPPGS SMQCLYTTAD DFQHHAVTVE ARQGSSIRIT VPAGGFVVYG