Gene Acid345_3523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3523
Symbol
ID	4072782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4168825
End bp	4169952
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	58%
IMG OID	637985546
Product	glycoside hydrolase family protein
Protein accession	YP_592598
Protein GI	94970550
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3325] Chitinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.416811
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTTG CGAAACGAGT TTTTGGGTTG TTACTGATCG TCTTTGTATC GCTTCCCGCG 
TTCGCGGCAG GGCGCAAGCG GCTGCTCGCC TACTATCCCG ATTGGGCGAA AGACCAAACG 
CCCGCGTACG ACGCGTCGAA AATTCCCTAC ACCAAACTCA CGCATATCCT GCATGCGTTT 
CTGCTGCTCG ATCCATCGGG AAACGGCGCG CTGCAAATCG ATCCCGAACT GATCGAGCCT 
GCGCTGACCC GCAACGCACA TAAGGCCGGC GTGAAAGTAA TGATCTCGAT CGGCGGCGCC 
GATGCCGAAC AGGCCACCGC GTTCGCAACC ATCGCCGCCA GCGCGCATTT GCGCAATACA 
TTTGCGAAGA ACCTGCATGC ATTCCTTGTC GCGCACGACT ACGACGGTGT GGACATTGAC 
TGGGAGGTTC CCAACGCGCC CGACGACACA ACGCACTGCA CGCAGCTGAT GGAAGCCCTC 
CGTCATGAAT TGCCCTCGCC ACGCTGGTTG ATCTCGATGG CGATTCCCTC GGATCCGCGC 
GGATATGGGA CAGGCTTCGA TGTCCCTGCA CTGGCGCCGC TTCTCGACTT CATTAACGTG 
ATGACCTACG ACTTCACCGG GCCGTGGATG GACGAAGCCG GACTGAACTC TCCGCTCTAC 
CAGGACCCGA ACGACCCCGA GCAGGCGGGA AGCCTGAAGA CTTCGATGGA CCTGTTTCAC 
GGGATCTACG GAGTGCCGCG TGCGAAGCTG AACATCGGCA CGGCGTTCTA CGGCTATGAG 
TTCGATAACG TGCGGCGGCT TTGGAACTAC TGTCCGAGTG GCGATTGCAG TGCTGCCCCG 
TCGTGGAACT ACGGCACGTA CATCAAGCAG CGGGTGAATG CGAAAGGCTG GAAGCGCTAT 
TGGGACGGCT CAGCGCAGTC GCCGTACCTG TTGTATCAAG GCACGGGCGG CAAGGATGGG 
CTGATTAGCT ACGACGATCC GATCTCGACC GCGTTGAAGA CGTACTACGT TCTGAAGACG 
CGGGACTTTG GCGGAATGTT TATGTGGGAC CTCAGTGGCG ATTACGACGG GAAATCACAA 
GACCTGCTCG ATGCGATGTA CGCGGTTTCA GCGCTTGTAA GTCACTAG

Protein sequence

MTLAKRVFGL LLIVFVSLPA FAAGRKRLLA YYPDWAKDQT PAYDASKIPY TKLTHILHAF 
LLLDPSGNGA LQIDPELIEP ALTRNAHKAG VKVMISIGGA DAEQATAFAT IAASAHLRNT 
FAKNLHAFLV AHDYDGVDID WEVPNAPDDT THCTQLMEAL RHELPSPRWL ISMAIPSDPR 
GYGTGFDVPA LAPLLDFINV MTYDFTGPWM DEAGLNSPLY QDPNDPEQAG SLKTSMDLFH 
GIYGVPRAKL NIGTAFYGYE FDNVRRLWNY CPSGDCSAAP SWNYGTYIKQ RVNAKGWKRY 
WDGSAQSPYL LYQGTGGKDG LISYDDPIST ALKTYYVLKT RDFGGMFMWD LSGDYDGKSQ 
DLLDAMYAVS ALVSH