Gene Acid345_3105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3105
Symbol
ID	4072669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3689109
End bp	3690158
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	61%
IMG OID	637985124
Product	chalcone and stilbene synthases-like
Protein accession	YP_592180
Protein GI	94970132
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3424] Predicted naringenin-chalcone synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATCA CTGGAGTGGC CACGGCCTTT CCGCCGAACC GGTATAGCCA GCAGGAAATC 
TTCCAAGCGC TGGGAAAAAA TTGGGCGGAC AAGCTCGATA AGCCACAGGT GTTGGAGCGG 
TTGCACTCGC GCGTTGGTGT AGATCATCGC CACCTCGCGC TCACTATTCC CGAATACGAC 
AACATGCTGA CCTTCGGCGA CTCCAACAAT GCGTGGATCC GCGTTGCCGA ACAACTCGGC 
GAGAAAGCTC TCTGCCGCGC GCTGCATCGC GCCGGAATTT CCGCCACCGA ACTCGACGCG 
CTCTTCTTCG TTTCTGTCAC CGGCATGTGC TCGCCTTCCA TCGATGCGCG TCTCGTCAAC 
AAGATGAAGC TCTCGCCGAA CATCAAGCGC ATCCCCATCT TCGGTCTCGG ATGCGTCGCT 
GGCGCCGCCG GCATCGCGCG CGCCGCTGAC TACGTCAAAG CCTATCCCGA TCATCACGTT 
GCTCTGCTGT CCGTCGAGTT GTGCTCGCTC ACCTGGCAAC GCGACGACCT CTCCGTCGCG 
AACCTCATCT CGTCCGGTCT CTTTGGTGAT GGCGCCGCCG CCGTCATCAT CTCCGGCAAA 
GACAAAGCCC AGCACGGCCC GCGTGTCGTC GCGACGCGCT CGGTTTTTTA TCCCGACACG 
CAAGACGTCA TGGGTTGGGA CATCTCCGAG AAGGGCTTCC GCATTGTCCT CTCGCAAGAC 
GTTCCGACGA TGGTCCACGA TCACCTGCGA GGTGATGTCG ACAGCTTCCT CGCCGAGTTC 
GATCTCAAGC GCTCCGACAT CGCCACGTGG ATCATGCACA CCGGTGGCCC GAAGGTCCTC 
GAGGCAACGG AGCAATCGCT GGAACTTCCC GAAGGCGCAC TCGCTCCGTC CTGGAAATGC 
TTGAGCGAAG TTGGCAATCT CTCGTCGGCT TCGGTGCTCG TGGTGCTCGA AAACATTTAT 
CACCACCAGC GTCCCGCTCC CGGGACGCTC AGTGTCCTTG CAGCCATGGG CCCCGGTTTC 
TGCGCCGAGC TCGTGCTGCT CGTGTGGTAA

Protein sequence

MRITGVATAF PPNRYSQQEI FQALGKNWAD KLDKPQVLER LHSRVGVDHR HLALTIPEYD 
NMLTFGDSNN AWIRVAEQLG EKALCRALHR AGISATELDA LFFVSVTGMC SPSIDARLVN 
KMKLSPNIKR IPIFGLGCVA GAAGIARAAD YVKAYPDHHV ALLSVELCSL TWQRDDLSVA 
NLISSGLFGD GAAAVIISGK DKAQHGPRVV ATRSVFYPDT QDVMGWDISE KGFRIVLSQD 
VPTMVHDHLR GDVDSFLAEF DLKRSDIATW IMHTGGPKVL EATEQSLELP EGALAPSWKC 
LSEVGNLSSA SVLVVLENIY HHQRPAPGTL SVLAAMGPGF CAELVLLVW