Gene GM21_3232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3232
Symbol
ID	8138584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3750687
End bp	3751778
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	65%
IMG OID	644870836
Product	chalcone and stilbene synthase domain protein
Protein accession	YP_003023016
Protein GI	253701827
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3424] Predicted naringenin-chalcone synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGCA ATGTCTTCGT GGGCTCCATC GCCACCGTCG TTCCGCCGTT ATCCGTGGAT 
CAGCAGGAGG CGGCGGCGCT GATCAAGTCG CATTTCAAGG AGAGCCTCAC CGCGCGCGGC 
CTCGGGCTGA TTCGCGCCAC CTTCAACCAT CCCAGCATCA AGAAAAGGCA TTTCGCCGTC 
GATACCCCGG CGCGGATCTT CACCGAGACC CCCGATGAGC GGGTAGAGCG TTTCACCGAG 
CAGGCGGTCC GGCTGGCGGA GCAGGCTGTG CTGCGGGCGC TTGATAAGGC TGGGGTGGGG 
GTAAGGGAGG TGAACGGGCT GGTGCTGAAC ACCTGCACCG GCTACATCTG CCCCGGCCTT 
TCCAGCTATG TCGCCGAGCG CCTGGGGCTT CGCTGCGACG CGAGGTTGTA CGACCTGGTG 
GGGAGCGGCT GCGGCGGAGC GGTCCCCAAC CTGCAGGTGG CCGAGTCCAT GTTGAAGACG 
ACCGGCGGCA TCGTGGTGAG CGTGTCGGTT GAGATCTGCA GCGCCGCCTT CCAGATGGGT 
AACGACTTAA GCCTCATACT CTCCAACGCG CTCTTCGGCG ACGGCGCTGC GGCGGCCGTG 
CTCTGGGAGA AGCCGGCCGG TTTCGAGTTG GTCGCCTCCG CCGGACGCTA CGTGCCGGAG 
CAGCGCGAAG CGATCCGCTT CGTGCACCGG CAGGGACAGC TCCACAACCA GCTATCCACC 
GACCTCCCGC AACTGGTAAG AAAGGCCGCG GCTCAGGTGG TCGCGGACCT TCTGGAAAGA 
CATTCCCTCT CCATCGGCGA CATCGGCGGC TGGGCGCTCC ATACCGGCGG TGAAAAGATA 
GTCAACGCGG TGCGGGACGA GATCGGGATC GACGAGTCGC AACTGTGGGC GACCCGGAAG 
GTGCTGGAGC AGTACGGCAA CATGTCCTCG CCCACGGTCT GGTTCGTCTT GGATGAACTG 
CTGCAGAACG GGATGCGCGA GGATGAGTGG TGCGTGATGC TCGCCTACGG CGCCGGGCTT 
TCGGCGCACG CCTATTTGCT GAGAGGCTGG GGGCTGGGGG CTGGGGGCTG GGGGCTGGGG 
GCTGGGCGCT AG

Protein sequence

MNSNVFVGSI ATVVPPLSVD QQEAAALIKS HFKESLTARG LGLIRATFNH PSIKKRHFAV 
DTPARIFTET PDERVERFTE QAVRLAEQAV LRALDKAGVG VREVNGLVLN TCTGYICPGL 
SSYVAERLGL RCDARLYDLV GSGCGGAVPN LQVAESMLKT TGGIVVSVSV EICSAAFQMG 
NDLSLILSNA LFGDGAAAAV LWEKPAGFEL VASAGRYVPE QREAIRFVHR QGQLHNQLST 
DLPQLVRKAA AQVVADLLER HSLSIGDIGG WALHTGGEKI VNAVRDEIGI DESQLWATRK 
VLEQYGNMSS PTVWFVLDEL LQNGMREDEW CVMLAYGAGL SAHAYLLRGW GLGAGGWGLG 
AGR