Gene GM21_3990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3990
Symbol
ID	8139364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4573008
End bp	4574372
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	60%
IMG OID	644871606
Product	type I citrate synthase
Protein accession	YP_003023764
Protein GI	253702575
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01793] citrate (Si)-synthase, eukaryotic

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.000000256962
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACAGC TGAAAGACAG GCTAAAGGAA AAGATCGAGG CTCACCGTCC CCGCATCGCC 
CGGCTCACTA AAGAGTTCGG CTCAGTCATA ATCGACAAGG TCGATATAGC GCAATGCATC 
GGCGGCGCCC GCGATATTAG GTCCCTTGTT ACTGACATCT CCTATCTTGA TCCGCAGGAA 
GGGATCCGTT TCAGAGGCAA GACCATCCCC GAGACTTTCG AGGCCCTCCC CAAGGCAGCC 
GGTTCAGAGT ATCCCACAGT GGAATCGTTC TGGTATTTCC TGCTCACCGG CGAGGTTCCG 
ACCCCCGAGC AGGTGCAGGA CGTGGAAGCC GAATTCAAGA CGCGACAGCA GGTTCCGGAG 
TACGTGTTCC AGTCCTTGCG GGCGCTCCCG CTGGACAGCC ACCCAATGGT GATGCTCGCC 
TCCGGCATCC TCGCCATGCA AAGGGATTCC AAGTTCGCAG CCTTCTACAG CAGCGGCAAG 
TTCAACAAAA TGACGGCCTG GGAGCACGTC TACGAGGACG CCAGCGACAT CGTGGCCCGC 
ATCCCGGTAC TGGCAGCATT CATCTACAAC CTCAAGTACC GGGACGACAA GCAGATCTCC 
ATCGACCCGA AGCTGGACCT GGGCGCCAAC TTCGCCCAGA TGATAGGGCA GAGCGAGCAG 
TACAAGGATG TGGCACGCAT GTACTTCATC CTCCACTCCG ACCACGAGTC GGGCAACGTC 
TCGGCCCACG CCACCCACCT CGTCCACTCT GCCCTTTCCG ACCCCTATTA CGCCTATGCC 
GCAGGTCTCA GCGGCTTGGC CGGCCCTCTT CACGGCCTGG CGAACCAGGA GGTACTAGGG 
TGGATCCTGG AATTCCAGAA GAAGCTCAAC GGCGCCGAGC CGACCATGGA AAACGTCACG 
GCGGCTCTTT GGGACACCCT CAATGCCGGG CAGGTGGTCC CGGGTTACGG GCACGCCGTC 
CTCAGGAAGA CCGACCCGCG CTACATGGCC CAGCGCGAGT TCTGCCTGAA GACCACGGGG 
CTTAAGGACG ACAAGCTCTT CAAGCTGGTC TCCATGATCT TCGAGACCGC TCCGGGTGTC 
CTTACCGAAC ATGGCAAGAC CAAGAACCCG TGGCCCAACG TGGATGCGCA ATCGGGCGTG 
ATCCAGTGGT ACTACGGGCT GAAAGAATGG GATTTTTACA CGGTGCTCTT TGGAGTGGGG 
CGCGCCTTGG GATGCATGGC GAACATCACG TGGGACCGTG GCCTTGGCTA CCCCATCGAG 
CGACCCAAAT CCGTCACCAC CGAGATGCTG GAGACCTGGG CTGCGGCAGG TGGACGGGAT 
ATCACAGCCG CCACAATTCA GCAACCGCCA AAGCCAACTG CGTAG

Protein sequence

MTQLKDRLKE KIEAHRPRIA RLTKEFGSVI IDKVDIAQCI GGARDIRSLV TDISYLDPQE 
GIRFRGKTIP ETFEALPKAA GSEYPTVESF WYFLLTGEVP TPEQVQDVEA EFKTRQQVPE 
YVFQSLRALP LDSHPMVMLA SGILAMQRDS KFAAFYSSGK FNKMTAWEHV YEDASDIVAR 
IPVLAAFIYN LKYRDDKQIS IDPKLDLGAN FAQMIGQSEQ YKDVARMYFI LHSDHESGNV 
SAHATHLVHS ALSDPYYAYA AGLSGLAGPL HGLANQEVLG WILEFQKKLN GAEPTMENVT 
AALWDTLNAG QVVPGYGHAV LRKTDPRYMA QREFCLKTTG LKDDKLFKLV SMIFETAPGV 
LTEHGKTKNP WPNVDAQSGV IQWYYGLKEW DFYTVLFGVG RALGCMANIT WDRGLGYPIE 
RPKSVTTEML ETWAAAGGRD ITAATIQQPP KPTA