Gene GM21_3943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3943
Symbol
ID	8139317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4528351
End bp	4529889
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	67%
IMG OID	644871560
Product	citrate lyase, alpha subunit
Protein accession	YP_003023718
Protein GI	253702529
COG category	[C] Energy production and conversion
COG ID	[COG3051] Citrate lyase, alpha subunit
TIGRFAM ID	[TIGR01584] citrate lyase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.000277042
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGCTCA ATAGCCTGGG CCGCGAGATT CCGGAGAGCT ACGCGGGGAG AAGGCTCGTC 
CCCTACGGCG ACCCCTACTC GATCACCCCG AGCGGGTGCG TCGCCGCCCG CCGCCTGAGG 
CGCGTGAACC CCGGCGCCTC CAAGCTCCTC TCCGGCCTCA GGGAGGCGAT CGAGGCGAGC 
GGCCTGAAAG ACGGCATGAC CATCGCCACC CACCACAGCC TCCGAAACGG CGACTTCCTT 
TTGAACCGGC TGGTGGCCGA GATCGCCCAG ATGGGGATCC GGGGGATCTG GATCGCCTCC 
TCCTCGGTGC ACCCGGTGCA CGCAGAGATC ATCCCTCACA TCAAAAGCGG CGTGATAGCC 
GGCTTCCAAT GTGGCGTGAA CGGCCTGATC GGCGAGATGG CGAGCCGGGG GGAACTCTCC 
TGCCCCATCG TGGTCCGGAC CCACGGCGGC CGGGCCCGCG CCATCATGGA GGGGTCGGTG 
CAGGTGGACG TCGCGTTCAT CGCCGCCCCC TGCTGCGACG AGTACGGCAA CATGAACGGC 
TACAGCGGCC CCTCCGCCTG CGGCAGCCTG GGGTACGCCC AGACCGACGC CCTGCACGCC 
GGCTGCGTCG TCGCCGTCAC CGACAACCTG GTCCCCTTCC CGGTGGTGCC GGTCAGCATC 
CCGCAGACCC TGGTGGACTA CGTGGTGACG GTGGACCGGC TGGGGGACCC GGCGAAGATC 
GTCTCCACCA CCACCAGGAT CACCACGGAT CCGGTCGGGC TCCAGATCGC CGGCTACGCC 
TCACAGGTGA TCGAGGCCTC CGGCCTCTTG AAGGACGGCT TCTCCTTCCA GACCGGCAGC 
GGCGGCATCT CTCTCGCCGT CTCGGACAAG GTGAGAGGCG CCATGCGCCG CGGCAACATC 
AAGGGGAGCT TCGGCTGCGG CGGCATCACC GGATACTTCG TGGAGATGCT GGAAGAGGGG 
CTCTTCGGCG CGCTGATGGA CGTGCAGTGC TTCGACCAGG AGGCGGTGAA GTCGATAGCG 
AAAAACCGAG CCCACCAGGA GATCGGCGCC GACATGTACG CGAACCCCTT CAACGCGGGG 
GCCGTGGTGA ACCGGCTCGA CTGCGTGATC CTCGGGGCGA CCGAGGTGGA CACCTCCTTC 
AACGTCAACG TGAACACGGA GTCCAACGGC TACCTGCTGC ACAACACCGG CGGCCACTCC 
GACACGGCCG CCGGGGCGAA GCTTTCCATC ATCGTGGCCC CCTCCATCCG CGGGCGCCTC 
CCCATAGTGC GCGACCGGGT CACCACCGTC ACCACCCCCG GCGAGACCAT AGGCGTAGTG 
GTGACCGAGC GGGGGATCGC GGTGAACGAC CGGCACCCCG AGCTCAAGGA GGAGCTTGTC 
AGGAGGAAGC TGCCGGTCAA AGAGATCGGC GAACTGCAGC GCGAGATCTG CCGGGTGACC 
GGCACCCCGC AGCCGCTTCA GTTCGAGGAC CAGGTGGTGG CGGTGATCGA GTACCGGGAC 
GGGAGCATCA TCGATGTCGT TAGACGCGTT AAGGAATAG

Protein sequence

MALNSLGREI PESYAGRRLV PYGDPYSITP SGCVAARRLR RVNPGASKLL SGLREAIEAS 
GLKDGMTIAT HHSLRNGDFL LNRLVAEIAQ MGIRGIWIAS SSVHPVHAEI IPHIKSGVIA 
GFQCGVNGLI GEMASRGELS CPIVVRTHGG RARAIMEGSV QVDVAFIAAP CCDEYGNMNG 
YSGPSACGSL GYAQTDALHA GCVVAVTDNL VPFPVVPVSI PQTLVDYVVT VDRLGDPAKI 
VSTTTRITTD PVGLQIAGYA SQVIEASGLL KDGFSFQTGS GGISLAVSDK VRGAMRRGNI 
KGSFGCGGIT GYFVEMLEEG LFGALMDVQC FDQEAVKSIA KNRAHQEIGA DMYANPFNAG 
AVVNRLDCVI LGATEVDTSF NVNVNTESNG YLLHNTGGHS DTAAGAKLSI IVAPSIRGRL 
PIVRDRVTTV TTPGETIGVV VTERGIAVND RHPELKEELV RRKLPVKEIG ELQREICRVT 
GTPQPLQFED QVVAVIEYRD GSIIDVVRRV KE