Gene GM21_3947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3947
Symbol
ID	8139321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4531531
End bp	4532532
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	64%
IMG OID	644871564
Product	citrate lyase ligase
Protein accession	YP_003023722
Protein GI	253702533
COG category	[C] Energy production and conversion
COG ID	[COG3053] Citrate lyase synthetase
TIGRFAM ID	[TIGR00124] [citrate (pro-3S)-lyase] ligase [TIGR00125] cytidyltransferase-related domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.0000190715
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTCACTT CCCTTCTATC AACAGATGAT CTGAAGCAGG CGCAGGCACT GGTAGCGGAA 
AGCGGCCTGC GCTTCGAGCT TCCCTACGAC GACCTGGTCG GGGTGTTCGA GGCCGGGCGG 
CTGGTGGCGG TCGGCGCCAG GCAGGGGCGC GTACTCAAGA TGCTCGTCGT GGCGCCCGCG 
CACCAGGGGG GGAGCCTGCT CGACGAGGTG GTGACGGAGC TGGTGGGACG CGGCTACCAG 
GAGGGGATGG ATTCCTTCTT CGTCTTCACC TCGCCGGCAC TCGCCCCGAG CTTCGAATCG 
CTCAACTTCA ACCTTTTGGT CACCTCGGGA AAGACCGCGC TTTTGGAGTA CGGCGACGGG 
CTGAGGCGCT ACCTGGCCCG GTACAGCCGG CAGGTGTTTC CCGGCAACAA CGGCGCCGTG 
GTGGCCAACT GCAACCCCTT CACCGTGGGG CACCGCTACC TGGTGGAAGA AGCCGCCTCC 
GTCGTCGACC ATCTCTACCT CTTCGTGGTG CGCGAGGAGC GCTCCCTGTT CCCATTCCCG 
GCGCGCCTGC GGATGGTGCG GGAAGGGACC GCCGATCTGA AAAACGTCAC CGTCCTCGAT 
ACCTCCTGGT ACGCAGTCTC CAGCGTCACC TTCCCCACCT ATTTCCTGAA ATGCGACGAC 
CCGGTGGGCG CCATCCAGAT GGAGCTCGAC CTGCTCCTCT TCGCCACCCG CATCGCGCCC 
TATTTCCATA TCGCCACCCG CTTCATCGGC TCCGAGCCGT TCAGCCGCAC CACGGCGGAA 
TATAACCGCG CCATGCACAG GATTCTCCCC CCAATGGGGA TCGGGGTGCG GGAGCTGGAA 
AGAAAGAGCG CCTTTGGCGC GGCGGTGAGC GCCTCAAGGG TGCGGGAGAT GCTGATGGCA 
GGCGAACTGG AGGGGATCGC CGAGCTGGTG CCGGTGAGCA CGCTCGATTT TCTCCTCTCC 
AGCGAGGGGA TCAAGATCTG GGACAAAGGG GGGAGCAAAT GA

Protein sequence

MVTSLLSTDD LKQAQALVAE SGLRFELPYD DLVGVFEAGR LVAVGARQGR VLKMLVVAPA 
HQGGSLLDEV VTELVGRGYQ EGMDSFFVFT SPALAPSFES LNFNLLVTSG KTALLEYGDG 
LRRYLARYSR QVFPGNNGAV VANCNPFTVG HRYLVEEAAS VVDHLYLFVV REERSLFPFP 
ARLRMVREGT ADLKNVTVLD TSWYAVSSVT FPTYFLKCDD PVGAIQMELD LLLFATRIAP 
YFHIATRFIG SEPFSRTTAE YNRAMHRILP PMGIGVRELE RKSAFGAAVS ASRVREMLMA 
GELEGIAELV PVSTLDFLLS SEGIKIWDKG GSK