Gene Mext_4680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4680
Symbol
ID	5834266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	5229983
End bp	5231323
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	63%
IMG OID	641370475
Product	citrate synthase I
Protein accession	YP_001642119
Protein GI	163854076
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCCG GTCCAGTGCT GTTCCCGTCG CAAGAGAGGG TCCGCGATCC CATGAGCGCT 
TCCGCCAGCA CCATCATCGT GGGCGACAAA AACGTCGAAT TGCCCATCAA GACCGGAACG 
ATCGGCCCCG ACGTGGTCGA TATCGGCAAG CTCTACGCCC AGACCGGCAA GTTCACCTTC 
GATCCGGGCT TCACCTCGAC CGCCTCCTGC GAGTCGAAGA TTACTTACAT CGACGGCGAC 
GAGGGCGTGC TGCTCTATCG CGGCTACCCG ATCGAGCAGC TCGCCGAGAA CGGCGACTTT 
CTTGAGACCG CCTACCTGAT GCTGTTCGGC GAGTTGCCCA GCTCGGCCCA GAAGGCGGAT 
TTCGACTACC GGGTCACGCG CCACACCATG GTGCACGACC AGATGAACCG CTTCTTCCAG 
GGTTTCCGCC GCGACGCCCA CCCGATGGCG GTGATGGTGG CCTGCGTCGG CGCGCTCTCG 
GCCTTCTATC ATGACTCGAC CGATATCTCG GACGAGTCGC AGCGGATGAT CGCCTCGCTG 
CGCATGATCG CGAAGATGCC GACGCTGGCG GCGATGGCCT ACAAGTACAC GATCGGCCAG 
CCCTTCGTGT ATCCGAAGAA CGACCTCGAC TACACCTCGA ACTTCCTGCG GATGTGTTTC 
GCGGTTCCGT GCGAGGAATA CGTCGTCAAC CCGATCTACG CCCGCGCGCT GGACAAGATC 
TTCATCCTGC ACGCCGACCA CGAGCAGAAC GCCTCGACCT CGACGGTGCG TCTGGCCGGC 
TCCTCGGGCG CCAACCCGTT CGCCTGCATC GCCGCCGGCA TCGCCTGCCT GTGGGGGCCG 
GCCCATGGCG GCGCCAACGA GGCGGCGCTC AAGATGCTCA TGGAGATCGG GCATCCCGAG 
AACGTGCAGA AATACGTCGC CAAGGCGAAG GACAAGAACG ATCCCTTCCG CCTGATGGGT 
TTCGGCCACC GGGTCTACAA GAACTACGAC CCGCGTGCGC GCATCATGCA GAAGACGACC 
CACGAGGTTC TGAACGAACT CGGGATCAAG GACGACCTCT TGGAAGTCGC CGTCCAGCTC 
GAGAAGATCG CCCTCGAGGA CGAGTACTTC ATCGAGAAGA AGCTCTACCC GAACATCGAC 
TTCTACTCGG GCATCACCCT CAAGGCGCTC GGCTTCCCGA CCTCGATGTT CACGGTGCTG 
TTCGCGCTCG CCCGCACCGT CGGCTGGATC GCGCAGTGGG CCGAGATGAT CGAGGACCCG 
TCCCAGAAGA TCGGCCGCCC GCGCCAGCTC TATATCGGCC CGGACCGCCG CGACTACACG 
CCGATCGGCC AGCGGAGCTG A

Protein sequence

MPSGPVLFPS QERVRDPMSA SASTIIVGDK NVELPIKTGT IGPDVVDIGK LYAQTGKFTF 
DPGFTSTASC ESKITYIDGD EGVLLYRGYP IEQLAENGDF LETAYLMLFG ELPSSAQKAD 
FDYRVTRHTM VHDQMNRFFQ GFRRDAHPMA VMVACVGALS AFYHDSTDIS DESQRMIASL 
RMIAKMPTLA AMAYKYTIGQ PFVYPKNDLD YTSNFLRMCF AVPCEEYVVN PIYARALDKI 
FILHADHEQN ASTSTVRLAG SSGANPFACI AAGIACLWGP AHGGANEAAL KMLMEIGHPE 
NVQKYVAKAK DKNDPFRLMG FGHRVYKNYD PRARIMQKTT HEVLNELGIK DDLLEVAVQL 
EKIALEDEYF IEKKLYPNID FYSGITLKAL GFPTSMFTVL FALARTVGWI AQWAEMIEDP 
SQKIGRPRQL YIGPDRRDYT PIGQRS