Gene GM21_2654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2654
Symbol
ID	8137996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3090999
End bp	3092339
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	61%
IMG OID	644870258
Product	acetyl-CoA carboxylase, biotin carboxylase
Protein accession	YP_003022448
Protein GI	253701259
COG category	[I] Lipid transport and metabolism
COG ID	[COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID	[TIGR00514] acetyl-CoA carboxylase, biotin carboxylase subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.00000129379
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTTCATA AAATTCTTAT CGCCAACAGG GGTGAGATCG CCCTCAGGAT CATCAGAACC 
TGCAAGGAGA TGGGGATCAA GACGGTCGCC GTGTACTCCA CGGCCGACAG CGAGTCGCTC 
CATGTGAAGC TCGCCGACGA GAGCGTCTGC ATCGGCCCGG CCCCCAGCCT CTCCAGCTAC 
CTCAACATCA ACGCCATCAT CTCCGCGGCG GAACTGACCG ACGCGGAGGC GATCCACCCG 
GGGTACGGGT TCCTCTCCGA AAACCCGGTC TTCGCCGAGA TCTGCGAGAA GTGCGGCATC 
ACCTTCATCG GACCTTCCGC CGAGAGCATG CGCATCATGG GCGACAAGAT CTCCGCCCGT 
CAGGCGGTCA TCAAGGTCGG CGTCCCCATC CTTCCCGGCA CCAAGGAAGG GGTGCACGAC 
GTAGCCGAGG CGATCAAGGT GGCCAAGGAG ATCGGCTTCC CGGTCATCAT CAAGGCAACG 
GCTGGGGGCG GCGGACGCGG CATGAAGATC GTCCATTCCC CGGCGGCGCT TCCGAACGCC 
TTCGCCACCG CGCGTGCCGA GGCGCAGTCC GGTTTCGGCA ATCCTGAGGT CTACATAGAG 
CGCTACTGCG AGAGTCCGCG CCACGTCGAG ATCCAGATCC TCGCCGACAA GCACGGCAAC 
GTGGTGCACC TGGGCGAGCG CGACTGCTCG ATCCAACGCC GTCACCAAAA GGTGATCGAG 
GAGGCTCCCT CCACCGTCAC CACTCCGGAG CTGAGGAAAG CGATGGGCGA GGCTGCGGTC 
GCCGCGGCCA AGGCCGTAAA CTACTGCAGC GTCGGCACCA TGGAATTCCT CGTCGACAAG 
AACAACAACT TCTTCTTCAT GGAGATGAAC ACCCGCGTGC AGGTGGAGCA CCCGGTGACC 
GAGATGGTGA CCGGCGTCGA CGTCGTGAAG GAGCAGATCC GCTCCGCATA CGGCCTCAAA 
CTGCGCTACA CCCAGGACGA CATCAAGATC AAGGGACACT CCATCGAGTG CCGCATCAAC 
GCGGAAGACT CGGTGAAGTT CACCCCTTGC CCGGGAAAGA TCACCGACCA CCACACACCC 
GGCGGCTTAG GGGTCAGGGT CGATTCCTTC GTCTACACCA ACTACTCGGT CCTGCCGCAC 
TACGACTCCC TGATCGCCAA GCTGATCGTG CATGCCGACA CCAGGGAAGA GGCGATCAAG 
AGGATGGCTC GCGCGCTGGA CGAGTACATC GTGGAAGGGA TCAAGACCAC CATCCCGTTC 
CACAAGAGAA TCATGGCCAA CAAAGACTTC ATCGAAGGGA ACATAGACAC CGGCTTCATC 
GAAAGGCTGG TACTGGAGTA A

Protein sequence

MFHKILIANR GEIALRIIRT CKEMGIKTVA VYSTADSESL HVKLADESVC IGPAPSLSSY 
LNINAIISAA ELTDAEAIHP GYGFLSENPV FAEICEKCGI TFIGPSAESM RIMGDKISAR 
QAVIKVGVPI LPGTKEGVHD VAEAIKVAKE IGFPVIIKAT AGGGGRGMKI VHSPAALPNA 
FATARAEAQS GFGNPEVYIE RYCESPRHVE IQILADKHGN VVHLGERDCS IQRRHQKVIE 
EAPSTVTTPE LRKAMGEAAV AAAKAVNYCS VGTMEFLVDK NNNFFFMEMN TRVQVEHPVT 
EMVTGVDVVK EQIRSAYGLK LRYTQDDIKI KGHSIECRIN AEDSVKFTPC PGKITDHHTP 
GGLGVRVDSF VYTNYSVLPH YDSLIAKLIV HADTREEAIK RMARALDEYI VEGIKTTIPF 
HKRIMANKDF IEGNIDTGFI ERLVLE