Gene GM21_2199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2199
Symbol
ID	8137535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2569681
End bp	2571327
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	63%
IMG OID	644869814
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_003022009
Protein GI	253700820
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.0000113642
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGATT TGCTGATCCC CCGCACCGCG TCCGCCTACG ACTACCCTTT GCTGATAAAG 
AACCTGTTGC TGTACCCGGT GGTCGACAAC CCCGACCAGG AGATCGTCTA CCGCGACCTG 
TACCGGGGCA ACTACCGCCA ACTGAGGGAG CGGGTGAAGC GGTTGGCCAA CATGCTCACC 
GGGCTTGGCG TGAAGCCGGG GCAAACGGTG GCCGTTATGG ACTGGGACAG CCATCGCTAC 
CTGGAGCTCT TCTTCGCGGT GCCGATGATC GGCGCGGTGC TCCACACCAT CAACGTGCGC 
CTCTCCGCGG AGCAGATCCT CTACACCATC GACCATGCCG AGGACGACGT GCTGCTGGTC 
AACAGCGAGT TTCTCCCCAT CATGGAGCAG ATCCGCGGCA GGATCGACAA CGTCCGCACC 
TATATCCTCA TCTCCGACGA CGGCATGACG GAATGCAGCA CCATCCCCGC CTGCGGCGAG 
TACGAACAGC TCCTGGCCCA GGCCTCGCCG GAGTTCGAAT TCCCCGATCT GGACGAGAAC 
ACCAGGGCCA CGACCTTCTA CACCACCGGG ACCACGGGGA TGCCGAAGGG GGTCTATTTC 
AGCCACCGGC AACTGGTGCT CCATTCCCTG GGGCTTTTGG CGACGCTCGG TTCCTCCACC 
TCGCACGCCT GCCTGCACCG CGATGACGTC TACATGCCGA TAACGCCAAT GTTCCACGTC 
CATGCCTGGG GGGTCCCCTA TATCGCCACG ATGCTGGGGG TGAAGCAGGT CTATCCCGGT 
CGCTACCTCC CGGAGACCCT GCTGGAGCTC AAAGAGAAGG AAGGAGTCAC CTTCTCCCAT 
TGCGTTCCGA CCATCTTGCA TATGCTCTTG AAGCACCCCC ACGCGGAAAA GATCGACCTG 
CGGGGCTGGA AGCTCATCAT CGGCGGCGCG GCCTTGTCGC GCAACCTCTG CGTCGAGTCC 
CTGAAGCTTG GGATCGACGT CTTCACCGGG TACGGGATGT CCGAGACCTG CCCGATCCTC 
ACCATTTCCA AGCTCACCCC GGAGATGCTG GAGCTCTCCC ACGCGGAGCA GGCGGAGATC 
CGCTGCAAGA CTGGCCTTGC TCTGGCGTTC GTCGATCTGC GCGTGGTCGA CAGCGACTTC 
AACGAGCTCC CCCGCGACGG CGTCAGCGCC GGCAACGTGG TGGTCCGCTC CCCCTGGCTC 
ACCCAGGGAT ACCTGAAGGA CCACAAGGCC TCCGAGCGTC TCTGGGAGGG AGGGTATCTC 
CATACCGGCG ACGTGGCGGT GCGGGACGAA CTGGGCTATC TGAAGATCAC CGACCGGAGC 
AAGGACGTGA TCAAGGTCGC CGGCGAATGG GTTTCCTCGC TGGAGCTTGA GGACATCGTC 
GCGCACCACC CCGCGGTAGC CGAGGTGGCG GTGATAGGGA AGCCCGACGA GAAGTGGGGC 
GAGCGCCCCC TGGCGCTGGT CGTTCTCAAG CCGACGGAGG GGACGAAGGT AACCGATAAG 
GAGATCGCCC ACCACGTGAG GGAGTACGCA GACAAGGGTG TGGTGAGCAA GCAGGTCGTT 
CTGGTCAAGG TGAAGCTCGT TCCCTCCATC GACAAGACCA GCGTGGGGAA GATCAACAAG 
GTGGCGCTGC GGGAGAAATA TCTCTAA

Protein sequence

MSDLLIPRTA SAYDYPLLIK NLLLYPVVDN PDQEIVYRDL YRGNYRQLRE RVKRLANMLT 
GLGVKPGQTV AVMDWDSHRY LELFFAVPMI GAVLHTINVR LSAEQILYTI DHAEDDVLLV 
NSEFLPIMEQ IRGRIDNVRT YILISDDGMT ECSTIPACGE YEQLLAQASP EFEFPDLDEN 
TRATTFYTTG TTGMPKGVYF SHRQLVLHSL GLLATLGSST SHACLHRDDV YMPITPMFHV 
HAWGVPYIAT MLGVKQVYPG RYLPETLLEL KEKEGVTFSH CVPTILHMLL KHPHAEKIDL 
RGWKLIIGGA ALSRNLCVES LKLGIDVFTG YGMSETCPIL TISKLTPEML ELSHAEQAEI 
RCKTGLALAF VDLRVVDSDF NELPRDGVSA GNVVVRSPWL TQGYLKDHKA SERLWEGGYL 
HTGDVAVRDE LGYLKITDRS KDVIKVAGEW VSSLELEDIV AHHPAVAEVA VIGKPDEKWG 
ERPLALVVLK PTEGTKVTDK EIAHHVREYA DKGVVSKQVV LVKVKLVPSI DKTSVGKINK 
VALREKYL