Gene GM21_1887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1887
Symbol
ID	8137221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2192964
End bp	2194259
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	62%
IMG OID	644869501
Product	adenylosuccinate lyase
Protein accession	YP_003021698
Protein GI	253700509
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0015] Adenylosuccinate lyase
TIGRFAM ID	[TIGR00928] adenylosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATAGAAC GTTACAGCCG TCCTGAAATG GCCCGTATCT GGGAACCCGA AAACCGCTAC 
CGCAAGTGGC TCGAAATAGA AATATACGCC TGCGAGGCGC ACGCAGAGAT GGGGCGCATA 
CCCAAGGACG CAGTGGCCCG CATCAAGGCG AAAGCCAACT TCGACGTCCC CCGCATCGAC 
GAGATCGAGC GCACCGTCAA GCACGACGTC ATCGCCTTCC TCACCTCCGT CGCCGACTAC 
ATCGGCGACG ACTCCCGTTT CGTCCACCTG GGCCTTACCT CCTCCGATGT CCTCGACACC 
TCCTTCGCCA TGCTCCTCAA GGAAGCGGGG GAGCTGATCG TAGCCGACAT CAAGCGCCTG 
ATGGCCGTCA TCAAGACCCG CGCCTACGAG CACAAGATGA CGCCGCAGAT GGGGCGCTCG 
CACGGCATTC ACGCCGAGCC GGTCACCTTC GGCCTGAAGA TGGCGCTTTG GTACGACGAG 
ATGGCCAGGA ACCTGAAGCG GATGGAAGCG GCCCTGGAGA CCATCGCCTA CGGCAAGCTC 
TCCGGCGCGG TCGGTACCTT CGCCAACATC GACCCGCAGG TCGAGGCTTT CGTCTGCAAG 
AAGGCGGGGT TGAAACCCGC CCCCTGCTCC ACGCAGGTGC TGCAGCGCGA CCGCCACGCC 
GAATACTTCA CCACCCTGGC GATCATCGCC TCCTCCATCG AGAAGTTCGC CGTCGAGATC 
AGGCACCTGC AGCGCACCGA GGTCCTCGAG GCCGAGGAGT TCTTCAGCAA GGGGCAGAAA 
GGCTCCTCCG CGATGCCGCA CAAGCGCAAC CCGGTCCTCT CCGAGAACCT GACCGGCCTG 
GCCCGCCTGA TCCGAGGCTA TGCGGTCTCC GCCATGGAGA ACGTGCCGCT GTGGCACGAG 
CGTGACATCT CGCACTCCTC CGTGGAGCGC ATCATCGGTC CGGACGCAAC CGTGATGCTC 
GACTTCATGC TGAACCGCGC CATCGGGCTG ATCGAGAACC TGGTGGTCTA CCCCGAGAAC 
ATGATGCGCA ACCTGAACCA GATGCGCGGT CTCATCTTCT CGCAGCGCGT GCTCCTGAAA 
CTCGCCGAGG CGGGTGCTTC CCGTGAGAAG GCCTACTCGC TGGTACAAAG AAACGCCATG 
AAGGTCTGGG AAGAGGGGAA AGACTTCCAG ACCGAGCTTC TGAACGACGC CGAAGTCGCC 
GGCTTCCTCC CCGCCGAGGA GATCAAGGAA GCGTTCGATC TCGGTTACCA TCTGAAACAC 
GTCGACACTA TTTTCACGAG GGTCTTCGGT GGATAG

Protein sequence

MIERYSRPEM ARIWEPENRY RKWLEIEIYA CEAHAEMGRI PKDAVARIKA KANFDVPRID 
EIERTVKHDV IAFLTSVADY IGDDSRFVHL GLTSSDVLDT SFAMLLKEAG ELIVADIKRL 
MAVIKTRAYE HKMTPQMGRS HGIHAEPVTF GLKMALWYDE MARNLKRMEA ALETIAYGKL 
SGAVGTFANI DPQVEAFVCK KAGLKPAPCS TQVLQRDRHA EYFTTLAIIA SSIEKFAVEI 
RHLQRTEVLE AEEFFSKGQK GSSAMPHKRN PVLSENLTGL ARLIRGYAVS AMENVPLWHE 
RDISHSSVER IIGPDATVML DFMLNRAIGL IENLVVYPEN MMRNLNQMRG LIFSQRVLLK 
LAEAGASREK AYSLVQRNAM KVWEEGKDFQ TELLNDAEVA GFLPAEEIKE AFDLGYHLKH 
VDTIFTRVFG G