Gene GM21_0751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0751
Symbol
ID	8136066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	896675
End bp	897745
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	63%
IMG OID	644868368
Product	aminotransferase class V
Protein accession	YP_003020583
Protein GI	253699394
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0075] Serine-pyruvate aminotransferase/archaeal aspartate aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.000622725
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACAAGA AGCTGTTCAT CCCGGGACCG ATCGAGGTCA GCCCGGAGAT ACTCAAGGCC 
ATGGGTACGC CGATGATCGG ACACCGCATG CCCGAGTACG CGCAACTGCA CAAGGGCGTG 
ACGGACAAGC TGAAGCGGTT GATGTTCACC AAGGAGCGGG TTTTCCTCTC CACCTCCAGC 
GCCTTCGGCG CCATGGAGGG TGCGGTCAGA AACCTCGTGG GCAAGCGCTG CGCCAACTTC 
TGCAACGGCG CCTTCTCCGA CAAGTGGCAC AACGTCACGC TGGCCTGCGG CAAGGAAGCC 
GACCCCTTCA AGGTCGCCTG GGGCGAGCCC ATCACCCCTG AACTGGTCGA TTCGGCGCTT 
GCCACCGGCA AGTACGACGC CATCACCCTG ATCCACAACG AGACCTCGAC CGGGGTCATG 
TCCCCGCTTC CCGAGATCGC CCAGGTGCTC AAGAAGTACC CGGAGGTGGT CTCCATCATC 
GACACCGTCT CCTCCATGAG CGCCCTGAGG CTCCCCGTGG ACGAACTGGG GATCGACTGC 
TGCGTCTTCG GCGTGCAGAA GGCGTTCGCC CTCCCGCCGG GGCTCGCCGT CTTCACCGCC 
AGCGAGAAGG CCTTGGAACG CGCCAAGGGG GTCCCCGGAC GCGGCTACTA CTTCGACTTC 
CTCGAGTTCC TGGCGGCGGA CGAAAAGAAC AACACCCCGT CCACCCCTTG CATCTCGCTC 
ATCTACGCGA TGGACCTGCA GTTGGAGCGT ATCTTCGCGG AGGGGCTGGA GAAGAGATGG 
GAGCGGCACG CGAGGATGGC CGAGTTCATG CGCGCCTGGG TTAAGGAGCA CGGCTTCGGC 
CTCTTCCCGT CGGAAGGGTA CCGCTCGGTC ACCCTTACCT GCGCCTCCAA CGACCGCGGC 
GTCGACCTGG GCCTTATGAA GAAGCAGTTG GGCGAACGTG GCTTCGCCTT CGACGACGGC 
TACGGCAAAA TCAAGGGGAA AACCTTCCGG GTGGCCCACA TGGGGGACAT GCAGCTGGAA 
AACCTCAAGG AAATCACAAC CGAGATGGAG GGGATCCTGC AGGGTCTCTA G

Protein sequence

MHKKLFIPGP IEVSPEILKA MGTPMIGHRM PEYAQLHKGV TDKLKRLMFT KERVFLSTSS 
AFGAMEGAVR NLVGKRCANF CNGAFSDKWH NVTLACGKEA DPFKVAWGEP ITPELVDSAL 
ATGKYDAITL IHNETSTGVM SPLPEIAQVL KKYPEVVSII DTVSSMSALR LPVDELGIDC 
CVFGVQKAFA LPPGLAVFTA SEKALERAKG VPGRGYYFDF LEFLAADEKN NTPSTPCISL 
IYAMDLQLER IFAEGLEKRW ERHARMAEFM RAWVKEHGFG LFPSEGYRSV TLTCASNDRG 
VDLGLMKKQL GERGFAFDDG YGKIKGKTFR VAHMGDMQLE NLKEITTEME GILQGL