Gene GM21_4011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4011
Symbol
ID	8139385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4596134
End bp	4597417
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	64%
IMG OID	644871627
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_003023785
Protein GI	253702596
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	4.49886e-31
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCAAAACA GCCGCTCGAC CAAACTCTTT CAGCAGGCGC TTCAGTCCAT CCCCGGCGGC 
GTCAACAGCC CGGTGCGCGC CTTCAGGTCC GTTGGCTCCG ATCCGCTCTT CATCAAAAAG 
GCGTTAGGCC CCCGCATCTA TGATGAAGAT GGCAACACCT TCATCGACTA CGTCGGCTCC 
TGGGGTCCGA TGATCCTTGG GCACTGCCAC CCGCAGGTCG TGGCCGCCAT CAAGGCCGCC 
GTCGACAACG GCGCCAGCTT CGGCGCGCCC ACCGAGCTAG AGATCACGCT GGCCGAGATG 
GTGATCGATG CGGTCCCCTC CATCGAGATG GTGCGCATGG TGAGTTCCGG TACCGAGGCG 
ACCATGAGCG CCATCAGGCT CGCCCGCGGC TACACCGGCC GCGACAACAT CCTGAAGTTC 
TCCGGTTGCT ACCACGGCCA CTCCGACGCG CTTTTGGTCA AAGCCGGATC CGGCGCCGCC 
ACCTTCGGCG TCCCCGACTC CCCCGGCGTC CCCGCCGACC TCGCCAAGCA CACGCTGACC 
GCGACCTACA ACGACCTCGA CTCGGTCCGG GCGCTGGTGG CGGCCAACAA GGGGAGCATC 
GCCTGCATCA TCGTGGAGCC TGTGGCTGGC AACATGGGAA CAGTCCCCCC CAAGGAAGGA 
TTCCTGGAAG GGCTTAGGAG CATCTGCAGC GAGGAAGGGA TCGTGCTGAT CTTCGACGAG 
GTGATGTCCG GCTTCAGGGT TGCCTACGGC GGCGTTCAGG AACTCTACGG CGTGACCCCC 
GACATGACCA CGCTGGGCAA GATCATCGGC GGCGGTCTGC CGGTGGGGGC GTTCGGCGGG 
AAAAAAGAAA TCATGTCCCT TCTTTCACCG GCGGGGGGAG TGTATCAGGC CGGGACCCTC 
TCTGGCAACC CCCTGGCCAT GACCGCCGGG ATCGAGACCT TGAAGCTCCT CAAGGAGCCT 
GGGTTCTATC AGAAGCTGGA AGAAAAGAGC GCCTTCGTGG CGGAGGGGAT CGCAAAGGCC 
GCCAGGGACG CCGGTTTCCC GATCTACTCC ACGCGGGTAG GCTCCATGTT CTGCGCCTTT 
TTCTCCAAGG ATCCCGTCTA CGACTGGGAC AGCGCCGCCA AGTGCGACAC CAAGGCCTTC 
GCCGCCTACT TCAAGGCGAT GCTGAACGAA GGGATCTACC TGGCGCCTTC GCAGTTCGAG 
ACCGCGTTCG TCGGCATCTC CCACAGCACG GAGGACCTGG AGCAGACCAT CGCGGCGGCC 
GCCAAGTGCT TTAAGGCGCT GTAG

Protein sequence

MQNSRSTKLF QQALQSIPGG VNSPVRAFRS VGSDPLFIKK ALGPRIYDED GNTFIDYVGS 
WGPMILGHCH PQVVAAIKAA VDNGASFGAP TELEITLAEM VIDAVPSIEM VRMVSSGTEA 
TMSAIRLARG YTGRDNILKF SGCYHGHSDA LLVKAGSGAA TFGVPDSPGV PADLAKHTLT 
ATYNDLDSVR ALVAANKGSI ACIIVEPVAG NMGTVPPKEG FLEGLRSICS EEGIVLIFDE 
VMSGFRVAYG GVQELYGVTP DMTTLGKIIG GGLPVGAFGG KKEIMSLLSP AGGVYQAGTL 
SGNPLAMTAG IETLKLLKEP GFYQKLEEKS AFVAEGIAKA ARDAGFPIYS TRVGSMFCAF 
FSKDPVYDWD SAAKCDTKAF AAYFKAMLNE GIYLAPSQFE TAFVGISHST EDLEQTIAAA 
AKCFKAL