Gene GSU0337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0337
Symbol	hemL
ID	2687321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	366273
End bp	367556
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	57%
IMG OID	637125003
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	NP_951397
Protein GI	39995446
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00652219
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCACAG CTCGCTCGAA GGATCTTTTC ACGCAAGCCC AGGAATTCAT TCCCGGTGGA 
GTAAACAGTC CCGTACGCGC CTTCAAGTCA GTGGGCGCCG ACCCTCTTTT CATTAAAAAA 
GCGTTTGGTT GCACAATTAC TGACGCCGAC AACAACAGTT ATATCGATTA CGTCGGCTCC 
TGGGGCCCCA TGATTCTCGG CCACTGCCAC CCCCAGGTTG TCGAAGCCGT AAAGCGGGCC 
GTCGAAAGTG GCAGCAGCTT TGGCGCCCCC ACGGAGCTGG AAATCACCCT TGCCCGAATG 
GTCATCGACG CGGTGCCCTC AATCGAGATG GTTCGTATGG TCAGCTCCGG AACAGAGGCG 
ACCATGAGTG CCATTCGGCT TGCCCGCGGC TACACCGGCC GGGATAAAAT CATCAAATTC 
TCAGGCTGCT ATCATGGCCA TGCCGACGCA CTCCTGGTGA AGGCTGGCTC AGGGGCTGCC 
ACGTTTGGGG TGCCCGATTC GCCGGGAGTT CCCGTCGATG TGGCAAAAAA CACGCTCACT 
GCTCAGTTCA ACGATCTTGA TTCGGTTTCG AAGCTTATTG ATGAGAACAA GAATGAGATC 
GCGTGCATCA TTGTCGAGCC TATTGCCGGT AATATGGGCA CCGTTCCGCC GGGTGAAGGT 
TTTCTCGAAG GGCTCCGCTC CATCTGCGAC AGCGAGGGAA TTGTCCTCAT TTTCGACGAG 
GTAATGACCG GCTTCCGTGT TGCCTATGGT GGAGCTCAGG AACTTTACGG TGTAACTCCC 
GACATGACCA CCCTCGGCAA GATCATCGGC GGTGGGCTTC CCGTCGGCGC CTTCGGCGGC 
AAAAAGGACA TCATGAAGCT TCTCTCCCCG TCCGGAGGCG TTTATCAGGC GGGCACGCTG 
TCGGGCAACC CCCTCGCCAT GACAGCTGGT ATCGAGACCC TCAAACTGCT TCAGGCAGAC 
GGGTTCTATG AGCAACTGGA GCAAACGAGC CGCCGCCTTG CCGAGGGCAT CACCGAGGCG 
GCCAAATCCG CCGGGTACCC CATCTATCCG ACCCGCGTCG GCAGCATGTT CTGCACCTTT 
TTCACCAGCA ACGAGGTCAA GGACTGGCCC ACGGCCACAA CCTGCGACAC AAAGGCATTC 
GCCGCTTTTT TCAGAATGAT GCTCGAGAAG GGGATCTATC TGGCTCCTTC GCAGTTTGAA 
ACGGCCTTCG TCTCGATCGC CCACACCGAG GTGGAAATCG AGAAGACGAT TGTTGCGGCC 
CGCTCATGCT TTGCCGCTCT CTAA

Protein sequence

MLTARSKDLF TQAQEFIPGG VNSPVRAFKS VGADPLFIKK AFGCTITDAD NNSYIDYVGS 
WGPMILGHCH PQVVEAVKRA VESGSSFGAP TELEITLARM VIDAVPSIEM VRMVSSGTEA 
TMSAIRLARG YTGRDKIIKF SGCYHGHADA LLVKAGSGAA TFGVPDSPGV PVDVAKNTLT 
AQFNDLDSVS KLIDENKNEI ACIIVEPIAG NMGTVPPGEG FLEGLRSICD SEGIVLIFDE 
VMTGFRVAYG GAQELYGVTP DMTTLGKIIG GGLPVGAFGG KKDIMKLLSP SGGVYQAGTL 
SGNPLAMTAG IETLKLLQAD GFYEQLEQTS RRLAEGITEA AKSAGYPIYP TRVGSMFCTF 
FTSNEVKDWP TATTCDTKAF AAFFRMMLEK GIYLAPSQFE TAFVSIAHTE VEIEKTIVAA 
RSCFAAL