Gene NATL1_05401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_05401
Symbol	hemL
ID	4780455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	488146
End bp	489432
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	43%
IMG OID	640083817
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_001014367
Protein GI	124025251
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.198771
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACACAA AAAGATCTGA AGAGATTTTT GGTGCTGCAA AAAATTTGAT GCCTGGTGGA 
GTCAGTTCAC CTGTAAGGGC TTTCAAATCT GTTGAAGGGG ATCCAATCGT TTTTGATCGC 
GTTAAAGGTC CCTATGCTTG GGATGTTGAT GGGAACAGAT ACATCGACTA TGTAGGCAGT 
TGGGGGCCTG CGATTTGTGG CCATGCTCAC CCTGAGGTAA TAGCAGCTCT TCAAGAAACA 
CTTGAAAAAG GCACGAGCTT CGGAGCACCT TGTGTTCTGG AAAACCAGCT CGCTGAAATG 
GTTATAGATG CCGTACCGAG CGTTGAAATG GTCCGCTTCG TCAATAGTGG TACTGAAGCA 
TGTATGGCTG TTCTCCGTTT AATGAGAGCC TTCACTGGAA GAGATAAAGT TATCAAGTTT 
GAGGGCTGCT ATCACGGACA TGCAGATATG TTTTTAGTGA AAGCTGGCTC AGGAGTAGCA 
ACACTTGGTT TGCCAGACTC ACCAGGTGTA CCAAGAAGTA CAACAGCCAA TACACTTACT 
GCTCCTTATA ACGATCTTGA AGCAGTCAAA GAACTATTTG CTGAAAACCC TGATGCTATT 
TCAGGAGTCA TACTGGAGCC TGTTGTGGGG AATGCAGGCT TCATAACACC TGAGCCAGGA 
TTCTTAGAAG GGTTAAGAGA GGTAACTCAA GAGAACGGTG CTCTTTTGGT TTTTGATGAG 
GTAATGACTG GTTTTCGAAT CAGCTATGGG GGAGCACAAG AGCGTTTTGG AGTTACTCCT 
GATTTGACGA CTATGGGGAA AGTAATTGGT GGTGGCCTTC CAGTAGGTGC TTATGGAGGC 
CGTAAAGAAA TCATGTCAAT GGTCTCACCA TCCGGTCCAA TGTATCAAGC GGGTACTTTG 
AGCGGAAATC CTCTTGCCAT GACAGCAGGT ATTAAAACTC TTGAACTGCT TAAACAAGAA 
GGAACATATG AAAAATTAGA AGCTCTTACA AAAAAGCTTT TGGATGGGAT CCTCACTGCT 
GCTAAAGAAT CAAATATTCC CATTTATGGT CAGAGCATTA GCGCTATGTT CGGTTTTTAC 
TTATGTGAGG GCCCTGTTAG GAACTTTGAG GAAGCCAAAT CTTCTGACAC TGAACTATTC 
AGTAAAATTC ATAGACTGAT GCTTCAGAAG GGTGTTTATC TAGCTCCAAG TGCATTTGAA 
GCTGGTTTTA CATCACTTGC TCATTCTGAA GATGATATAA ATGCGACAAT AAAAGCTTTT 
CAAGAAATCT TCTCTGAAAT CTCATAA

Protein sequence

MNTKRSEEIF GAAKNLMPGG VSSPVRAFKS VEGDPIVFDR VKGPYAWDVD GNRYIDYVGS 
WGPAICGHAH PEVIAALQET LEKGTSFGAP CVLENQLAEM VIDAVPSVEM VRFVNSGTEA 
CMAVLRLMRA FTGRDKVIKF EGCYHGHADM FLVKAGSGVA TLGLPDSPGV PRSTTANTLT 
APYNDLEAVK ELFAENPDAI SGVILEPVVG NAGFITPEPG FLEGLREVTQ ENGALLVFDE 
VMTGFRISYG GAQERFGVTP DLTTMGKVIG GGLPVGAYGG RKEIMSMVSP SGPMYQAGTL 
SGNPLAMTAG IKTLELLKQE GTYEKLEALT KKLLDGILTA AKESNIPIYG QSISAMFGFY 
LCEGPVRNFE EAKSSDTELF SKIHRLMLQK GVYLAPSAFE AGFTSLAHSE DDINATIKAF 
QEIFSEIS