Gene HS_1229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1229
Symbol	hemL
ID	4240740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1395605
End bp	1396903
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	40%
IMG OID	638104802
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_719441
Protein GI	113461372
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00808664
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACTT CAGCGACATT ATTCTCTCGT GCACAACAAG TTATTCCAGG CGGAGTAAAC 
TCTCCAGTTA GAGCATTTAA AGGTGTGGGC GGAACGCCAG TGTTCATAGA AAAAGCCAAC 
GGTGCGTATA TTTTCGATAC AGAAGGAAAA CAATATATTG ACTACGTAGG TTCTTGGGGA 
CCAATGATTT TAGGTCATAA CCACCCATCA ATCTTAAGTG CGGTACTAAA AACAGCAGAA 
AATGGGCTAA GTTTTGGAAC ACCTACACCG CTTGAAATTG AACTTGCGGA ACTGATTTGT 
CAATTAGTCC CATCAATTGA AATGGTGAGA ATGGTCAATT CGGGAACAGA GGCAACTATG 
TCAGCTATTC GTTTGGCTAG AGGCTATACT AAAAGAGATA AAATTTTAAA ATTTGAAGGC 
TGTTATCATG GTCACTCGGA TAGTTTGCTT GTCAAAGCCG GCTCCGGATC TTTGACTTTG 
GGACAACCAA GCTCTCCTGG TGTTCCGGAA GACTTTGCTA AACATACCAT CACTTGCGAA 
TATAATAATC TTCAATCTGT CAAAAATGCT TTTGAACAAT ATCCTGATCA GATCGCCTGC 
GTTATCGTTG AGCCTGTTGC AGGTAACATG AACTGCATCC TTCCGAAACA GGATTTTTTA 
CAAGGCTTGC GTCAACTTTG CAATGAATAT GGTTCTCTAT TTATTATTGA TGAGGTCATG 
ACAGGATTTC GTGTAGCCTT AGGCGGTGCA CAATCTTACT ATGAAGTGAC ACCTGATCTA 
ACAACATTAG GAAAAGTCAT TGGAGGAGGT ATGCCCGTTG GTGCTTTCGG AGGCAAAAAA 
GAAATTATGC AATATATTGC ACCTACAGGT CCCGTATATC AAGCAGGAAC ATTATCAGGA 
AATCCAATTG CTATGTCTGC CGGAATCGCA TGCTTAAATG AATTGAAAAA AGAAGGTAAC 
GAACAACGTT TAGCAATGCT CACAAAAAAA TTGGCATTAG GTTTAAAAAA CTTAGCAAAT 
CAACACAATA TCCCGCTTGT AGTCAATTAT GTAGGCGGAA TGTTTGGCAT CTTCTTTACC 
ACACAAAATG AAGTTACCTC TTACCAACAA GCAATTCAAT GTGATGTTGA AAAGTTTAAT 
CTATTTTTCC ACAAAATGTT AGAACAAGGT GTTTATCTTG CACCATCTGC ATTTGAAGCA 
GGTTTCATGT CATTAGCACA CACTGACGCA GATATTGACC GCACTTTACA AGCGGCGGAT 
ATTGCTTTTG CCAGTTTATG CTCATCATCA TTTTCCTAA

Protein sequence

MTTSATLFSR AQQVIPGGVN SPVRAFKGVG GTPVFIEKAN GAYIFDTEGK QYIDYVGSWG 
PMILGHNHPS ILSAVLKTAE NGLSFGTPTP LEIELAELIC QLVPSIEMVR MVNSGTEATM 
SAIRLARGYT KRDKILKFEG CYHGHSDSLL VKAGSGSLTL GQPSSPGVPE DFAKHTITCE 
YNNLQSVKNA FEQYPDQIAC VIVEPVAGNM NCILPKQDFL QGLRQLCNEY GSLFIIDEVM 
TGFRVALGGA QSYYEVTPDL TTLGKVIGGG MPVGAFGGKK EIMQYIAPTG PVYQAGTLSG 
NPIAMSAGIA CLNELKKEGN EQRLAMLTKK LALGLKNLAN QHNIPLVVNY VGGMFGIFFT 
TQNEVTSYQQ AIQCDVEKFN LFFHKMLEQG VYLAPSAFEA GFMSLAHTDA DIDRTLQAAD 
IAFASLCSSS FS