Gene Hhal_2111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2111
Symbol
ID	4710041
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2316090
End bp	2317187
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	70%
IMG OID	639856585
Product	histidinol-phosphate aminotransferase
Protein accession	YP_001003677
Protein GI	121998890
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTGAGG TCGAGGCGCG GGTCGCCCGC TGGGTGCGGC CACAGGTGCA GGCCCTGGAG 
GCCTATCAGG TGGCCGAGCC GGGCAAGGCC ATCAAGCTCG ATGCCATGGA GAGCCCATGG 
GCCTGGCCCG GGGCCCTGGA AGAGGCCTGG CTGGAGCGCA TGCGTTCGGT GTCCGTGAAC 
CGCTATCCGG ACCCGGCGGC CCGGCGGCTC AAGCCCCTGC TGCGCGAGGG GTTGGGGGTC 
CCCGAGGGGG CAGAGCTGTT GCTCGGCAAC GGCTCCGATG AGCTCATCCA GCTCATCGAT 
CTGGCCGTGG CTGGCAGTGG GCGCACGGTG ATGGCCCCGG GGCCGAGTTT TGCCATGTAC 
CGGATCATCG CCGAGTATAC CGGCGCCGAA TACGTCGAGG TGCCGCTCGA TGCGGAGTTC 
GGGCTGGATC TCGCCGCCAC CCGGGAGGCG GTGTCGGCGT ACAACCCGGC GGTCACCTAC 
CTGGCGCACC CGAACAACCC CACCGGCAAT GGCCTCGATC TGGACGCCGT GGCGGAGCTG 
GTGGCGCAGA GCGACGGCCT GGTGGTAGTC GATGAGGCCT ACGCCCCCTA CGCCGACAGC 
AGCTTCCTGC CGCGGGTGCT GGAGTTCCCC AACTGCCTGG TGCTGCGCAC GCTCTCTAAG 
GTCGGTCTGG CGGGCCTGCG GGTCGGGGTG CTGATCGGCC ATCCGGCCTG GATCGACCAG 
CTGGAGAAGT GTCGCCTGCC CTACAACCTG GGCAGCCTGG CCCAGGCCAG TGCGGCATTC 
GCCGTCGAGC ACCAGGAGGC CCTGGATCGC TGTGTGGCCC ACGTGCTCGG CGAACGGGCG 
CGGCTGGTCG AGGAGCTGCC GGCGGTCCCC GGTGTCGAGC AGGTCTGGCC GACGCAGACC 
AACTTCCTCA CCTTCCGGGT GCCGCAGGGC AGTGCCGATG CCGTGCACCG TGGTCTGCTC 
GATCGAGGGG TCCTGATCAA GCGCCTGCAC GGCAGCCATC CGCGGCTGGA GGACTGCCTG 
CGGGTGACGG TCGGTCGCCC CGAGGAGAAC AACCGCTTCC TCGAGGCGCT GGCCGAGACC 
CTCGCCGTGG CGGCCTGA

Protein sequence

MTEVEARVAR WVRPQVQALE AYQVAEPGKA IKLDAMESPW AWPGALEEAW LERMRSVSVN 
RYPDPAARRL KPLLREGLGV PEGAELLLGN GSDELIQLID LAVAGSGRTV MAPGPSFAMY 
RIIAEYTGAE YVEVPLDAEF GLDLAATREA VSAYNPAVTY LAHPNNPTGN GLDLDAVAEL 
VAQSDGLVVV DEAYAPYADS SFLPRVLEFP NCLVLRTLSK VGLAGLRVGV LIGHPAWIDQ 
LEKCRLPYNL GSLAQASAAF AVEHQEALDR CVAHVLGERA RLVEELPAVP GVEQVWPTQT 
NFLTFRVPQG SADAVHRGLL DRGVLIKRLH GSHPRLEDCL RVTVGRPEEN NRFLEALAET 
LAVAA