Gene Haur_4144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4144
Symbol
ID	5736005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5291529
End bp	5292539
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	53%
IMG OID	641281298
Product	N-acetyl-gamma-glutamyl-phosphate reductase
Protein accession	YP_001546904
Protein GI	159900657
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0002] Acetylglutamate semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01850] N-acetyl-gamma-glutamyl-phosphate reductase, common form

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.606943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGTG TTGGTATTTT TGGCGTAACT GGCTATGCTG GATACGAACT AGCTCGCTGG 
TTGCAGCGCC ACCCAAGCGC CAGCGTGGTT TGGGCTGTTT CCGAATCGTC GGCGGGCAAA 
CGCTTGGCGC AGGTTGTGCC TGGCCCACTT GACATGCCGT TGTTGGCTGC GAATCAGGTT 
GATTGGCAGG CGGTTGATCT GATTTTCACG GGGTTGCCGC ATGGTGTCGC TGCCCAAACG 
GTGGCAGAGG CCCGCAAGCA TGGTGTCAAA GCCATCGACC TCTCCGCCGA CCTTCGCCTG 
GACAGCCCCG CCGCTTACAC CCGCTGGTAC GACCACACGC ATCCCCACCC TGAACTTTTG 
AATGCTCCCT ATGGCTTACC TGAACTGAAT CGCGCTGTAT TGGTTGATGT GCCAGCGATC 
GCCAACCCAG GTTGCTATCC CACTAGTGTT TTGCTTGGTT TAGCACCTTT GCTGGAACAA 
GGCTGGTGGC AAACTGGCCA AACCATCATC ATTAATGCTG CTTCGGGAGT TTCGGGCGCT 
GGCCGTGCAC CCAAACAGCA CTTACATTTT GTCGAGGCTC ACGAAAATTA TAGCCCTTAC 
AACATTGGCC ATACCCATCG CCATGTTGGC GAAATTGAGC AAGAACTGAG CAAGTTGGCA 
AACGCACCAG TTAATACGAT TTTTGCACCA CACCTCTTGC CGACCCAACG CGGTATTTTA 
AGCACAATCT ATGTGCCAAT TCAGCCAGAG CTGGATTTGG CCAGCATTCA TGCGCTTTAT 
CGCCAACGTT ATGCCGCTGA ACCATTCGTC AATGTGCTCG ATCAAGGTCA GTTGGCAAGT 
TTGGCGCATG TTGTGCATAC CAACGATTGT GCAATTGGCT TGACGCTCGC TCAGCCTGGC 
ATGTTGATCG TCACAGCGGC GATTGATAAT TTGCTCAAGG GTGCTTCGGG TCAAGCAATT 
CAAAATATGA ATATTATGTT TGGTTTGCCT GAAACCACGG GCTTGCGCTA G

Protein sequence

MIRVGIFGVT GYAGYELARW LQRHPSASVV WAVSESSAGK RLAQVVPGPL DMPLLAANQV 
DWQAVDLIFT GLPHGVAAQT VAEARKHGVK AIDLSADLRL DSPAAYTRWY DHTHPHPELL 
NAPYGLPELN RAVLVDVPAI ANPGCYPTSV LLGLAPLLEQ GWWQTGQTII INAASGVSGA 
GRAPKQHLHF VEAHENYSPY NIGHTHRHVG EIEQELSKLA NAPVNTIFAP HLLPTQRGIL 
STIYVPIQPE LDLASIHALY RQRYAAEPFV NVLDQGQLAS LAHVVHTNDC AIGLTLAQPG 
MLIVTAAIDN LLKGASGQAI QNMNIMFGLP ETTGLR