Gene Haur_3301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3301
Symbol
ID	5735171
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4166904
End bp	4168037
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	55%
IMG OID	641280448
Product	pyruvate carboxyltransferase
Protein accession	YP_001546065
Protein GI	159899818
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02146] homocitrate synthase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0533542
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACGGC ATTTTGCAAT TGTTGATACG ACATTACGCG AAGGCGAACA ATGGGCCAAT 
GCTCATTTCA GCAGTGAAGA TCGCCTCGCC ATCGCCAATT TGCTGGTTCA GTTTGGCGTT 
GAATACATCG AAATGACCTC TCCCTGCGCC TCGCCGCAAA GTACGGCAGA TTTGCGCAGC 
ATCGCAGCCT TGCCGCTCGG CAACACCAAG CTGCTGACCC ACACCCGTTG TAACCTTGAT 
GACGTGCGGC TCGCTGCTGA ATGTGGCGTG GCTGGCGTAA ATATCCTCTT TGGCACATCA 
CCCTATCTGC GCCAATGGAG CCATGGTCGC TCAATTGAAG CGATTTTGGA AGAAGTTGGC 
CCAGTTGTGC GTTTCCTCCA AGAACGAAAT ATCGAAGTTC GGTTCTCCTG CGAAGATTCA 
TTCCGCACCC CACTGCCCGA TTTATTGCGC GTCTACCAAG CTGTCGATTT GCTTGGCGTG 
CAGCGGGTTG GCATCGCCGA TACGGTGGGC ATTGCCACGC CACGCGATGT TGAACGTGTG 
GTTGGTGCAG TCCGCAATGC AGTTCGCTGC GACATTGAAT TTCATGGCCA CAACGATGGC 
GGCTGTGCAA TTGCCAATGC CTATGCAGCG CTCGAAGCAG GCGCAACCCA CATCGATACG 
ACCATTCTTG GCATTGGCGA ACGCAACGGC ATCGCCGCGC TCAGCGGCTT AATTGCCCGC 
CTCTACCTCT CCGAACCTGA AAGTGTTGCA GGCTATGCCT TGCCAATGTT GGCCCAACTT 
GATCACACAG TTGCGGCAAT CTTGGGCATT CAAGTGCCAT TCAATGCCTG TATCACCAGC 
GAAACCGCCT TTGCTCACAA GGCTGGCCTG CATACCAAGG CTGTTTTGGC CAATCCCAGC 
ACCTATGAAG CGATCGATCC CAAGGCTTTT GGGCGCGAAC GCAATGTGCT GATTGGTCAT 
CGCCTGACTG GTCGCCATGC CTTGCAAAGC CGCGCCAACA CCCTAGGTTT GGATCTGAGC 
GACACCACGA TTATCGCGAT TGCAGCCCAA CTCAAAGCTG CTGCCGATGA TCAGCCGTTG 
ACGCTCGATG AGGTGGATGC GCTGCTGCGC TCAAGCACCC TCCAAGCAGC CTAA

Protein sequence

MTRHFAIVDT TLREGEQWAN AHFSSEDRLA IANLLVQFGV EYIEMTSPCA SPQSTADLRS 
IAALPLGNTK LLTHTRCNLD DVRLAAECGV AGVNILFGTS PYLRQWSHGR SIEAILEEVG 
PVVRFLQERN IEVRFSCEDS FRTPLPDLLR VYQAVDLLGV QRVGIADTVG IATPRDVERV 
VGAVRNAVRC DIEFHGHNDG GCAIANAYAA LEAGATHIDT TILGIGERNG IAALSGLIAR 
LYLSEPESVA GYALPMLAQL DHTVAAILGI QVPFNACITS ETAFAHKAGL HTKAVLANPS 
TYEAIDPKAF GRERNVLIGH RLTGRHALQS RANTLGLDLS DTTIIAIAAQ LKAAADDQPL 
TLDEVDALLR SSTLQAA