Gene Haur_1084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1084
Symbol
ID	5732873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1240956
End bp	1242530
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	53%
IMG OID	641278222
Product	D-3-phosphoglycerate dehydrogenase
Protein accession	YP_001543860
Protein GI	159897613
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID	[TIGR01327] D-3-phosphoglycerate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00214537
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCGTA TCCTGGTCAC GGAGAAGATT GGTGCCGAAG GCCTTGCGGC GCTTAAAGAG 
GTCGCCGAGG TTGATGTTCG TCTTGATCTT ACACCAGAAA CCCTGTTGGA GGCTTTGCCA 
CAGTACGATG CCTTGATCGT GCGTTCGCAA ACCAAAGTTA CCGCTAAAGT GCTTGCCGCA 
GGCACCAAAC TTCGAGTTGT TGGCCGCGCC GGGACGGGTG TTGACAACAT CGATTTGGCC 
GCCGCCAATC AGCAAGGAAT TTTGGTGGTC AATGCTCCAG CATCAAACAG TATTGCAGTC 
GCTGAACTGA CGATTGGTTT GATGATTGGT CTTGCTCGTA ACATTCCCCA AGCCCACACT 
GCCTTGCAAA ATGGCAAATG GGAACGCAGC AAATATGGCG GTTGGGAAGT ACGCGGCAAA 
ACTTTAGGCT TGGTCGGCTT TGGCCGAATT GCCTCAGAAG TTGCTCGTCG CGCCCGCGCC 
TTGGAAATGA ATATTATCGC CTACGACCCA ATTATCAATG CTGAACGTGC AGCCCAACTT 
GGTGTGACCC CAGTAACGCT TGATGAATTA ACCAGCCGCG CTGATGTTAT TTCATTGCAC 
ATTCCATTGA TCGATGCTAC GCGCAATTTG TTCGATGCCC AACGCCTGAG CCAAATGAAA 
AAAGGCAGCT ATATCATCAA TTGTGCCCGT GGTGGCGTGA TCGATGAAGA AGCCTTGTTC 
GAAGCTTTGG AATCAGGCCA TCTTGGCGGC GCAGCCCTCG ACGTATTTGC CAAAGAGCCA 
CCAACTGGCC CCATCGTTAC CCACCCCAAA GCGATTGTCC TGCCGCACTT AGGCGCTTCA 
ACCGAAGAAG CTCAAGCCTT GACCGCCGCC GATGTGGCCG AAGGGATTGT TGATGTATTG 
GCTGGGCGAT CACCACGCTA TGCAGTCAAC GCACCGTTTG TTGCGCCAGA AGAGTGGGCA 
ATCGTTGGGC CATATCTCGA TCTTGGCCGC AAATTAGCGC GGCTCAGCAC TCAATTGGTC 
GATCTGCCAG CCCAATCGTA TCAAATTGTC TACAACGGTG CTTTGGCAGG CCTGACCAGC 
GAACCAATTA AGTTAGCCGT TTTGCAAGGC TTGCTCGAAG GCGGCTCAGA AGGTCGGGTT 
ACTCCGGTTA ATGCGCCATT CTTGGCTCGC GAACGCGGCT TAACCATCAA CGAAACTCAT 
CGCCCCGATG CTGAAACCTA CACCGAATTG TTGCAATTGG TGGTGACCAC CAGCGATGGT 
GTGGTGCATA CCTTCGGCGG AACGGTGGTA CGTGGCGAGG CTCACATCGT CCAAATCAAC 
GAATTTTGGC TCGATTTGGT GCCAACCAGC TCGATGTTAT TCACCTTCCA CCAAGATCGG 
CCTGGCTTTA TCGGGCGGAT TGGCACATTG CTGGGCACGG CTGATATCAA CATTTCGGCG 
ATGCACGTTG GTCGCTCAAG CCCACGCGGC ACAGCAATTA TGGTGCTCAC GGTTGATGAA 
GCCATTCCAA GCGAGACCCT AACCGATATT AACAACCAAG TTGATATCGA ACGCGCCTAC 
AGCGTGTTGC TCTAA

Protein sequence

MDRILVTEKI GAEGLAALKE VAEVDVRLDL TPETLLEALP QYDALIVRSQ TKVTAKVLAA 
GTKLRVVGRA GTGVDNIDLA AANQQGILVV NAPASNSIAV AELTIGLMIG LARNIPQAHT 
ALQNGKWERS KYGGWEVRGK TLGLVGFGRI ASEVARRARA LEMNIIAYDP IINAERAAQL 
GVTPVTLDEL TSRADVISLH IPLIDATRNL FDAQRLSQMK KGSYIINCAR GGVIDEEALF 
EALESGHLGG AALDVFAKEP PTGPIVTHPK AIVLPHLGAS TEEAQALTAA DVAEGIVDVL 
AGRSPRYAVN APFVAPEEWA IVGPYLDLGR KLARLSTQLV DLPAQSYQIV YNGALAGLTS 
EPIKLAVLQG LLEGGSEGRV TPVNAPFLAR ERGLTINETH RPDAETYTEL LQLVVTTSDG 
VVHTFGGTVV RGEAHIVQIN EFWLDLVPTS SMLFTFHQDR PGFIGRIGTL LGTADINISA 
MHVGRSSPRG TAIMVLTVDE AIPSETLTDI NNQVDIERAY SVLL