Gene Paes_1352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1352
Symbol
ID	6460347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	1470965
End bp	1472035
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	50%
IMG OID	642725336
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_002016021
Protein GI	194334161
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0899347
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000140534
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAGCAAT TACAGGATTT ACGTGTTTCA AACATTACTC GACTGACTGC ACCGCAAACC 
TTCAAGCAAC GCCTTCCGGT GACGGAAGAG ATTGCCAGAA CGGTTTTAGA CGGTCGCGAG 
GAAGTTGAAA ATATTTTATC CGGAAAAGAT TCCCGGATGC TTGTTATCGT CGGTCCGTGT 
TCGATTCACG ATATCAAGGC GGCAATGGAG TATGCCGTTC GACTCAAGGC TCTGCGCGAT 
GAACTGAAGG ATGATCTTTG TATCGTCATG CGTGTTTATT TCGAGAAACC AAGGACAACG 
ATCGGCTGGA AAGGGTTTAT CAACGACCCG CACCTCGATG GTTCATTTGA TATCGAGCAT 
GGATTGCATT ATGCCCGCAA ACTGCTTCTT GATATCAATG CCCTGGGGCT TCCTACAGCT 
ACGGAGTTTC TCGATCCGTT TACACCTCAG TATGTATCTG ATCTTGTCAG CTGGGCGGCG 
ATTGGAGCAA GAACCATCGA GTCTCAGACA CATCGTCAGA TGGCCAGCGG CCTGTCGATG 
CCGGTAGGGT TCAAGAACTC CACCGATGGT CGTATTCAGG CTGCCATTGA TGCATTACGG 
TCGGCCATGC ATGCTCACAG TTTTCTTGGT ATCGATCAGG AGGGGCACAG CAGTGTCATC 
ACCACGACGG GCAATCCGTT TGGCCATATT GTGCTGCGTG GCGGTTCCCA GAAGCCGAAC 
TACGATCCGG ACAATATTGC CGACGCTGAG CGGAGGCTGC AGGCAGCACA TCTGCCATCT 
GCCATTATGG TTGATTGCAG TCATGCCAAT TCGGGGAAAA AGCATGAACA GCAGGCCAAC 
GTCTGGGATA ATATTGTCGA ACAGCGCGTC AACGGTACGA CAAGTATCAT CGGCGTGATG 
ATCGAAAGTA ATCTGTTCTG CGGAAATCAG CCTTTTCCTG ACGATCCATC TTCCCTGCAG 
TACGGTGTTT CGATTACCGA TGCCTGCATT GCATGGAATG AAACTGAGAC GCTCTTAAGG 
AAAGGCGCGG TGAGACTTCA TGAAGTGCTT CGAAAATCTG AGCTTTCTTA A

Protein sequence

MQQLQDLRVS NITRLTAPQT FKQRLPVTEE IARTVLDGRE EVENILSGKD SRMLVIVGPC 
SIHDIKAAME YAVRLKALRD ELKDDLCIVM RVYFEKPRTT IGWKGFINDP HLDGSFDIEH 
GLHYARKLLL DINALGLPTA TEFLDPFTPQ YVSDLVSWAA IGARTIESQT HRQMASGLSM 
PVGFKNSTDG RIQAAIDALR SAMHAHSFLG IDQEGHSSVI TTTGNPFGHI VLRGGSQKPN 
YDPDNIADAE RRLQAAHLPS AIMVDCSHAN SGKKHEQQAN VWDNIVEQRV NGTTSIIGVM 
IESNLFCGNQ PFPDDPSSLQ YGVSITDACI AWNETETLLR KGAVRLHEVL RKSELS