Gene Rcas_2565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2565
Symbol
ID	5540047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3305389
End bp	3306435
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	62%
IMG OID	640894694
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001432661
Protein GI	156742532
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.472024
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAACCGG TCGATAACCT TCACGTTCTT GCTTTTGAGC CGCTCACCCC GCCACGCGCC 
CTGCGTGAGC GGTATCCGAT CACCGAAGCC GCAGCGCAGA CGGTCTACGA AACGCGGGAA 
TCGATCAAGC GCATTGTGCG CCGTGAAGAC CAGCGCCTGC TGGCGGTTGT CGGTCCCTGT 
TCGATCCACG ACACCGGAGC GGCGCTGGAG TATGCCGGGC GACTGGCGCG CCTGGCAGGC 
GAGATGCGCG ACCGAATCGT GATTGTGATG CGCGCCTACT TCGAGAAACC GCGCACCACC 
GTCGGATGGC GCGGTCTGAT CAACGATCCG CACCTCGACG GTTCGTTCGA CATGAACGAA 
GGATTACGGC GCGCGCGCGA GTTGTTGTTG CGCATCAACG ACATTGGGCT GCCAACCGCC 
ACCGAAATGC TCGACCCGAT CAGCCCGCAG TATATTACTG ACCTGATCAG CCTGACTGCC 
ATCGGCGCGC GCACCGTCGA GTCGCAGACC CATCGCGCTC TCGCCAGCGG TCTCTCGATG 
CCGGTTGGCT ACAAGAACAG CACCGATGGC AATGTGCAGG TGGCAGTTAA TGCATTTCTA 
TCGGCGCGCC GGGCGCACTC CTTCCTTGGC ATCGATCAGG ATGGACAGAG TTGCGTGGTG 
CGTACCACCG GCAATCCCGA TGGCATGATC ATCCTGCGCG GTAGCAGCGC CGGACCGAAC 
TATGATGCGG CAACCGTTGT GCGCACTGAA CAGGCGATGG AGGCGGCAGG TCTATTGCCC 
GCCATCATGA TCGATTGTAG CCACGCCAAT GCGGGCGGCG ATCACACGCG CCAGCCGCAC 
GTCTGGCGCG AGGTGCTACG CGACCACATC GCCAGCCGCA ACGCCGTCAT CGGTATGATG 
GTCGAAAGCT ATCTGTACGA AGGGAAGCAA CCGATCCTTG CCGATCGCTC ACGGCTGCGC 
TACGGCGTGT CGGTGACCGA TGCGTGTGTT GGTTGGGAAA CGACCGAGCG TATGCTGATC 
GAGGCATATG AGGCGCTGAA AGGTTGA

Protein sequence

MQPVDNLHVL AFEPLTPPRA LRERYPITEA AAQTVYETRE SIKRIVRRED QRLLAVVGPC 
SIHDTGAALE YAGRLARLAG EMRDRIVIVM RAYFEKPRTT VGWRGLINDP HLDGSFDMNE 
GLRRARELLL RINDIGLPTA TEMLDPISPQ YITDLISLTA IGARTVESQT HRALASGLSM 
PVGYKNSTDG NVQVAVNAFL SARRAHSFLG IDQDGQSCVV RTTGNPDGMI ILRGSSAGPN 
YDAATVVRTE QAMEAAGLLP AIMIDCSHAN AGGDHTRQPH VWREVLRDHI ASRNAVIGMM 
VESYLYEGKQ PILADRSRLR YGVSVTDACV GWETTERMLI EAYEALKG