Gene Sbal195_3828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_3828
Symbol
ID	5755643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	-
Start bp	4508392
End bp	4509447
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	46%
IMG OID	641290170
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_001556248
Protein GI	160876932
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000267909
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.262784
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTACC AAAATGATGA CGTTCGCATT AAAGAAGTAA AAGAGTTACT TCCTCCTATC 
GCGATTCTAG AACGATTTCC TGCTTCCGAA AAAGCCTCTG CGACTGTGTT TAATGCGCGA 
AATAGTATCC ACAATATTCT GGCTAAGTCT GATGATCGCC TGTTAGTGGT AATTGGACCT 
TGTTCTATCC ACGATCCCAA AGCGGCGTTG GAATATGGTC AGCGTCTGGT TGCGCTGCGT 
GAGCGTTATA AGGGTCAACT CGAAATCGTG ATGCGAGTGT ATTTTGAAAA GCCAAGAACC 
ACAGTGGGTT GGAAGGGGCT TATCAACGAT CCTTACATGG ATAACAGCTT TAAACTCAAC 
GATGGTTTAC GCACTGCGCG TAAGTTATTG GTGGATTTGA ACGACAGCGG CATGCCAACC 
GCGGGTGAGT TTCTTGATAT GATCACCCCA CAATATATGG CAGATTTAAT GTGCTGGGGA 
GCCATTGGTG CCCGTACTAC TGAATCACAA GTGCACAGAG AGTTAGCCTC GGGTCTTTCT 
TGTCCGGTCG GTTTTAAAAA TGGGACCGAT GGCACCATTA AAGTCGCTAT CGATGCGATA 
GGTGCTGCGA ATGCACCGCA CCATTTTTTA TCTGTGACTA AGTTGGGTCA TTCGGCGATC 
GTTTCGACGA AAGGGAATCC TGATTGCCAC ATTATTTTAC GTGGCGGCCG CGAGCCTAAT 
TACAGTGCGC CGCATGTCGC TGAAATTAGC CAACAGTTAT TAAAAGCTGA ACTTGCCGAC 
AACATCATGA TCGACTTTAG CCACGCCAAT AGTAGTAAAC AGTATCAACG ACAGTTAGTG 
GTTGCCGAAG ATGTGGCTGG CCAAGTGGCG ACGGGCAATA CTGCTATTTT TGGTGTTATG 
GTAGAAAGCC ATTTAGTGGA AGGTCGTCAG GATTTAATTG AAGGTCAAGA GTTGTGTTAT 
GGCCAGAGTA TTACCGATGC GTGTATTGGT TGGGATGATA CCGAGCGCCT GTTGGCCATT 
CTGAATCAGG GTATTATCGA ACGCCGTCAG GTTTAA

Protein sequence

MYYQNDDVRI KEVKELLPPI AILERFPASE KASATVFNAR NSIHNILAKS DDRLLVVIGP 
CSIHDPKAAL EYGQRLVALR ERYKGQLEIV MRVYFEKPRT TVGWKGLIND PYMDNSFKLN 
DGLRTARKLL VDLNDSGMPT AGEFLDMITP QYMADLMCWG AIGARTTESQ VHRELASGLS 
CPVGFKNGTD GTIKVAIDAI GAANAPHHFL SVTKLGHSAI VSTKGNPDCH IILRGGREPN 
YSAPHVAEIS QQLLKAELAD NIMIDFSHAN SSKQYQRQLV VAEDVAGQVA TGNTAIFGVM 
VESHLVEGRQ DLIEGQELCY GQSITDACIG WDDTERLLAI LNQGIIERRQ V