Gene EcSMS35_2958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2958
Symbol
ID	6143708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3030901
End bp	3031848
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	44%
IMG OID	641617827
Product	D-isomer specific 2-hydroxyacid dehydrogenase family protein
Protein accession	YP_001744979
Protein GI	170684118
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.405227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATG TTCTGGTCAC CGTCCCCAGC TTTTCAGCAC GCTGTGTTTC CGCCAGCAAG 
TTGCTAAGAG AGAATAATTT TAATCTTATT ATTAAGAATA ATGTGGAGCA TCTGCTTAAA 
TCAGAATCCA CTGCATTACG AGAATCTATT TGCGCGGTCA TCGCCGGAAA AGATTGTTAT 
CAGGCGGACA CGCTATCATT GCTGTCTGGT GTGAAAATAA TATCGAGATT CGGGACGGGG 
ATAGACAATA TTGATCTTCG TGCGGCACAG CAATCCGGTA TTGTTGTCAA TAATGCGGTT 
GGGATTAATT CAAATGCGGT TGCGGAATTT ATCATTGGAC TTATCTTCGC GAGCATGAGA 
AATATCCCCG GTAGCTATCA TGCGATGCAA AATGGTTATT GGGGCGAGTC GCATGGCTGC 
GAGTTACAAG GTAAACGTAT TGGCCTGCTT GGCTACGGCA ATATTGGCAA AACACTGGCG 
AAAAGGTTAT CTGGTTTTGA TGTTGAGCTT TTAGCTTTTG ACAAACAACC CGATTTCCAG 
GCCGCAGGCA AAGATGGAGT TCAGTTCGTA TCAATTGAAG ATATCTTTAT GCAGTCTCAT 
GTCATCATCG TTCTTTTGCC ATTTTCTCCG GAGCTGGAGA ACTTCATTAG TCATAAATAT 
TTGTCGATGA TGCGCAATGG TGCTCTGATC ATCAACGCCG CAAGGGGAAA GTTGCTGGAT 
GAGGGTGCTT TACTTCAGGT AATTGAAGAA CGAAATGTTT TTGCAGCACT GGATGTGTTT 
AGCTCTGAAC CGCTAGCGCA ATTTAGCCCA TTGCTACATG CCAAGAATAT CATTACAACG 
CCGCATATTG CGGCCGCCAC CGTTGAGTCA TACCAGCAAA CCGGGATATA CGTTGCCCAG 
TCGATAATTG ATTACTTCGC AGGAAGGGAG ATAAAAAACG TGCTGTGA

Protein sequence

MKNVLVTVPS FSARCVSASK LLRENNFNLI IKNNVEHLLK SESTALRESI CAVIAGKDCY 
QADTLSLLSG VKIISRFGTG IDNIDLRAAQ QSGIVVNNAV GINSNAVAEF IIGLIFASMR 
NIPGSYHAMQ NGYWGESHGC ELQGKRIGLL GYGNIGKTLA KRLSGFDVEL LAFDKQPDFQ 
AAGKDGVQFV SIEDIFMQSH VIIVLLPFSP ELENFISHKY LSMMRNGALI INAARGKLLD 
EGALLQVIEE RNVFAALDVF SSEPLAQFSP LLHAKNIITT PHIAAATVES YQQTGIYVAQ 
SIIDYFAGRE IKNVL