Gene Ent638_4221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_4221
Symbol
ID	5110433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009425
Strand	+
Start bp	31444
End bp	32616
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	51%
IMG OID	640480838
Product	aldo/keto reductase
Protein accession	YP_001165500
Protein GI	146284547
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.886889
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGC CAAAAACCCG TCCTGCACAA CGCACTGAAA GCATAAGCGC TTTCAGCCGA 
CGCAACTTTC TGTCTTCTTC TGCCTTAATG GGGGCAGGGT TGATTATGGG GAGTTTACCT 
GACAGGGCGC ATGCAACGTC ATCAGAGCCG ACAGCAAAAC CGGCACAGGC CAGACAAGGT 
TCACAGACAA TGCCGACGCG AAAACTTGGA TCTATGGTGG TTTCCGCACT GGGTGCCGGA 
TGTATGAGTA TCAGCGCTAA CTACGGGGCG GCAGCGGATA AATCCCAGGG GATAAGAACG 
ATACGCGAGG CACACGCCAG AGGCGTCACG CTATTCGATA CCGCCGAAGT TTATGGACCT 
TATACCAATG AAGAACTGGT TGGCGAGGCG CTTGCTCCTG TTCGTAACCA GGTCTTTATT 
GCCAGCAAAT TTGGATTTGA TATTCAACAT GGCGGGCTGA ACAGTCAGCC AAAACATATC 
CGAAAAGTGC TGGAGGCCTC TCTCAGGCGT TTACGCACTG ACCGTATCGA TCTGTATTAT 
CAGCATCGCG TTGATCCCGG TGTTCCCATA GAGGACGTAG CCGGGACTAT CCAGGATTTG 
ATTAAAGAAG GCAAGGTTCT ACATTTTGGT CTTTCTGAAG CAAGTCCTTC TACCATCCAT 
CAGGCTCATG CGATCCAGCC TGTCACCGCA GTACAGACGG AATATTCTGT CATGAACCGC 
GATCCGGAAC ATAATGGTGT GCTGGATACC TGCGAGGAGC TGGGAATTGG TTTCGTCCCC 
TGGGGGCCGA TAGGCATGGG GTATCTGACC GGAACGGTGA GCGTTAACAC TCATTTTGAT 
CCCAAAACCG ACTTACGCTC CACTTTTGAA CGTTTTACGC CTGAAAATTT AGCGAATAAC 
TGGCCCTTTG TGGAAAAGCT GAAAGCTATC GCTGACAGTA AGGGCGCGAC ACCGTCTCAG 
ATCGCGCTTG CATGGCTTCT GGCCAAAAAA ACCTGGATTG TTCCTATTCC CGGGACACGA 
AATATCAACC ATCTCCGTGA AAACCATGGT GCTTTAGAGA TCCAGTTAAC CACTACTGAG 
TTAAGCGAAA TGGATAAAGC TATGTCCGGG CTTCGCGTCT ATGGTGGTCG CATGAATAGT 
GCCCAGATGG ACCTCGTTGA GCCCAAAGCT TAA

Protein sequence

MSQPKTRPAQ RTESISAFSR RNFLSSSALM GAGLIMGSLP DRAHATSSEP TAKPAQARQG 
SQTMPTRKLG SMVVSALGAG CMSISANYGA AADKSQGIRT IREAHARGVT LFDTAEVYGP 
YTNEELVGEA LAPVRNQVFI ASKFGFDIQH GGLNSQPKHI RKVLEASLRR LRTDRIDLYY 
QHRVDPGVPI EDVAGTIQDL IKEGKVLHFG LSEASPSTIH QAHAIQPVTA VQTEYSVMNR 
DPEHNGVLDT CEELGIGFVP WGPIGMGYLT GTVSVNTHFD PKTDLRSTFE RFTPENLANN 
WPFVEKLKAI ADSKGATPSQ IALAWLLAKK TWIVPIPGTR NINHLRENHG ALEIQLTTTE 
LSEMDKAMSG LRVYGGRMNS AQMDLVEPKA