Gene Bind_3664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3664
Symbol
ID	6198644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	4155196
End bp	4156245
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	57%
IMG OID	641707615
Product	aldo/keto reductase
Protein accession	YP_001834705
Protein GI	182680559
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.160957
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGAC GTCGATTGGG ACGAACGGAT CTGTTCGTTT CGGAAATTTG CCTTGGCACC 
ATGACTTGGG GTCAACAGAA TACCGAGGCC GAGGGCCACG CGCAGATGGA TTATGCGGTG 
GAACAAGGCA TCAATTTCTT CGATACCGCG GAAATGTATT CGATCCCTCC CAAGGCCGAG 
ACACAAGGCT CGACCGAGCG CATCATCGGG ACTTGGTTCA AGGCGCGCGG CAATCGCGAC 
AAGATCATTC TCGCCTCAAA AGTCTCTGGA CGTGGCGAGG CCACCTGGCT GCGCCCGGAT 
GGCTCGAAAA CCCGCATCGA CCGCAAAAAT ATCGAGGCAG CGATCGAGGG TTCGCTCAGG 
CGGTTACAAA CCGATTATAT CGATGTCTAT CAATTGCATT GGCCTGATCG GCCCCTGGCT 
TTATTCGCCG GCCAGACGAC GACCTTCAAG GACGTGCCGG AACCGCTCGA AAATCCGATC 
GAGGAAACCG TCGAAATCCT GGGCGATCTC GTCAAGACCG GCAAGGTCCG TCATATCGCT 
TTGTCCAACG AAACGGCCTG GGGCACGATG CGTTTCGTGC AAGCCTCCGA AGCGGGGCAT 
GGACCGCGTG TCGTCTCGAT CCAGAACGCC TATAATCTTA TAAACCGGAC CTTCGAGATC 
GGCCTGGCCG AAGTGGCCTT GCGCGAGAAT GTGGGTCTTT TGGCCTATTC CCCTTTGGCG 
CAAGGTTATC TTACCGGCAA ATATCAGGGG GGCGCCCGCC CGCCTGGGGC GCGTACGACC 
TTGTTTGATC GTGGCCAGCG GTATGAAAAG CCCGCCGCCT CCGAGGCAAT CGACGCCTAT 
CTGGCCCTTG CCAAGGAGTT CGGCCTCGAT CCCGCGCAAA TGGCGCTCGC CTTCGTGACA 
TCGCGACCCT TCGTCACATC CAATATTATC GGTGCGACGA CGATGGAGCA GTTGAAGGTC 
GATATTGCCT CGATCCATGT GAAGATCGCG GCCGATCTCG AAAAGCGGAT CGACGCCCTC 
CATCAAATTT ACAGCAACCC TTGCCCATAG

Protein sequence

MERRRLGRTD LFVSEICLGT MTWGQQNTEA EGHAQMDYAV EQGINFFDTA EMYSIPPKAE 
TQGSTERIIG TWFKARGNRD KIILASKVSG RGEATWLRPD GSKTRIDRKN IEAAIEGSLR 
RLQTDYIDVY QLHWPDRPLA LFAGQTTTFK DVPEPLENPI EETVEILGDL VKTGKVRHIA 
LSNETAWGTM RFVQASEAGH GPRVVSIQNA YNLINRTFEI GLAEVALREN VGLLAYSPLA 
QGYLTGKYQG GARPPGARTT LFDRGQRYEK PAASEAIDAY LALAKEFGLD PAQMALAFVT 
SRPFVTSNII GATTMEQLKV DIASIHVKIA ADLEKRIDAL HQIYSNPCP