Gene Bind_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1820
Symbol
ID	6201080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	2070387
End bp	2071778
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	59%
IMG OID	641705811
Product	aldehyde dehydrogenase
Protein accession	YP_001832937
Protein GI	182678791
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.935448
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.30191
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTATG AAAGCGTCAA TCCCTATACT GGACAGACAC TTGCCTCTTT CTCCGAGGCC 
ACTGACGATG AAGTGCGCCA CGCGATCGGC AAGGCGCATG ACACATTCCT GCGCTGGAGG 
CTGACGTCCT TCTCCGAACG GGGCGTCATT CTGCAAAAGG CGGCTGACAT CCTGCGCCGT 
GACAGCGACG CTTATGCACG CCTTCTGACG CTTGAGATGG GCAAGCTTAT TGGCGAAGCA 
AAGGCCGAGG TCGAGCTGTC GGCCAAAATC TTCGAATATT ATGTCCGCAA CGCCGAGGAG 
TTGCTCAAGC CTCAGAAACT TCCCGTTCTC GATCCTGCCG AGGGCGATGC GCTTTTGGTC 
CATGAGCCGC TTGGTGTGCT GCTCGCCATT GAGCCCTGGA ATTTTCCCTA TTACCAGATT 
GCGCGCATTC TCGCGCCGCA GCTTTCGGCC GGCAATACGC TTCTCTTGAA ACATGCTTCC 
AACGTGCCGC AAAGTGCGGC CGCTTTCGAG AAGCTGATGG CCGAAGCTGG GCTGCCGGCG 
GGCGCGTTCA AAAACCTCTA CGCGACCCGC TCGCAAATCG AACTCATTCT CAATGACGAT 
CGCGTTCATG GTGTGGCCCT CACCGGCTCG GAAGGGGCGG GCGCCGTGGT GGCCGCGCAG 
GCTGGCAAGG CACTCAAAAA GTCGACGCTC GAACTCGGCG GCGCTGATGC CTTCATCGTG 
CTGGCGGATG CCGATCTGGA AAAGACCACG AAATGGGCCG TATTCGGCCG CCACTGGAAT 
GGCGGGCAGG TCTGCGTCTC ATCGAAGCGG ATGATTATTG TCGATCCGGT CTATGACGAT 
TTCCTGACCC GGTATCGCAA GGGTGTGGCT GGCCTGATTG CGGGTGATCC CTTTGATGCG 
AAAACAACCC TGGCGCCGCT ATCGTCGAAG GGCGCCGCTG ACGAGGTGAA GGATAAGATC 
CGCGAGGCCG TCAAGCTCGG TGCAAAGGCC GAGGAGGTTG GCCCGCCGGT TCCTAACCAA 
GGCTCCTTTG TCCAGCCGAC GATCCTGACC GATATCGGCG AGGATAATCC TGCCCGTTAT 
TGGGAGTTTT TCGGCCCCGT CTCGATGCTG TTCCGGGCAA AGGACGAGGA TGATGCCGTG 
CGCATCGCCA ATGACTCGCC CTTTGGTCTC GGTGGGTCGG TCTTCACGGG GAACCCGGCA 
CATGGTGCGG AAGTCGCAAA GCGCGTTTCA ACGGGCATGG TCTTCGTTAA CCACCCGACC 
AAGGTCGAGG CTGACCTGCC GTTCGGCGGC ATTCGCCGTT CCGGCTACGG CCGCGAACTG 
ATCGGGCTCG GACTCACGGA ATTTGTGAAT CACAAGCTCA TCGATGTCGT CGACATCGAC 
GCGCATTTCT GA

Protein sequence

MAYESVNPYT GQTLASFSEA TDDEVRHAIG KAHDTFLRWR LTSFSERGVI LQKAADILRR 
DSDAYARLLT LEMGKLIGEA KAEVELSAKI FEYYVRNAEE LLKPQKLPVL DPAEGDALLV 
HEPLGVLLAI EPWNFPYYQI ARILAPQLSA GNTLLLKHAS NVPQSAAAFE KLMAEAGLPA 
GAFKNLYATR SQIELILNDD RVHGVALTGS EGAGAVVAAQ AGKALKKSTL ELGGADAFIV 
LADADLEKTT KWAVFGRHWN GGQVCVSSKR MIIVDPVYDD FLTRYRKGVA GLIAGDPFDA 
KTTLAPLSSK GAADEVKDKI REAVKLGAKA EEVGPPVPNQ GSFVQPTILT DIGEDNPARY 
WEFFGPVSML FRAKDEDDAV RIANDSPFGL GGSVFTGNPA HGAEVAKRVS TGMVFVNHPT 
KVEADLPFGG IRRSGYGREL IGLGLTEFVN HKLIDVVDID AHF