Gene Tpau_2558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_2558
Symbol
ID	9156719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	2654323
End bp	2655813
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	68%
IMG OID
Product	Aldehyde Dehydrogenase
Protein accession	YP_003647500
Protein GI	296140257
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.141176
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCAG CAGAGACCAA GACGTTCGAT TCACTGAACC CGCGCACGGG CGATGTCGTC 
GCCAGCTACC CGATCCACTC GGCTGACCAC GTCCACGCCG TGGTCGCCCG AGCCCGCGAA 
CAGGCCGACT GGTGGCAGGA ACTCGGCTTC GAGGGGCGCA AGCACCAACT GAACAAATGG 
AAGGGCGTCA TCACCCGCCG GATCAACCAG TTGGCGCAGA TCGTCCACGA CGAGACCGGC 
AAACCCCACG GCGATGCCCT GCTCGAAGCC GCGCTCGGCA TCGACCACCT CGGCTACGCC 
GCTTCGCACG CGAAGAAGGT ACTCGGTCCC AAGCGGGTCT CGTCGGGCCT GGTCATGGCG 
AATCAGGCGG CGACGGTGCG CTATCACCCG CTCGGCGTGG TCGGCGTGAT CGGACCGTGG 
AACTACCCCG TCTTCACCCC CATGGGCTCG ATCGCCTACG CCTTGGCCGC GGGTAATGCC 
GTCGTCTTCA AGCCGTCCGA GTACACGCCC GGTGTGGGGG TCTGGCTCGC CCGCACCTTC 
GAGGAGGCCG TGGGCCGCCC GGTTTTGCAG ACGGTGACGG GCTTCGGCGA GACCGGCAAC 
GCGCTGTGCA CCTCCGGCGT GGGCAAGCTC GCCTTCACCG GGTCGACCAA TACCGGCAAG 
AAGGTCATGG CCGCGTGCGC CGAGACATTG ACGCCGGTGG TGATCGAGGC CGGCGGCAAG 
GACGCCTTCC TGGTGGACCG GGACGCCGAT CTCGAGGCCG CTGCCGACGC CGCCGCGTGG 
GGCGCCTTCG CCAACGCCGG TCAGACCTGC GTCGGCGTCG AGCGGGTCTA CGTGCACAAG 
GACGTCTACG ACCCGTTCCT GGACAAGCTC GTCGCGAAGG CCCGCGAGGT CACCGCGAAC 
GCTTCGGACG ATTCCAAGAT CGGCCCGATC ACCATGCCCA GCCAGCTACC GATCATCAAG 
TCGCACATCG ACGACGCCCT CGCCCGCGGC GGGCGAGCGC TGGTCGGCGG TGCCGATGCG 
GTCGGCGAGC GGTTCGTCCA GCCGACGGTG CTCGTCGACG TCCCGGAGGA TTCGATCGCG 
GTCACCGAGG AGACCTTCGG CCCCACCGTG ACGGTCGCGA AGGTGGAGTC GATGGACGAG 
GCGGTGGAGA AGGCGAACGC CACCCGCTAC GGCCTGGCGG CGACGGTCTT CTCGAAGGCC 
CGCGGAATGG AGCTCGCCGA CAAGATCCGG TCGGGTATGG CCTCGGTGAA CGGCATCATC 
ACCTTCGCGG GTGTGCCGAA CCTGCCGTTC GGCGGCGTGG GCGACTCCGG CTTCGGCCGC 
ATCCACGGCG CGGACGGGCT CCGCGAATTC AGCTACGCCA AGGGCATCGC GCGCAAGCGG 
TTCACTCCGC TGCTCAACCT CACCAGCTTC GCGCGCACCA AGGCGCAGGA GGGACAGCTC 
GCGCAGATCG TCACGCTGCT GCACGGTCGG CAGGGCACGA TCGAGAAGTA G

Protein sequence

MTAAETKTFD SLNPRTGDVV ASYPIHSADH VHAVVARARE QADWWQELGF EGRKHQLNKW 
KGVITRRINQ LAQIVHDETG KPHGDALLEA ALGIDHLGYA ASHAKKVLGP KRVSSGLVMA 
NQAATVRYHP LGVVGVIGPW NYPVFTPMGS IAYALAAGNA VVFKPSEYTP GVGVWLARTF 
EEAVGRPVLQ TVTGFGETGN ALCTSGVGKL AFTGSTNTGK KVMAACAETL TPVVIEAGGK 
DAFLVDRDAD LEAAADAAAW GAFANAGQTC VGVERVYVHK DVYDPFLDKL VAKAREVTAN 
ASDDSKIGPI TMPSQLPIIK SHIDDALARG GRALVGGADA VGERFVQPTV LVDVPEDSIA 
VTEETFGPTV TVAKVESMDE AVEKANATRY GLAATVFSKA RGMELADKIR SGMASVNGII 
TFAGVPNLPF GGVGDSGFGR IHGADGLREF SYAKGIARKR FTPLLNLTSF ARTKAQEGQL 
AQIVTLLHGR QGTIEK