Gene Jann_3789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3789
Symbol
ID	3936269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	3873017
End bp	3874564
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	64%
IMG OID	637906167
Product	aldehyde dehydrogenase
Protein accession	YP_511731
Protein GI	89056280
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.822208
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGACC GGAGTGAGAA AACGCGGCGA GGGGAGGATA CCGTGGATAA CGCCATGGAG 
ACGGACGCAG AAGATGTGCC CGTCGAAACG CATCTTTTTG TGGACGGAGA GGCGCGCCCG 
GCATCAGCGG GACGCCTCTA TCCCATCTAC AATCCGGCAC GACCCGATGA ATTGGTTGGC 
CACGCGGCAG CAGCAGATGC CGACGATGTC GATGCCGCCG TGCGGGCGGC CGACGCAGCG 
TTTCCGGCCT GGTCTTCGCG GACCTACACA GAGCGCGCAG AGCTGCTGAT CGCCATTGCC 
GATGCCCTGA GTTCCGACGA TGCAGACGTC GCCCGCAGGT CCCGCCTGTT CTGCCGTGAG 
CATGGCAAGA TCTTGCGCGA AACGCATCTG GAACTGAGCC GCCTTGGCGA CCGGTTCCGG 
CTGAGCGCGT CCTACGCAGA ACGGCTGGCG GCGGACGAAA CCCTTCAAGG GCCACCCTTT 
GATACGATCA TAACCCGCCA ACCGCGTGGG GTCGCCGCGC TGATCGTGCC ATGGAACTGG 
CCCCTGTCGA TCCTTGGCGC GAAGCTGCCG CAGGCCCTGA TGGCGGGCAA TACCGTGGTT 
GTGAAGCCAA GCCACAACTC CGCGCTGGCC CCGTCACAGA CGCTGCGGAT CATCGCAGAG 
ATGCTGCCAC CCGGCGTGTT GAGTGTCGTG ACGGGCAGCG CGTCGGACAT CGGCGATCCG 
CTGGTGCGCC ACCCGCTGGT CCGGTTCGTG AATTTCACCG GATCGGTTGA GGTCGGACGC 
CACGTGATGC GGCAGGCCGC AGACAATCTG ACGCCCGTGA CACTGGAACT GGGCGGCAAT 
GATGCCGCCT TGATCTGCGA GGACGCGGCG CTTGATGACG GTGCGTTCAT GCGAATGTAC 
ATGGGCGCGT TCATGTCATC GGGGCAGATC TGCATGGCGC TGAAACGGCT CTACGTGCAT 
CGCTCGCGTT TTGACGAGGT GGTGGATGGG CTGGAGGCCA CGTGCAACCG GATGGTCGTA 
GGCGACGGCC TTTTGGACGG CACCAACATG GGCCCTGTGA ACAACGCGAA GCAACTGCAG 
GTCGTGACCG ACATGATCAA CGAAGCCCGT CATAGCGGCA CGGACGTGCG AGAGCTTGGG 
CAGGTGCCCG ATGAGGCGCT CTACGCGACG GGCTACTTTC AGCGCCCAAC GCTGGTTGTG 
GACCCGGATC CCAGCCTGAA GATCGTCGCC GAGGAGCAAT TCGGCCCCGC CCTGCCGATC 
CTACCCTTCG ACACGGAAGA CGAGGCGATT GCGGCGGCGA ATGACAGCCG CTTTGGCCTC 
TGCTCATCGG TCTGGACGGA GGATCGCGAC CGCGCTGTTG CCCTCTCTCG CCGGATCGAG 
GCGGGCTATA CCTATCTGAA CGCCCATGGT CCCGCGGCGC AGGACGGACG CGGACCGTTC 
GGCGGGTTCA AGGACAGCGG GATCGGCAGA AATCTTGGGT ACGAGGGCGT GATCCAGTTT 
CAGGGTCACC ACACGATCAG CGGGCCGAGC GGATGGCTTA TCAGTTGA

Protein sequence

MIDRSEKTRR GEDTVDNAME TDAEDVPVET HLFVDGEARP ASAGRLYPIY NPARPDELVG 
HAAAADADDV DAAVRAADAA FPAWSSRTYT ERAELLIAIA DALSSDDADV ARRSRLFCRE 
HGKILRETHL ELSRLGDRFR LSASYAERLA ADETLQGPPF DTIITRQPRG VAALIVPWNW 
PLSILGAKLP QALMAGNTVV VKPSHNSALA PSQTLRIIAE MLPPGVLSVV TGSASDIGDP 
LVRHPLVRFV NFTGSVEVGR HVMRQAADNL TPVTLELGGN DAALICEDAA LDDGAFMRMY 
MGAFMSSGQI CMALKRLYVH RSRFDEVVDG LEATCNRMVV GDGLLDGTNM GPVNNAKQLQ 
VVTDMINEAR HSGTDVRELG QVPDEALYAT GYFQRPTLVV DPDPSLKIVA EEQFGPALPI 
LPFDTEDEAI AAANDSRFGL CSSVWTEDRD RAVALSRRIE AGYTYLNAHG PAAQDGRGPF 
GGFKDSGIGR NLGYEGVIQF QGHHTISGPS GWLIS