Gene Apre_1244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1244
Symbol
ID	8398033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1329643
End bp	1331115
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	41%
IMG OID	644995589
Product	Aldehyde Dehydrogenase
Protein accession	YP_003152989
Protein GI	257066733
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00471898
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTC AAGATAGATA TGATTTATAT ATTAATGGTG AATGGATTAA GCCAGCATCA 
GGCGAGTATC TCGATGCAAT AAATCCTGCT ACAGGCGAGA AGATTGCTGA GTTTGCTACT 
GCAAATAATG AGGATGTAGA CAGAGCGATC GAGGCTGCTA GAGCATGTTT TGATGGAGAA 
TACGGATCTT TCTCTAAGGA AGAACGTGCA AACCTCCTAT TTAAAATAGC CGATAGGATA 
GAAGAAAACT TAGAAGATCT TGCCACAATC GAGACTATGG ATAATGGTAA GGCAATTCGT 
GAAACAAGGA CAGTTGACCT TCCTTGGGTT GTAGATCATT TTAGATATTT CGCTTCCCTC 
TTAAGAGCTG ATGAAGATGA AATTTCTAAG CTTGATGGTA GATTTGTATC AATCAGAAAA 
AGAGAGCCAC TTGGGGTTGT AGCTCAAATG ATTCCTTGGA ACTTCCCACT CCTTATGGCT 
GCTTGGAAGC TTGCACCAGC TATAGCAGGG GGAAATACTA TAGTAATCTC CCCTTCTTCA 
AACACATCTA TAGGGCTTCT TGAGATGATC AGAAGAATAG AAGACCTCCT TCCAAAGGGA 
CTTATCAATG TTGTAAGTGG TAGGGGTTCT GTAACTGGAG AATACCTCCA ACATCACAAA 
GGCGTGGATA AGCTTGCCTT TACAGGTTCT ACAAGTGTTG GTCGTCACAT TGGTATTTCT 
GCAGCAGAAA ACTTAATTCC TTCAACCTTA GAGCTTGGTG GTAAGTCAGC TCATATCATT 
TTTGACGATG CTGATATAGA AAAAGCCCTA GAAGGCGCCC AAGTTGGAAT CCTATTCAAT 
CAAGGAGAAG TTTGCTCAGC AGGATCTAGG CTCTTTATCC AAGAAGGAAT CTACGATGAA 
TTTGTAGAAA AACTTGTTGA AGCTTTCAAT AAGGTAAAAG TCGGTAACCC TCTAGAAGAG 
GACACACAAA TGGGTGCCCT AAGAGATGAG AAGAGAATCC CAGTTATAGA AGAATTCATC 
AAAAAAGCAA CAGATGCAGG TGCAAAGGTC CTTGCTGGTG GTAAGAGACT TACAGAAAAC 
GGACTCGACA AGGGAGCCTT CTTCGCACCA ACTATGCTTG CTGATGTTCC AGAAGATAAC 
GACGCCTACA GAGAAGAAAT CTTTGGACCA GTTGTAGTAA TAAAGAAATT CAAGGACGAG 
GACGATGTTA TAAGAATGGC AAATGACTCC CACTACGGCC TTGGTGGAGG AATCTACTCC 
AACGACCTAT ATAGGATAAT GGATGTTTCA AATAGACTAA AGACAGGAAG AATTTGGGTT 
AACACCTACA ACCAATTCCC AGCAGGTGCA TCATTCGGTG GCTACAAGGA TTCTGGTATA 
GGTAGGGAAA CAGACAAACT TGCCCTTGAA GCCTACACTC AAGTTAAAAA TATTATCATT 
GATTCCTCAA AAGAAAAATT AGGTTTCTAT TAA

Protein sequence

MKIQDRYDLY INGEWIKPAS GEYLDAINPA TGEKIAEFAT ANNEDVDRAI EAARACFDGE 
YGSFSKEERA NLLFKIADRI EENLEDLATI ETMDNGKAIR ETRTVDLPWV VDHFRYFASL 
LRADEDEISK LDGRFVSIRK REPLGVVAQM IPWNFPLLMA AWKLAPAIAG GNTIVISPSS 
NTSIGLLEMI RRIEDLLPKG LINVVSGRGS VTGEYLQHHK GVDKLAFTGS TSVGRHIGIS 
AAENLIPSTL ELGGKSAHII FDDADIEKAL EGAQVGILFN QGEVCSAGSR LFIQEGIYDE 
FVEKLVEAFN KVKVGNPLEE DTQMGALRDE KRIPVIEEFI KKATDAGAKV LAGGKRLTEN 
GLDKGAFFAP TMLADVPEDN DAYREEIFGP VVVIKKFKDE DDVIRMANDS HYGLGGGIYS 
NDLYRIMDVS NRLKTGRIWV NTYNQFPAGA SFGGYKDSGI GRETDKLALE AYTQVKNIII 
DSSKEKLGFY