Gene Apre_1086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1086
Symbol
ID	8397873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1163646
End bp	1165226
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	38%
IMG OID	644995433
Product	NADH dehydrogenase (quinone)
Protein accession	YP_003152834
Protein GI	257066578
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGA AAGAATTATT AGATCTCAAA GAAAAGTCTC TAGCAGAGCT TAGGGAAAAA 
ATAGACTATA GCAAAATCTA TGAAGATGAT AAAGGTGATT TTAAGCTTAA GGGAGATTTC 
TTTGAAAATC AAAAAAGACT AGTGCTTAAA AACTGTGGTA TAATCGATCC ATCATCAATC 
GAAGATTACA TAGGATTGGA TGGATATAAG GCTCTTTATA AGGCTATTTT TGAATTAGAT 
AGAAAAGAGA TAATTGATAT AGTAAAAGAT TCTGGTCTTA GGGGAAGAGG CGGAGCAGGT 
TTTCCTACTG GAAGAAAATG GGAAGCGGCT TTCCTTCAAG ATACTGATAT TAAATACATA 
ATATGCAATG CAGACGAAGG AGATCCCGGA GCTTTTATGG ATAGGTCAGT CCTTGAACTA 
GACCCACACT CAGTACTCGA GGCTATGGCC ATATGTGCGA GGGCCATAGG TTCAAATAAA 
GGATTTATAT ATGTTAGGGC TGAATATCCA AAGGCGGTTA GAGCTCTTGA AATAGCAATT 
GATCAGGCTA AAAAATATAA TCTTTTAGGA GATAATATAT TAGGATCAGA TTTTTCTTTT 
GATATAGAGC TAAGACTTGG AGCAGGTGCT TTTGTTTGTG GTGAGGGAAC TGCACTAATG 
GAGTCAATAG AAGGAAGGCG AGGCATGCCT CGTAACAAGG AATACAGGAC GACTGTAAGA 
GGGCTATGGG GTAAGCCTAC TGTAATAAAT AATGTAGAAA CTTTCGCCAA TATCGCCCAA 
ATTATTAATA AGGGCTCAGC TTGGTTTAGG TCCTTTGGAA CAGAAAAATC TCCAGGTACT 
AAAGTCTTCG CCCTATCCGG CAAGGTTAAA AATGCAGGTC TTGTCGAAGT GGAGATGGGA 
ACTAGCATAG ATCAAATAGT TTATGATATA GGAAAAGGTA TTCAGAATGA TAAGGATGCT 
AAAGCAGTAC AGACTGGAGG TCCTTCTGGA GGTTGTATAC CTAAAAGGCT CTTCGATACA 
GCTTGTGATT TCGAATCACT GGGAGCTATA GGTTCCATAA TGGGATCAGG CGGCATGGTA 
GTTATGGATG AGGATGACTG CATGGTTGAT GTTGCTAGGT TTTTCCTAGA ATTTTCTGTA 
GACGAGTCAT GTGGTAAATG TACTCCTTGT AGAATTGGCA ATAAGAGATT ATTTGAAATG 
CTCGATGATA TTACTAAAGG TAAAGCTAAT CATGAAACAC TCGATAAGCT AGAAGAATTA 
TCAGAAATAG TATCCGAAGC TTCACTTTGC GGACTTGGCA AATCTAGTCC TAACCCGATT 
ATTTCTACAA TGAGATATTT TTATGATGAA TATGAGGCCC ATGTAAATGA AAATAAAACT 
TGTCCATCCA AAAGATGTAT TAGCCTTTTA AATTATACCA TAGGAGAAGA TTGTATAGGA 
TGTGGTAAGT GTAAGAGACT ATGCCCTAAT GAGGCTATAG CTGGAGAAGC TCGCAAAAAA 
CATGAAATAA ATCAAGACAA ATGTATTAAA TGTGGCCAGT GTAAAGATAA TTGCCCAATA 
AATGCTATAG CTTTGGCCTA G

Protein sequence

MNKKELLDLK EKSLAELREK IDYSKIYEDD KGDFKLKGDF FENQKRLVLK NCGIIDPSSI 
EDYIGLDGYK ALYKAIFELD RKEIIDIVKD SGLRGRGGAG FPTGRKWEAA FLQDTDIKYI 
ICNADEGDPG AFMDRSVLEL DPHSVLEAMA ICARAIGSNK GFIYVRAEYP KAVRALEIAI 
DQAKKYNLLG DNILGSDFSF DIELRLGAGA FVCGEGTALM ESIEGRRGMP RNKEYRTTVR 
GLWGKPTVIN NVETFANIAQ IINKGSAWFR SFGTEKSPGT KVFALSGKVK NAGLVEVEMG 
TSIDQIVYDI GKGIQNDKDA KAVQTGGPSG GCIPKRLFDT ACDFESLGAI GSIMGSGGMV 
VMDEDDCMVD VARFFLEFSV DESCGKCTPC RIGNKRLFEM LDDITKGKAN HETLDKLEEL 
SEIVSEASLC GLGKSSPNPI ISTMRYFYDE YEAHVNENKT CPSKRCISLL NYTIGEDCIG 
CGKCKRLCPN EAIAGEARKK HEINQDKCIK CGQCKDNCPI NAIALA