Gene Acid345_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1304
Symbol
ID	4069496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1582361
End bp	1583926
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	61%
IMG OID	637983313
Product	proton-translocating NADH-quinone oxidoreductase, chain M
Protein accession	YP_590380
Protein GI	94968332
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.278041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCACT TAGTCGATCT CGCCAACGAT CACATCCTGA CACTGGTCAC GTTCCTTCCG 
GGCCTCGGTG CGGTGCTGCT CCTGTTTTTC CCGCGCCGCG ATCGCGACAT CCGGTGGTTC 
GCACTGCTGA TCTCCCTGCT CACGTTCATT GCATCGCTGC ACCTGCCTTG GCACTTCGAT 
TACTCCAAGG GCGGCTTCCA GTACGAGCTG AACGTACCGT GGATCACCAC GCCGAACATC 
CACTATCACC TCGGCGCCGA CGGCATTTCG ATCTGGCTGG TAGTGCTGAC CACGTTCCTC 
GTTCCGCTGA GCGTGCTCAT CTCCTGGACT TCGATCAAGG AACGCGTGAA GGAATTCTTC 
ATCCTCATGC TCATCCTTGA GACGGCGATG CTCGGCGTCT TCGTCTCGCT CGATCTCTTC 
CAGTTCTACT TCTTCTGGGA AGCCACGCTG ATCCCGATGG CGCTGCTCAT CGGCATTTAC 
GGCCATGAGC GCCGCATCTA CGCCGCGGTG AAGTTCTTCA TGTACACCAT GGTCGCGTCG 
GTGTTCATGC TGGCCGCGAT GCTCTGGCTG TATTCGAAGA CTGGCTCATT CGACTTCGTT 
GAAATCCAGC AGGCGATCCA ACTCGGAAAC GTCTCTGGCT TCTCGCACGC GCAGCAGTGG 
CTCTTCCTCG GCTTCTTCAT CGCCTTCGCG GTGAAAGTCC CACTCTTTCC GTTCCATACA 
TGGCTGCCCG ACGCGCACGT AGAAGCACCG ACCGCGGGTT CCGTGCTGCT CGCCGGCGTG 
CTCCTCAAGA TGGGCACCTA CGGCCTGCTG CGCTTTAACC TCGGGCTGTT CCCGGAAGCA 
GCGCGGCGCA ACGCACCCTG GATCATCGCG CTGGCAATCA TTGGGATCAT CTACGGCGCG 
CTTGTCGCCC TCGTCCAGCC AAACATGAAG AAGCTGGTCG CCTACTCGTC GGTGAGCCAC 
CTTGGCTTCT GCGTGTTGGG CATCTTCAGC TTCACCGCCA TGGGCGTGAG CGGTTCGGTG 
TACCAGATGC TGAACCACGG CGTCTCGACC GGCGGCCTGT TCATGCTGCT GGGCATGATT 
TACGAACGCC GCCACACTTA CGAGATCAAG CAGTACGGCG GCCTCGCCAC GCCGATGCCG 
GTGTTCGCCA CCTTCTTCCT GGTGATCACG CTGGCCTCCG CCGGACTGCC GCTGCTCAAC 
GGCTTCGTGG GCGAGTTCCT CGTCCTGAGC GGCGCCTTCC AGGCGAAGAT GATCTACGGC 
ATCCTCGCAG CCTCGGGCGT AATCTGGGGC GCGTGGTACC TGCTCTGGCT CTACCAGAAG 
ACGTTCTACG GCGACGTGAC GGTCGAGGCG AACAACAACT TATCTGACCT CAACGCGCGC 
GAACGCCTCT CGTTGTGGCC GATCGCGGTG ATGTCGCTGG TCATGGGCGT GGTCCCGATG 
ATTTTCCTCC GCCAGATCAA CCCGGCGGTC CAGGCTGCGC TCAGTGGGGT GAACGGCGGC 
GTGCAAGCCG CGGTGCCTAC CGCGCACCAC TTCCTACAAG TTGTTGCACA GGTGATCGGC 
CGATGA

Protein sequence

MNHLVDLAND HILTLVTFLP GLGAVLLLFF PRRDRDIRWF ALLISLLTFI ASLHLPWHFD 
YSKGGFQYEL NVPWITTPNI HYHLGADGIS IWLVVLTTFL VPLSVLISWT SIKERVKEFF 
ILMLILETAM LGVFVSLDLF QFYFFWEATL IPMALLIGIY GHERRIYAAV KFFMYTMVAS 
VFMLAAMLWL YSKTGSFDFV EIQQAIQLGN VSGFSHAQQW LFLGFFIAFA VKVPLFPFHT 
WLPDAHVEAP TAGSVLLAGV LLKMGTYGLL RFNLGLFPEA ARRNAPWIIA LAIIGIIYGA 
LVALVQPNMK KLVAYSSVSH LGFCVLGIFS FTAMGVSGSV YQMLNHGVST GGLFMLLGMI 
YERRHTYEIK QYGGLATPMP VFATFFLVIT LASAGLPLLN GFVGEFLVLS GAFQAKMIYG 
ILAASGVIWG AWYLLWLYQK TFYGDVTVEA NNNLSDLNAR ERLSLWPIAV MSLVMGVVPM 
IFLRQINPAV QAALSGVNGG VQAAVPTAHH FLQVVAQVIG R