Gene Cagg_1620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1620
Symbol
ID	7268921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1975766
End bp	1977349
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	54%
IMG OID	643566461
Product	proton-translocating NADH-quinone oxidoreductase, chain N
Protein accession	YP_002462957
Protein GI	219848524
COG category	[C] Energy production and conversion
COG ID	[COG1007] NADH:ubiquinone oxidoreductase subunit 2 (chain N)
TIGRFAM ID	[TIGR01770] proton-translocating NADH-quinone oxidoreductase, chain N

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.308242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0422608
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCAAC TGGCCGACAT CCCGCGTCTC TTGCCGGAGA TACTGTTGTT GGTACTAGCT 
CTGTTGGTGC TAGGATCTGA CATCCTTGAA CGGTGGGGAC GCACGCCGGA AGCGCAACAA 
GAGCGGGTTA AGTCATCGGC GTCGCTGACG GCTATAGGGT TGGGTATGGT GTTTGTTGTC 
GCTCTCTTGC AGAGCGGTTA CGTCTACCAA TTGCCGGAGA CAGCGCCGGT TAACTTCTTC 
ACCAATCTGA TCCGTAATTT ACAAGGTGGT GGGCCACGTG ATGATGCGAT TGCCGGTGTC 
TTTGTCGCCG ATCATCTGAC AATGGTGTCA CGCCTGCTCA TTATTGGTGC TGCTTTTCTG 
ACGAGTTTGC TCTGCACCGA TGTGCGGCCA AATGCGCATC CGGGTGAATT TTATGCTCTG 
ATTATCTTTG CTACGCTTGG TATGTGCTTG ATGGTCGGGG CAAATGAATT TCTGCTGGCT 
TATCTGGCAA TCGAGCTGAC CTCTATCCCG TTGTATCTGT TGGCGGGTTA CTTCCACAAT 
GATGCACGGT CGGCAGAGTC AGGTTTGAAA TACTTCTTGT TTGGGGCTGT TTCATCGGCA 
ATCTTGTTGT ATGGGATGAG TCTGGCATTT GGTGCGGCGC TGAACGGCGT GAGTGGAGTG 
ACCAATTTCA ATGATCTGAC CCGGTTTGAT CGGATTGGTG CTTTTACGGC TAGTGGTGGC 
TCGATAACCC TGGCGATGCT CTTCATCGTA GCGGGGATGG GCTATAAGTT GGCGATCGTT 
CCCTTCCATG GGTGGTCGCC TGATGTGTAC GAAGGCGCAC CAACGCCGAT TACGGCCTTT 
ATCTCGACGG CGTCGAAGGC GGCAGGGTTT ATTCTGCTGT TCCGTCTGTT GACGAAGACG 
TTCCCGGCAA TTGTTGGCGC GCCGGTGTTT GGAGATGAAG CCGGTGGTTG GACGGGGGTG 
TTGGCGGTGC TGGCCTTGCT GACGGTTGTG ATCGGGAATT TGGCGGCATT GCCACAGACG 
AACGCAAAGC GACTGCTGGC CTATTCGAGC ATTGCGCACG CCGGATTTGT TGTACTGGGA 
TTGCTCGCGT GGGCGGCGGC GCAAACCTTC GACCGTGAGC AAGGGTTGGT GGCGTTGCTG 
TATTACTTGA TCATCTATAG CCTGACGAAT TTGGGTGCGT TCGGTGCGTT AGCCTTGATC 
GGTCACCAGA CCGGGGGTGA TGATTTTGAC CACCTGCGTG GTCTCTCGCG CCGTAACTTA 
CCGCTGGCAC TGCTGTTTAC CGTCTGTATT CTCTCGCTGG CCGGTATTCC GCCGCTTGGT 
GGTTTCTTCG CTAAGTTCTA CATCTTTATG GCGGGTTGGC AGAGTGGGGC GACGTGGCTG 
GTGATTATTG CCGTGATTAC CACCATCATC AGTTTGTACT ATTATCTGCG TTTGCTGAAG 
GTGATGTTTA TCGAGCCGGC AATTGATCCG ACACCGGTTA CAATGCCACG AGGTATTGCG 
GCAGCATTAG GTATCGCTGT GGTGGGCGTG TTGGTGTTGG GTGTTTTCCC TAATGTGATC 
TTGAGTGTCT TAGAACGGGT GTGA

Protein sequence

MFQLADIPRL LPEILLLVLA LLVLGSDILE RWGRTPEAQQ ERVKSSASLT AIGLGMVFVV 
ALLQSGYVYQ LPETAPVNFF TNLIRNLQGG GPRDDAIAGV FVADHLTMVS RLLIIGAAFL 
TSLLCTDVRP NAHPGEFYAL IIFATLGMCL MVGANEFLLA YLAIELTSIP LYLLAGYFHN 
DARSAESGLK YFLFGAVSSA ILLYGMSLAF GAALNGVSGV TNFNDLTRFD RIGAFTASGG 
SITLAMLFIV AGMGYKLAIV PFHGWSPDVY EGAPTPITAF ISTASKAAGF ILLFRLLTKT 
FPAIVGAPVF GDEAGGWTGV LAVLALLTVV IGNLAALPQT NAKRLLAYSS IAHAGFVVLG 
LLAWAAAQTF DREQGLVALL YYLIIYSLTN LGAFGALALI GHQTGGDDFD HLRGLSRRNL 
PLALLFTVCI LSLAGIPPLG GFFAKFYIFM AGWQSGATWL VIIAVITTII SLYYYLRLLK 
VMFIEPAIDP TPVTMPRGIA AALGIAVVGV LVLGVFPNVI LSVLERV