Gene Cagg_1622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1622
Symbol
ID	7268923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1979603
End bp	1981270
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	58%
IMG OID	643566463
Product	proton-translocating NADH-quinone oxidoreductase, chain M
Protein accession	YP_002462959
Protein GI	219848526
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.878864
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0450329
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTGC CGGAGTATCT CGTTCCTGCC GCCGATGGTG TGCCGTGGTT GACGCTACTG 
GTGTTGTCGC CATTGGTTGG GATCGCGCTA ATCGGTTTGG CGTGGTTGAT GAAGCTCGAT 
GAACGGACGG TCAAAGCGGG GGTACTGGCG TGGACGGGGG TGCCGTTGCT CTTGGCCGGC 
TTGATCTGGG CACGGTTTGA TCCGCAAGCG GTAGCGAGTG GGCAAGGTGT CGTACAGTTG 
GTTGAGCGAG TGCCGTGGAT ACAGGCGGTA CGGGTTGATT ACTTTCTCGG GGTTGACGGG 
CTGAGTATGC CCTTGGTATT GCTGACGGCA GTGATGACGC CGGTGGCAGT CGTTGCGAGT 
TGGCGCGTAA GTGAGCGGGT GCATGCTCAT TTGGCGTTAC TGCTATTGCT CGAGGCGGCG 
ATGCTGGGCT ACTTCGTCGC GCTCGATTTC TTCTTCTTCT TCATCTTCTG GGAGTTTAGT 
CTAGTACCGG CCTTTTTCTT AATCCAAAAC TGGGGGCGTG AACAGCGTCG CTATGCTGCC 
TTTAAGTTCT TTGTGTATAC GATGGCCGGC TCGCTGGGCA TGTTGTTACT CTTCCAGGTG 
ATATATCTGG CAATGCGGCA GGCCGGTTAT CCGACCTTCG ACCTGATCGC GCTCGGACGG 
TTGGGTCAGG GCTTGCCGGT CGAGGGGGTA ACCGGTAACT TGCGAGATAT TCTCTTTGCC 
TATCTCGACC AGCTTGGGGT AACGAATGTG CTTGGTCGTT ATCCACTGCT TTACAACAGC 
ATTGCGATGT GGGCCATCTT TATCGCCTTC GCCATCAAGC TTGCCGTTTG GCCGTTCCAC 
ACGTGGCTCC CCGATGCCTA TGCCGAAGGG CCGACTGCGG CCAGTATTCT ACTTTCGGCG 
GTGATGAGCA AGATGGGAGC GTATGGTATG CTGCGGCTCC TGCTCCCCTT TACGCCCGAT 
GCAGCCCAAT ACTTTGCTCC AGCGCTGGCT GCGTTGGCGG TAGTGGGCGT TGTAGCAGGT 
GCCTTCGGTG CGTTGGGGCA GGTCGACGGC GACGTAAAGC GATTGATCGG CTATACGTCG 
ATCAACCACA TGGGTTATGT GATGCTGGCG ATTGCCGGCG CTGCCGCAGC GGGTGAAGCG 
GGGATCGATG CGCGCACGAG TGCGATCAAC GGTGCATTGG TTCAGATGGT AGCTCACGGT 
CTCAGTACCG GTGCGCTGTT CTACCTTGCC GGCGCGCTGC ACGAGCGTAC CGGTCGTTGG 
GAATTGAGTG GATTAGGTGG TTTGCGGACC GGTGCTCCGA CCTTTGCCGG TGTGATGGGG 
ATTGCCCTCT TCGCCAATCT TGGCTTGCCC GGTTTGGCCG GTTTTGTCGG CGAGTTCTTC 
ATCTTCCGTG GCGCATGGGC GACGTTGCCT TTCTTTACCG CCCTGGCCGT GGTAGGGTTG 
GTTGTGACTG CACTTGCGCT GCTGTTGATG TTCCAGCGCA TTTTTCTTGG TCCGGCTGTT 
GGGATGCCAC GCACCATTAC CGATCTGCGT CCGCAAGAGT TCTGGACGAT GGCGCCGATT 
TTGGCCCTCT CGTTGGCAAT CGGGGTGTAT CCCGGCCCGC TGATGGCGTT GGGTAATGCC 
GCAGCCACGC AGTTGGTGGC GATCTTTACG CGAGTACTGG CAGGATGA

Protein sequence

MNLPEYLVPA ADGVPWLTLL VLSPLVGIAL IGLAWLMKLD ERTVKAGVLA WTGVPLLLAG 
LIWARFDPQA VASGQGVVQL VERVPWIQAV RVDYFLGVDG LSMPLVLLTA VMTPVAVVAS 
WRVSERVHAH LALLLLLEAA MLGYFVALDF FFFFIFWEFS LVPAFFLIQN WGREQRRYAA 
FKFFVYTMAG SLGMLLLFQV IYLAMRQAGY PTFDLIALGR LGQGLPVEGV TGNLRDILFA 
YLDQLGVTNV LGRYPLLYNS IAMWAIFIAF AIKLAVWPFH TWLPDAYAEG PTAASILLSA 
VMSKMGAYGM LRLLLPFTPD AAQYFAPALA ALAVVGVVAG AFGALGQVDG DVKRLIGYTS 
INHMGYVMLA IAGAAAAGEA GIDARTSAIN GALVQMVAHG LSTGALFYLA GALHERTGRW 
ELSGLGGLRT GAPTFAGVMG IALFANLGLP GLAGFVGEFF IFRGAWATLP FFTALAVVGL 
VVTALALLLM FQRIFLGPAV GMPRTITDLR PQEFWTMAPI LALSLAIGVY PGPLMALGNA 
AATQLVAIFT RVLAG