Gene Cagg_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1037
Symbol
ID	7268409
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1284910
End bp	1286487
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	53%
IMG OID	643565882
Product	proton-translocating NADH-quinone oxidoreductase, chain M
Protein accession	YP_002462387
Protein GI	219847954
COG category	[C] Energy production and conversion
COG ID	[COG1008] NADH:ubiquinone oxidoreductase subunit 4 (chain M)
TIGRFAM ID	[TIGR01972] proton-translocating NADH-quinone oxidoreductase, chain M

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.260264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCAGC CAGGCTTTCC GCTCCTCTCG CTCATCCTTT GGTTGCCGGC AGCCGGCGCC 
TTGGTACTGC TCTTTGTGCC GCGCGCCAAT GCCGAGCTGG CCCGCCGGGT ATCACTTGCC 
ACGATGGCGG TCGTCTTTTT GCTCTCGCTC CTGTTGCCGC TGCGGTTTGA AACAAATCCG 
CTCCAGACAA CTGTCGTCGG TGCATCGCCG GTCATGCAAT TTGTCGAAGA AGTGCCTTGG 
TTGCCGATTG TTGGCGCAAC TTATAGTTTA GGCATTGATG GGATCAGCCT CTGGTTGGTC 
ATGTTGACCA CCTTTTTGGG GCCAATCGTT GTGCTGTCGA CATGGGATTC GGTGCATAAA 
GATGTGCGTA ACTTCCAGAT TCTGCTGCTG ATTTTACAGA CGGCCATGAT CGGCGTCTTT 
CTCGCGCAGG ATCTCTTGTT ATTCTACCTG TTTTGGGAGT TTACCCTTAT CCCGATGACC 
TTCTTGATCG GTATTTGGGG GAGTCAGAAC CGGATTTATG CAGCACGTAA GTTTTTTCTC 
TACACATTTG CCGGCTCAGT TTTCATGCTG TTGGCGTTAA TTGCGTTGCA TATCCTGCAC 
CGTAATGCGA TTGCCGAAAT TGAGCCTGGA TTTCGCGGTA CCTTCAGTTT TAGCCGGTTT 
GTTAGTGATT TGCGCGCCGG TCGGCTGACC CTTGATAGTC TCACCGAGCG ACTGCTGTTT 
GGCGCATTTT TCCTGGCCTT TGCCGTCAAA GTACCGCTGT GGCCGTTCCA TACGTGGTTA 
CCCGATGCCC ACGTTGAAGC GCCGACCACC GGTTCGGTGG TACTGGCAGG GGTGTTGTTG 
AAGCTGGGCG GCTACGGCAT GATTCGCTAC AATTTGACGC TCTTCCCGGC GGCCTCTCAG 
TGGGCAGCAC CGGCACTGGC GATACTGGCC GTAATCGGTA TTATTTACGG CGCGGCTGTT 
GCCTTTGCTC AATCAGACAT GAAGAAGTTG GTCGCCTATT CGTCAGTGAG CCATATGGGG 
TTCGTTGTCC TGGGAATCTT TGCCCTCAAC ACTGAAGGAA TTAGCGGTGC TGTGTTGCAG 
ATGGTCAATC ATGGTCTCAG CACGAGTGCG CTCTTTTTGA TGGTCGGTGT GCTCTATGAA 
CGGCGACATA CGCGCGAATT GGCAGCCTAT GGCGGCTTGT GGAAGGTAAT GCCGGTCTTT 
GCCGCTTTCA GTCTGCTGGT TGCGCTTTCG TCGGCCGGTC TGCCGGGTCT CAACGGTTTT 
GTTGGTGAGT TTACGATCAT CACCGGCGCA TTCCGTTCAC CTTTGCTAGG ATGGATCTAC 
GTTGCCTTTG CCGTCGGCGG TGTTGTATTG GCCGCTGCGT ATCTGCTCAA ACTCTTCCGC 
TCGATCTTTA TGGGTGAGGT ACATCAGCCG GATAATACGA AGCTGCCCGA TTTGAATCGG 
CGTGAGCTAA CGACATTTGC GCTTTTGAGC ATTCCTATCG TATTGATCGG CATCTATCCG 
GTGTTCTTCT TTAATGGAAT GCAGTATAGT GTGGCTGCAC TCGTAGCAGA TTTGATGGCG 
CAAGTGGCAG GGAGTTGA

Protein sequence

MNQPGFPLLS LILWLPAAGA LVLLFVPRAN AELARRVSLA TMAVVFLLSL LLPLRFETNP 
LQTTVVGASP VMQFVEEVPW LPIVGATYSL GIDGISLWLV MLTTFLGPIV VLSTWDSVHK 
DVRNFQILLL ILQTAMIGVF LAQDLLLFYL FWEFTLIPMT FLIGIWGSQN RIYAARKFFL 
YTFAGSVFML LALIALHILH RNAIAEIEPG FRGTFSFSRF VSDLRAGRLT LDSLTERLLF 
GAFFLAFAVK VPLWPFHTWL PDAHVEAPTT GSVVLAGVLL KLGGYGMIRY NLTLFPAASQ 
WAAPALAILA VIGIIYGAAV AFAQSDMKKL VAYSSVSHMG FVVLGIFALN TEGISGAVLQ 
MVNHGLSTSA LFLMVGVLYE RRHTRELAAY GGLWKVMPVF AAFSLLVALS SAGLPGLNGF 
VGEFTIITGA FRSPLLGWIY VAFAVGGVVL AAAYLLKLFR SIFMGEVHQP DNTKLPDLNR 
RELTTFALLS IPIVLIGIYP VFFFNGMQYS VAALVADLMA QVAGS