Gene Cagg_1978 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1978
Symbol
ID	7268894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2416214
End bp	2417629
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	56%
IMG OID	643566813
Product	hypothetical protein
Protein accession	YP_002463306
Protein GI	219848873
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.014731
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGTA TTGAGGCAAT GAAGCCGGCA TTTTCAGCCT TCGCCCTTCA GTGGCGGCAT 
TTGTTCGCCC AATATGTTGC TGAATGGCGA ATTATCCGCT GGCTCGCACC GATCGTTCTG 
ATACACTCGC TCGTGTACGT CTTTCTCGTA CCGCCGTGGC AGCACTACGA CGAACCGGGC 
CACTTTCTCT ACGCAGCCTA CATTGTTCGT GGAGGGATCG CAGCACCAGA CAATGTCGCG 
ATTGCCCGTG AAGTGGCCGA TTCGATGTAT CGCCATCATT TTTGGCCGCC GGATGTGCGA 
CCCGACCTGC TCAGCCCACG GCCACCAGCT ATCCCGACCG ATCAACGTCA CCATCCACCA 
CTTTATTATG TACTTATGGC CGGTATCCTC GGCCCGCTGC GCTATCTGCC GGTTGAACTG 
CAACTATATG CCGGACGACT CGTCAGTGCG GGGTTGATGA TGTTGACCGT CCTCGCCGTT 
TGGCGCACGG TACGGATTAT GGCTCCCGAC GAGCCACATA TGGCAATCGT ACTGGCAGCA 
CTGGTAGCTA TGACACCGGC GTTCGTCGAT TTGATGAGTG CATTCAACAG TGATGTGCTC 
ATGAATTGGG CCGCGGCAGT CGCTTTTTTA GGCTTTGCCC TTCTCTTGCG CAACGGTTGG 
CAGCCAACCG GTATTACCTT GGCTGTGCTC GGTACTCTCG TCGCGATTCT GACGAAACGT 
ACCGCGGTAC CGTTAATCGG CCCACTGGTA GTAGTGCTGG TATGGACGGC ATATCGGCGT 
CCAATTCGGT GGTGGTGGTA TGGCTTGAGC GGCCTTGCGA TCATCACGTT AGCGGTATTG 
AGCAGTTTTT CATTCACCGG CGGTGAGCTG CGGGTACAAC CGTGGCTCGC CACCCTTGAA 
CGCGACTATT TGCGCGTACC GATCATTCCG TGGCTAGAAT CGTGGCTCAA CTGGGAGCGC 
GCGTGGCCGT GGTACCTGCG CACGCTCGAG GTAGCGCATA GCCACTTTTG GATGCGGTTG 
GCATGGGGAC ACGTTGCCGT TTTACCTCCG GTGGGCGACT GGCTCGTGGT CGGTGTAAGT 
ATTGCCGCAA TCCTCGGCCT GTTCCGCGGT ATTCGCAGTT GGTCAACAAC GCTCACCCTT 
GATCAACAAC GTTGGATCTG GCTTTGTCTG CTGGCAGTGG GTATCGCATG GCTCGCGTTG 
TTCGGTCGTC TCCATCCGCT ACCAGAAACC GGCAACACCT ACATCCCGCG TGGTCGTTAC 
TTGTATTGGG CACTGTTGCC GACGATGTGG CTCCTTCTGG TCGGTTGGCA ACATCTCTGG 
CCCGAGCGAT GGCGGCCACT GACGTGCTAC ATACTCATCG GACTATTTGC CGCATTTGAT 
ATGATTGCAA TAGTGACGAT TGTCCGTCAG TTGTAG

Protein sequence

MARIEAMKPA FSAFALQWRH LFAQYVAEWR IIRWLAPIVL IHSLVYVFLV PPWQHYDEPG 
HFLYAAYIVR GGIAAPDNVA IAREVADSMY RHHFWPPDVR PDLLSPRPPA IPTDQRHHPP 
LYYVLMAGIL GPLRYLPVEL QLYAGRLVSA GLMMLTVLAV WRTVRIMAPD EPHMAIVLAA 
LVAMTPAFVD LMSAFNSDVL MNWAAAVAFL GFALLLRNGW QPTGITLAVL GTLVAILTKR 
TAVPLIGPLV VVLVWTAYRR PIRWWWYGLS GLAIITLAVL SSFSFTGGEL RVQPWLATLE 
RDYLRVPIIP WLESWLNWER AWPWYLRTLE VAHSHFWMRL AWGHVAVLPP VGDWLVVGVS 
IAAILGLFRG IRSWSTTLTL DQQRWIWLCL LAVGIAWLAL FGRLHPLPET GNTYIPRGRY 
LYWALLPTMW LLLVGWQHLW PERWRPLTCY ILIGLFAAFD MIAIVTIVRQ L