Gene Cagg_0415 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0415
Symbol
ID	7266583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	514360
End bp	515610
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	56%
IMG OID	643565282
Product	NHL repeat-containing protein
Protein accession	YP_002461796
Protein GI	219847363
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.96309
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGGA TCCCGACGAT CCTCATGGTG TTCATAGCAA TCGCACTCCT CACCATTGCC 
TGGTCTCAGT CTGCACAGAA TCTTTTTTTA CCGCTGATCA GCCGTCTACC GGTTATTCCA 
CCGGCAGACG AAGTGGCAAA CCGCCTCCAA GTGGCCGAAG GTTATGCCGT CCGTTTATAT 
GTAAGTGGGC TTAATCGACC GCGCCTGATG GCAATAGGAC CTGATGGCGC ACTGTATGTT 
GCCGAGCGGG GTACGAACCG GATAGTACGA CTGGTTGATG GACATAGTGA TGGATATGCC 
GACACGCCAC AACCGGTTGC GATCAATCTG ACAGGGGTAC ATAGTCTCGA ATGGTACGCG 
GGTGATTTGT ACGCTGCGGG TAATGCAACG GTTTGGCGGT TACGTGATGT GAACGGTGAT 
AGACAATGGA GTACCGATGA AATCGTCGCA TTAGTGATGG ATTTACCCAG CGATGGGGGA 
CACTCAACCC GCACTGCACG GATCGGGCCG GATGGGATGC TCTACGTATC GGTCGGCTCA 
AAGTGTAATA TCACCGTCAA CTGTAGCGAA GGCGACCCTC GCCGGGCCGC TATCCTTCGT 
TATACACTCG ATGGAGATAT TCCCGCCGAC AATCCCTTCG CCGATGACCC TGATCCGCGT 
CGCCGCGCAG TGTGGGCTGA AGGGTTGCGC AACAGTGTTG ATTTTATCTT CTTGCCAGAC 
GGTCGGCTAT GGGCTACCCA CAACGGTAGC GATGGTTTGG GCAATGATCT GCCACCGGAA 
GAGGTGGTAA TCGAGGTTGA ACGTGGCAAG CACTACGGCT GGCCCTACTG CTACACCGCC 
GAGCTGGGGC CGGTGCCGCG CAACACACAA GAGGTACGTG ACACCCGGAT TCCGCTCGAT 
ACAACGTTTA CCGGCTGCGA ACAAGCAACG CCGGCACTTT TCACCGATGT AGCTCACTCT 
GCGCCACTGG GAATTGATCG GTTGGCGAAT GGCGATGTGT TGATCGCCTA CCATGGCTCG 
TGGAATGCTG ATGAAACACC GCGCGACTGC CGCGTGCAAC GGATTCGCGT CACCGATGGA 
CAGCCAGTCT CGGCAGAGCC GTTCTTGACC GGCTTCCGCA ATAATCCCCA ACAAGAATGT 
GGCGGTGCAT GGGGCCGACC GGCAGGAGTC ACGATTGCAC CAGACGGATC GATCTTTGTT 
TCCGATGATA AAAACGGGAA TATTTATCGG ATCGTACCGG TCGGTAGTTA G

Protein sequence

MKRIPTILMV FIAIALLTIA WSQSAQNLFL PLISRLPVIP PADEVANRLQ VAEGYAVRLY 
VSGLNRPRLM AIGPDGALYV AERGTNRIVR LVDGHSDGYA DTPQPVAINL TGVHSLEWYA 
GDLYAAGNAT VWRLRDVNGD RQWSTDEIVA LVMDLPSDGG HSTRTARIGP DGMLYVSVGS 
KCNITVNCSE GDPRRAAILR YTLDGDIPAD NPFADDPDPR RRAVWAEGLR NSVDFIFLPD 
GRLWATHNGS DGLGNDLPPE EVVIEVERGK HYGWPYCYTA ELGPVPRNTQ EVRDTRIPLD 
TTFTGCEQAT PALFTDVAHS APLGIDRLAN GDVLIAYHGS WNADETPRDC RVQRIRVTDG 
QPVSAEPFLT GFRNNPQQEC GGAWGRPAGV TIAPDGSIFV SDDKNGNIYR IVPVGS