Gene Cagg_0926 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0926
Symbol
ID	7267999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1155037
End bp	1156362
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	56%
IMG OID	643565774
Product	protein of unknown function DUF21
Protein accession	YP_002462280
Protein GI	219847847
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.731568
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGAAT TATTAATCAT TGTTGCGCTG GCATTGGCGA ATGGAATGTT TGCCGCCACC 
GAGCTGGCAG TTGTTTCTGC CCGCCGAGGC CGGCTCGAAC AGCGCGCTGA AGAGGGAAGT 
CGCGGGGCGG CGGTTGCCCT CCAATTGCAA GAAGATCCCG ATCGCTTTTT AGCCGCAGTG 
CAGATCGGTA TTACCCTGAT CGGAACACTG AACGGTGTCT TTGCCGGCGC AACCCTGACC 
GGTCAACTCG CACCATGGCT AGCCCGCAAT GAGTGGCTAC GACCGTATGC CGACCAGTTG 
GCCCAATTTT TGGTCGTGCT GCTGGTTACG TACCTGTCGC TAGTGTTGGG CGAGTTGGTA 
CCGAAGCGCA TCGCTTTGCA AAGCGCCGAG ACTATTGCGA CGCTGATGGC TCGGCCAATG 
TTAGGGCTGG CGCGGATCAG TACACCGTTC ATTGCGTTAC TCAGTGCTTC CACTCGTTTG 
ATTCTTACCC TGATCGGGCG TGCGAATGTC GAGGAAGAGC GGGTCACCGA AGAAGATATT 
CGGGCGCTCG TTCGGGAAGG TGCCGAGACC GGTGAGGTCG AACCGCAAGA GCAGCAATTC 
ATCGATCGTG TCTTTAGGTT CAGCGACCGG GCAGTGCGCC ACATTATGAC CCCGCGCCAT 
GAAGTTGAGA TGGTAGAAGC CAACCGCACG CTCGGAGAAG TGATCGATGA GTTGTTGGCG 
AGTGGCTACT CGCGCTTTCC GGTGTATGAA GAGACACCAG ATCAGATTGT CGGGATTGTC 
CATGTGCGTG ATTTGCTCCT ACTCTACCGA AAAAAGGGGG AGCAAGCGTT AGTACGGGAA 
GCCGTCTCGC CACCGCTCTA CGTACCGGAA AATAGTCGGG CATCGGCGCT GCTGACCACA 
TTTCGTCGCA GCCGTCGCCA TATGGCGTTG GTGGTGGGTG AGCTAGGTGG GATCGAGGGT 
GTCGTGACGC TAGAAGATGT ATTGGAAGAG ATCGTGGGCG AGATTGATGA CGAATACGAC 
GATGCTACTC CACCACCAAT CGTTCGTCGC GAAGATGGTT CATACCTCGT TGAAGGTTCA 
TTACCGGTTG ATGAGGTACG CGCGTTGCTT GAAGTCGATG AGCTACCCGA CGAAGACACA 
TTTCGTTACG AGACGTTGGC CGGGCTGGTG ATCAGTCTGA TCGGTCATAT CCCAACTGCC 
GGTGATGTCG TGCGGTGGAG CGGATGGCGG TTTGAAGTGG TCGATATGGA CGGGTTGCGC 
GTTGATAAAG TGTTGATCGC GCGCGATTCA ACCACGAATC ATCCATCGAC ATCCCCTTCG 
CGGTAG

Protein sequence

MQELLIIVAL ALANGMFAAT ELAVVSARRG RLEQRAEEGS RGAAVALQLQ EDPDRFLAAV 
QIGITLIGTL NGVFAGATLT GQLAPWLARN EWLRPYADQL AQFLVVLLVT YLSLVLGELV 
PKRIALQSAE TIATLMARPM LGLARISTPF IALLSASTRL ILTLIGRANV EEERVTEEDI 
RALVREGAET GEVEPQEQQF IDRVFRFSDR AVRHIMTPRH EVEMVEANRT LGEVIDELLA 
SGYSRFPVYE ETPDQIVGIV HVRDLLLLYR KKGEQALVRE AVSPPLYVPE NSRASALLTT 
FRRSRRHMAL VVGELGGIEG VVTLEDVLEE IVGEIDDEYD DATPPPIVRR EDGSYLVEGS 
LPVDEVRALL EVDELPDEDT FRYETLAGLV ISLIGHIPTA GDVVRWSGWR FEVVDMDGLR 
VDKVLIARDS TTNHPSTSPS R