Gene Cagg_3758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3758
Symbol
ID	7267831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4581897
End bp	4583042
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	60%
IMG OID	643568565
Product	hypothetical protein
Protein accession	YP_002465030
Protein GI	219850597
COG category	[S] Function unknown
COG ID	[COG5373] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000107199
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAT CATTGGAGAC CATTCTGAAT GATTGTATTG ATGCACTTGC GGCGGGTGAT 
TCACTAGAAA CCGTCCTTGC ACGTTATCCG CAAGAGGCTG CAACTCTCCG CCCGTTGCTG 
ATCACGGCTG CGTCACTCTT CGAACTTGAG TTTAATCCGT CAACTGCAGC GGAGCTCGCT 
TCACGTCGTT CGTTCTTGCA ACAGGCGGTG AATTCTCGTT CACGAGTGAT CTTCTGGCAG 
CGCTTTGCCC TCATTGCCGC AAGTATCGTT ATTGCCTTCG TGTTGGCAGG CGGTGGACTG 
GTATGGGCAT CGCAGAGCAC TTTACCCGGT GATCCACTCT ATCGGGTCAA ACGCGCCGTT 
GAACGAATTC AGCTATCGCT GAACAATAAT AACGAGCAAC TCAAAACTAG TCTCGAAGAG 
CGCCGTCGCC GTGAAGTTAT CGCCTTACTT GAACAACGAC GTGAAGTAGA AGTAGTCTTC 
CAAGGCAAGC TCCAACAGTT GGCGCCTAAC CGTTGGGTAG TTAGTGACAT CCCGTTGCAT 
ATCGAACAAA ACACCTCAGT TCAAGGTCAG CTCGTGGCCG GTGTCGAAGT TGAAATTACC 
GGTCGAACCG TTGATGGAGC TGTCCGCGTA GAGACCATTA CCGTCGTAGC GGAGGAAGAC 
GATCAGGGGA GTAGCAGTAC TACGCCACAG CCTTCACCAA CAACCGCTCT TGCCACCAAC 
ACTCCTGCAC CAAGCCACAC TGCTACCCTA CAACCTACTC CGACTCGTAC CAATACGCCA 
ACGGCAACTG TTACGCCATC ACCTATGGTG ACGCCTACGG CCACGCCGCC GCCGCCCACG 
GCCACGCCGC CGCCGCCACC CACGGCCACG CCGCCGCCGC CACCCACGGC CACGCCGCCG 
CCACCCACGG CCACGCCGTC ACCGCTACCC ACGGCCACGC CGCCGCCGCC ACCCACGGCC 
ACGCCGCCGC CGCCACCCAC GGCCACGCCG TCACCGCCAC CCACGGCCAC GCCGCCGCCG 
CCACCCACGG CCACGCCGCC GCCACCCACG GCCACGCCAT CACCACCACC ACCGTCGCCT 
ACGGCTACGC CACCGGGTGA CGACGATGAC GACGATGACG ACGATGACGA CCATGGCGAT 
AATTAA

Protein sequence

MDESLETILN DCIDALAAGD SLETVLARYP QEAATLRPLL ITAASLFELE FNPSTAAELA 
SRRSFLQQAV NSRSRVIFWQ RFALIAASIV IAFVLAGGGL VWASQSTLPG DPLYRVKRAV 
ERIQLSLNNN NEQLKTSLEE RRRREVIALL EQRREVEVVF QGKLQQLAPN RWVVSDIPLH 
IEQNTSVQGQ LVAGVEVEIT GRTVDGAVRV ETITVVAEED DQGSSSTTPQ PSPTTALATN 
TPAPSHTATL QPTPTRTNTP TATVTPSPMV TPTATPPPPT ATPPPPPTAT PPPPPTATPP 
PPTATPSPLP TATPPPPPTA TPPPPPTATP SPPPTATPPP PPTATPPPPT ATPSPPPPSP 
TATPPGDDDD DDDDDDDHGD N