Gene Cagg_3470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3470
Symbol
ID	7269695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4228291
End bp	4229484
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	54%
IMG OID	643568278
Product	hypothetical protein
Protein accession	YP_002464746
Protein GI	219850313
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.250629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCG ATTTCTTTAC CCAGCTTCCC TTGATTACTC GCTTTCGCGA GATTACCGAT 
TTGAACGCCT ACCGGCCATT ACCCGCAGAT TGGACGATTT TTGTTAGTGA TGTCCGTGGG 
TCGACACGTG CCGTCGCCGA GGGTCGTTAT AAAGAAGTTA ATATGGTTGG TGCAGCGACG 
ATTACCGCAG CGTTGAATGT AGCCGACGAG ATAGAAATAC CGTTTGTGTT CGGTGGTGAT 
GGGGCGGTTC TGGCAGTGCC GCCACCATTG GCTGAACCGA CGAAACAAGC CTTGAGTGCG 
GTAAGTGGGC TGGCCCGTGA GGCTTTCAAC CTTGAGTTGC GGGTTGGCGC CGTACCGGTG 
CAGACGATTT TAGATGGCGG GTATCAGGTG TTTGTCGCAC GTTTAGCACT CAATATGCAG 
GTGGCACAGG CGGTATTTAG CGGTGGCGGC ATCCGCTACG CTGAACAATT GGTCAAAGAT 
GCCGTCACGG GTGCAGACTT CAACATTGCA CCGACTGATC CCGCTGCGGC CAATCTGAGC 
GGCCTCGAAT GTCGGTGGGA TACTATCCAA CCTGCGCATG GTACGGCGCT CTGCGTGATC 
GTGCAGACAC CACCACAACC TGATCCAGCG ATAACGATGG CGATCTACCG TGACGTGATC 
GATGAGATTG AACAAATCTA CGGTGGTGAT CAAGCGTACC ATCCCCTGCA CTACGACTTG 
ATGCAGATAA GCACGAGACC GCAGGCTCTT TGGGCAGAGG CGCGGTTGCG TGGCGGCGAG 
AGTCGCTTAT CGCAATTGGC CTATTTGATG CAAGTCTACG CGCTCAATCT CGGTGTGTAC 
GGGTATCGGT GGCTGCAACA GTTACGAGGT GAGAATCCGT GGTGGGATCA GTATCGCAAA 
CATGTGGTCA CCGCTGCCGA TTATCGCAAG TACGATGATG TGTTGCGTAT GATCATTGCC 
GGTACCGACG CACAACACGA AGCATTAATC ACCCACCTGA CAGCCCGTTT TGCTGCGGGT 
GAGTTGATCT TTGGGGTTCA TCGCTCGCCT GAGGTTATGC TGACGTGTCT GGTGTTCGAG 
CGGATGGAGC GGCAAATTCA TTTTGTCGAT GGTGCTGATG GCGGTTTTAC CCTTGCTGCT 
CAAGATTTGA AACAGCGTCA GCAGCAGTAC ACGTTCGTTA ACAGCCGGGA ATAA

Protein sequence

MTADFFTQLP LITRFREITD LNAYRPLPAD WTIFVSDVRG STRAVAEGRY KEVNMVGAAT 
ITAALNVADE IEIPFVFGGD GAVLAVPPPL AEPTKQALSA VSGLAREAFN LELRVGAVPV 
QTILDGGYQV FVARLALNMQ VAQAVFSGGG IRYAEQLVKD AVTGADFNIA PTDPAAANLS 
GLECRWDTIQ PAHGTALCVI VQTPPQPDPA ITMAIYRDVI DEIEQIYGGD QAYHPLHYDL 
MQISTRPQAL WAEARLRGGE SRLSQLAYLM QVYALNLGVY GYRWLQQLRG ENPWWDQYRK 
HVVTAADYRK YDDVLRMIIA GTDAQHEALI THLTARFAAG ELIFGVHRSP EVMLTCLVFE 
RMERQIHFVD GADGGFTLAA QDLKQRQQQY TFVNSRE