Gene Cagg_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3040
Symbol
ID	7266571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3695169
End bp	3696287
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	58%
IMG OID	643567860
Product	hypothetical protein
Protein accession	YP_002464334
Protein GI	219849901
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000024541
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTACCGTC TTATCCTGCT CGCACTTGCC TTGCTGGCGC TTATCAGTGG ACAATTCTTA 
CAACCACGGC TCCCACGCCC GCTCAACGTG CCACCACCAC GCGCAGTTAT CACCACAAAT 
CCGTTAATCG GTGTCCATAC GCGCCTGACC GGGATCGGTG ATGAAGCCTA CATTCGCCAA 
ACGCTTGCGC AAGTCAACGA GATGGGAGCA AGCTGGATTG TAGAACTCTT TCCATGGGCC 
TACATTCAGC CGCGTTCCCG TTATGGCTTC GATTGGACAG GGGCCGATAT GGTGATTGCC 
CATGCCCGTG CTCAAGGCCT ACAAGTCGTT GCGCGGCTCG ACATTGTACC GGCTTGGGCG 
CGTCCACCCA ATACCACCGA CCGCTATCTC GATCGCGACC ACTTTGCCGA TTTCGCACGC 
TTTGCTGCTG TATTTGCCGC TCGGTACGCA CCGCAAGGAG TACGCCATCT TGTGATTTGG 
AACGAGCCGA ATCTGCGTTT TGAGTGGGGT GAACGTCCAC CTGATCCCGG TGCATATACC 
GATCTGCTCA AACAGACCTA TCCGGCGGTC AAGGCGGTTG CCCCAGAGAC CATCGTGATC 
GCCGGAGCAC TTTCCCCCGG TCCCGGTCTT GAAGGAGGGA ATCTGCGCAT GGACGATCTG 
CAATTTCTCG CTTCACTCGC CGATGCCGGC GCATTTCCCT TTTTCGATAT GTGGGCCGTT 
CATGCCTACG GCGGCCTTGA ACCGCCAGAA ACCGACCCCG CACCCGACCG GGTTAATTTT 
CGACGCATCG AGCTGGTGCG CGAACTGCTT GACCGACTCG GCGGCTCTGA CAAACGGATC 
ATCATTACTG AAGGTGGCTA TAACGACCAC CCACGCTGGA GTGGTGCTGT GCGCCCCGCC 
GACCGTGTAC GCTGGACGAT TGCCACCTAC GAATGGTCAC GCCGATACCC GTGGCTAGAA 
GCGACCATTC TTTGGCAATT CAGTACACCG TTCCGTACTC GCTCATACCC CGATGCCTGG 
AACTTCGTCG ACCCTGACGG CACACCTCGC GCTATTTATC TGGCCGTGCA AGAGTATGCC 
CGTACCGGTA AACTGCCGGA GCCGATGAGC CGGCCCTAG

Protein sequence

MYRLILLALA LLALISGQFL QPRLPRPLNV PPPRAVITTN PLIGVHTRLT GIGDEAYIRQ 
TLAQVNEMGA SWIVELFPWA YIQPRSRYGF DWTGADMVIA HARAQGLQVV ARLDIVPAWA 
RPPNTTDRYL DRDHFADFAR FAAVFAARYA PQGVRHLVIW NEPNLRFEWG ERPPDPGAYT 
DLLKQTYPAV KAVAPETIVI AGALSPGPGL EGGNLRMDDL QFLASLADAG AFPFFDMWAV 
HAYGGLEPPE TDPAPDRVNF RRIELVRELL DRLGGSDKRI IITEGGYNDH PRWSGAVRPA 
DRVRWTIATY EWSRRYPWLE ATILWQFSTP FRTRSYPDAW NFVDPDGTPR AIYLAVQEYA 
RTGKLPEPMS RP