Gene Cagg_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1239
Symbol
ID	7266225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1515474
End bp	1516583
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	52%
IMG OID	643566081
Product	hypothetical protein
Protein accession	YP_002462583
Protein GI	219848150
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00785292
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAA GTAAGACGGT ACCAACCCTC ATCAGCTTCG CGCTTGTTGT TGTGCTCACC 
GCCTGCGGCG GTACTGCCAG TGCCCCTGCT CCCACTCCCA CAACGGCAGA ATCGGCAAAC 
CCAACACGCA CGCCTCGCCC AACAGCCGCT AATGCGCAAC CAACAGCCGC ACCAACCACT 
GCCGCAGAGG GATCGATCAT CCGACCGCCG CCCACTAACA ACCAAAGCGG ACTGACCACA 
CTCGGTAATG TTCAAGTAGA GATGAGCATT GAGGGGACCA TCAAAACGGA AGGGCAAGCT 
GATGAGTCGA TCCAGATAGT GATGCGGGAG ATCCGGCTGC AAAACGGCAA TCGGAACCTT 
GTAATCGAAT CGACAACACC TGACCAAGGA ATCGAGCGCA TCAACTACTT TCTCATCGAC 
GGTGAAAGCT TTCAATACGC TGAACGCGAC AACGATCGTA CCTGTATTAG CGTGAGCGGC 
AGCGATTTCT TTACCGGAAG TATAATCACA CCAGAGTCCT TGATCGGTGA TCTCAAAGAA 
GCAACTCTCG CCGAACGTGG TGTACAAGTC AACGGTTTTA CCACCGATCG TTACACCTTC 
AGCTTAAACG AGCAGAATCT TGGTTATCAA GGGCAAGCAA ACGGCGAAAT CTGGGTAGCA 
AGCAACCCGA ACATCGTGGT ACGACATATT GGCACCCTGA ACGGCTCATT TGGTGGGATA 
GCTGTTGAAG AAGGGGGCGA GATACTTCCG CAATCGACCG GGAATCTGAG CTGGAAGTAC 
AACGTCACTC AGATCGCGGC AAACACCACC ATCACCCTCC CTGAGGTATG TGCGCAACAG 
CAAACAGCCG GTGCCGACAT TCCACTCCCG CCAAACATCA GCAATACGTT GCGTACCAGC 
AATTTGATCA GCTTCGAGAC AAGCGACACA GCAGCAAACA TCGCTCAGTT TTATCAGACC 
GAGATGGTGG CAAAGGGATG GCAAGCGAGC GAAACCAATC AGTACGGTGA CACATACCAA 
CTAACATTTA CCAAGGACGG TCGTACTGCA ACTGTCAACA TCTCGGCAGG TGATAAACAA 
ACGATGGTGA TCATCCTTCT TGACTCGTAG

Protein sequence

MNKSKTVPTL ISFALVVVLT ACGGTASAPA PTPTTAESAN PTRTPRPTAA NAQPTAAPTT 
AAEGSIIRPP PTNNQSGLTT LGNVQVEMSI EGTIKTEGQA DESIQIVMRE IRLQNGNRNL 
VIESTTPDQG IERINYFLID GESFQYAERD NDRTCISVSG SDFFTGSIIT PESLIGDLKE 
ATLAERGVQV NGFTTDRYTF SLNEQNLGYQ GQANGEIWVA SNPNIVVRHI GTLNGSFGGI 
AVEEGGEILP QSTGNLSWKY NVTQIAANTT ITLPEVCAQQ QTAGADIPLP PNISNTLRTS 
NLISFETSDT AANIAQFYQT EMVAKGWQAS ETNQYGDTYQ LTFTKDGRTA TVNISAGDKQ 
TMVIILLDS