Gene Cagg_2431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2431
Symbol
ID	7266154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2950408
End bp	2952210
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	62%
IMG OID	643567257
Product	hypothetical protein
Protein accession	YP_002463740
Protein GI	219849307
COG category	[S] Function unknown
COG ID	[COG5373] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.482444
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAAC GTATTCCGGT CGATCTGCCG TTCACGATTT TCCTGCCCGC AGTTGACGGT 
GATCTGACGA TCCACGGTTG GGATGAACCG AGTGTTGAAT GGCAGTGTGA TGACCAAGTG 
AACCTCACCA GGAATGAAGC CGGTCTGACG CTTGAGCCGT GTCACGGCGA TCTCCGGCTG 
ACAGTGCCGG CGATGGCTGA AGTGCGGATC ACCGGTTGCA ATGGCGATAC ACGGGTGATG 
CAGGTGCGTC GGTTGCTCAT CGAACATCAG CACGGCGACC TGGTCATCCG CCACATCACC 
GAACAAGCGA CCATCGGCCA GCTCTCCGGT GATCTCCACG CGACGGAAGT GGCTGAATTG 
AACGTGACCG CTCAGCTTTC CGGTGATGTC ACCTTACTCG CGACGCCGGT TGCGCGCCTA 
CACACGGTTG CCGGCGATCT CGCTACGCGC GGTGTGCTGA GCCTATCATT GACCCAACTC 
GATGGCGATC TGGTCGCTAC CGACCTCCGC GAGCAGTTGA GTGTTGCCGT GGTGAACGGC 
GATGTGGAAG TTACCGGCAA CAATGCTCTC CTCCGCCTCC AGCAGGTGAA CGGCGATCTG 
ACCATCCATG GGCAGGTGTC GGTGCTGGAA TGTGTTGCAG TGAGCGGTGA TGTTGACGCC 
GAAGAGGCTA CTATCGGCCA ACTAGCTATC GAGACGGTGG CCGGCGATGT TGAGGTGGGT 
GTGCTTACCG GTGGGCGGAT CGGAACGGTC GGTGGTGATC TTGAATTGAT GCAGGTTACC 
GGCGAACTGA TGATCGGTAA TGTGGGTGGC GATTGTACCA TCAAACACGC CGGCGGCAAT 
CTGACCCTCA ACGCGATTGG GAGCGATCTG TCGTTACGCG CCGAGGTCGT TGCCGGCAGC 
ACGATTCGCG CTCAAGTAGG TGGTGATGCA GTGATTGTGT TGCCGAAAGA TCCCGATCTG 
GTACTGACGG CAACTGCCGG TGGTGAAATC CGTGGTGTCG GTGTGAACCG TTCAGCGCCC 
GGTCAGACAG TAGAGCTGCG CTACGGTAAC GGTGCCGCCA GTCTCCATCT GCTCGTCGGT 
GGTGACGTGA TCGTCAAAGG TGCAACCCAA CCGGATACGT TCAACGGATT GGCCACGCAA 
CTCGGTCACG AACTGAGCAA GCTGGGTCGC GAGTTGGGGC GTGAGTTAAG CGAATTGGGT 
CGTGAATTGG CCGCTGAGTT GCGTAACACA CTGGCAAGTG GTGACCCCGC CGCCGCCGAC 
CGCGCACGCG CTGCTGCCGA CCGTTTTGCC GCGCAGGCCC GTCGCCTCAA GGAAGAGGCC 
GGCCCCGAAC GAATGCGCAT CCGTATCAAC GAACGGGAAT GGCGGCTTGA TCCCGAACGG 
ATCGAGCGAA TCAAAGCGCA GGCTCGGCAG GCTGCCGCTG CCGGTCTGAA CGATGCACTT 
GAGGCTGTCG AACGGGCGTT GAGCCGCCTC CAACCGCCGC CCCACGCGCC GGCACCACCG 
CCACCACCAT CGCATCACGC ACCACCACCA CCCCACGCGC CGGCTCCACC ACCGCCACCC 
CACGCGCCGG CTCCACCACC ACCACCCCAC GCGCCGGCTC CACCACCGCC ACCCCACGCG 
CCGGCTCCAC CACCACCACC CCACGCGCCG GCGACCGGTC AGACGATCCA ATTACGCCCA 
TCGCCCACAC CACCGAGCGA GGAAGATCGC GAACGGCAAC GTGCTGCGAT TTTGCAGATG 
GTTGCCGATG GCCGAATCTC GGCAGCCGAA GGTGATCTGC TTCTCACCGC CCTCGACGAT 
TAA

Protein sequence

MKQRIPVDLP FTIFLPAVDG DLTIHGWDEP SVEWQCDDQV NLTRNEAGLT LEPCHGDLRL 
TVPAMAEVRI TGCNGDTRVM QVRRLLIEHQ HGDLVIRHIT EQATIGQLSG DLHATEVAEL 
NVTAQLSGDV TLLATPVARL HTVAGDLATR GVLSLSLTQL DGDLVATDLR EQLSVAVVNG 
DVEVTGNNAL LRLQQVNGDL TIHGQVSVLE CVAVSGDVDA EEATIGQLAI ETVAGDVEVG 
VLTGGRIGTV GGDLELMQVT GELMIGNVGG DCTIKHAGGN LTLNAIGSDL SLRAEVVAGS 
TIRAQVGGDA VIVLPKDPDL VLTATAGGEI RGVGVNRSAP GQTVELRYGN GAASLHLLVG 
GDVIVKGATQ PDTFNGLATQ LGHELSKLGR ELGRELSELG RELAAELRNT LASGDPAAAD 
RARAAADRFA AQARRLKEEA GPERMRIRIN EREWRLDPER IERIKAQARQ AAAAGLNDAL 
EAVERALSRL QPPPHAPAPP PPPSHHAPPP PHAPAPPPPP HAPAPPPPPH APAPPPPPHA 
PAPPPPPHAP ATGQTIQLRP SPTPPSEEDR ERQRAAILQM VADGRISAAE GDLLLTALDD