Gene Cagg_1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1087
Symbol
ID	7268539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1344671
End bp	1346035
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	38%
IMG OID	643565931
Product	hypothetical protein
Protein accession	YP_002462436
Protein GI	219848003
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000322584
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000189736
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAAAACGA CAAAGAAATT TTTCGGTATA TTCCCCAAAA TATTATTCTT TCCAGTTCTG 
TTTGTTATTA TGGCGTTGCC TCAATTGCTT TCCAAATCAC CTTCGCCATT TTTCAGATCT 
ATTAAGCAGC TTTTGGAATC ACAATCTATT TTCACGATAT TACTCATCGT TTTTGGAATA 
CTATTACTGA TAGTACTGAT AGCTGTAGTT GCTGTTCTGA CAGATGATGA GTGGAAAGAA 
AACATGAAAA GAAAAGTTGA CACTACCGAA GCAGTTAAAC GCGAGCGAGG GGGAAACGGA 
ATCTATACAG ACCCGATACC GTTCATCTGG ATATTTTCTG TCTTAACTTA TGTCTATGTA 
GAGACAGGTA AAGAATGTGC TATTGTGGAC GGAGAGCGCA TTATTGAAAC GAAACAATGG 
ATAACCAAAT CTTTCTTCCA CGATGCAGTT ATCCGGTATG TTTTACTTGA GCCACCACCT 
CTAATTATGA CTATCGAAAA TGTTCGCACG CAAGATGATT TGTACCTCAC TGCCGATATC 
TCTGTTACAT ACAGAGTTCG AGATCCACTT GCTATTATCA AGAAAGCTGA CCCTCTGAAA 
ATTCTACAAG AGCATGTTAA ATCACAATGT ACTAATTTAA TAGGGCGACT AGACTATTAC 
ACTATCGCGG ATAAAAAAGC CAAATATGAA AACGAGATAT GTGCAGCTAT CCAGCGAGAA 
AGCATATTAC CACTTTTTGA GATTACCAGT GTTCATCTTG AGATGAAATT AGCGGTTGAC 
CCGCGAAACG TTGAAAAGAT TGAAGAACTG AAGAGACAGC AAAAAGAGAA GGATCTTCTG 
GTTGAAGATA GACAGAAAGA GCGTGATCAT GCCCGTGAGA TAGATAAAGC GAAAATCGGG 
GCAGGTTTAA CCATTATTAA AGAGACGGCT GAAATTGCAA AAGGAAGATC GGAGTCCACC 
AAAGAATACA TAGATTCTCT AGGTCCTAGG GCTATATTAT CTATGATAGG AACTCCTTAT 
CATAACTTAG AATCGGCTCC AAATCTACCT ATGTTGACCG AAGCAACAGA AAGGTCGAGA 
TATGAACGTG AAAAGCCTGA ACTCGATAAT CTGCAAGAAA ACGGTGTAAT CAAAAACTAT 
GAATCTCGAT GGAGTAAAGA TGGAAATTTC TGTGGCGTGG TGATTGAGGT GGATGATGGA 
CAAATTCATA TTTTGTCCCC AAGCTATCCA GATATTGCCC CGACTATTCA ATTCATTTCT 
AGATCAGGTC AAACTTATGA ATGGCCTATT GAAAAATGGA ATGCTAATAT GACTATCGTG 
CATGTTATCA CAATTGCACT CAGTAAAATA AAACTTCTTC AATGA

Protein sequence

MKTTKKFFGI FPKILFFPVL FVIMALPQLL SKSPSPFFRS IKQLLESQSI FTILLIVFGI 
LLLIVLIAVV AVLTDDEWKE NMKRKVDTTE AVKRERGGNG IYTDPIPFIW IFSVLTYVYV 
ETGKECAIVD GERIIETKQW ITKSFFHDAV IRYVLLEPPP LIMTIENVRT QDDLYLTADI 
SVTYRVRDPL AIIKKADPLK ILQEHVKSQC TNLIGRLDYY TIADKKAKYE NEICAAIQRE 
SILPLFEITS VHLEMKLAVD PRNVEKIEEL KRQQKEKDLL VEDRQKERDH AREIDKAKIG 
AGLTIIKETA EIAKGRSEST KEYIDSLGPR AILSMIGTPY HNLESAPNLP MLTEATERSR 
YEREKPELDN LQENGVIKNY ESRWSKDGNF CGVVIEVDDG QIHILSPSYP DIAPTIQFIS 
RSGQTYEWPI EKWNANMTIV HVITIALSKI KLLQ