Gene Cagg_1374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1374
Symbol
ID	7268666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1699397
End bp	1701013
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	49%
IMG OID	643566217
Product	protein of unknown function DUF87
Protein accession	YP_002462717
Protein GI	219848284
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.627609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGATA GCACAATACT GGCCCTGACA GACGATGCAC TCATCGGAGA AACTTCTTCA 
TCGGAGTTTT CGTCCGAGGG GGGAACTCCT ACTTTTGACC GAATTCCATT TCGCGTCAGA 
GCAGGAAAAT GCCCTAATCT TAATACTTTT GTGATAGCCC TCCGACAAGG GGATGACAAC 
AGAGCACACT ATGGCAGGAT TATTGCCGGC AGTGAACTGA ACCTGCGGGC CAGCCCTACA 
GGGATGCAAA AGGATGATGC CTATGGTATG CGACGTACCG ATATTCGTTC ATCAGAGCTG 
TCACCCGATC TGGTGAGAGT AATGGAGATT GAGCTTCTTG GAGAAATTAG CGTATTGGGT 
AACGGCTCTT TGGAAATCAC CGAACCGACC CAGCTTCCTC ACACCGGGCA ACCTGTGTAC 
GAATTGCCCG CTACAATTAT CCCGAAACTT CTCAACATTC CCGAAGATGA GAGGGTACAA 
GATAAAGATA AACCAACCAG TGCTTCAGGC CTTTATCTGG GAAACATCGA ATCAGGGGGG 
CACAGCATAC CGTTCTTTTT ACCGAATCGT GCCATTGCCC GTCATATTGC CGTACTAGGG 
AAAACCGGCG TTGGAAAGAG TTATGCCGTC GGCGTCTTGA TGGAGGAACT CTACGCAAAA 
CGTATCCCGA TACTCTCGTT TGATGTCTTG GGAGATACCG AACAAACGGC AAGGGAACTT 
GAAGGAAAAC ATATCGTTGC CGGGACCGAC GATTTCAAAA TCCCCTACTC TATCATAGGT 
CTTGAGGAGT TTCTGGCGTT CATTCCGAAC CTAACAAGCG ATCAGCGAGA ATTGATAACA 
TCGGCTTATG GCAATGTCTT TGATGAGGCG CTCGATAAAC TTGAGAAGGG GGAGGAATTA 
AATATTCCCT TCAGTCGTCT TACATCTCTT GTTGAAGACA TCGGCCGATC TATCAATTCC 
AAAGCAACTC CGAATGCAGT CAAGCGGGTC GAAGCAGCCT TCAACCGAAG TTCTCTCCTA 
ACCGACAAAC CGGTTACATG GACAAACCTT TTGGAAACCT CACCACTTAT TAACATCTAT 
GTAGGCCATT TAGGCCAATG GCAACGCAAT CTTGTTGTAG GCGCAGTAGC CCGTATTCTC 
CAGCGATTAA GGCGTCGCAA TCATATACCA CCGTTCGTTT TGGTTATTGA TGAAGCGCAT 
CTGTTCTTGC CCGGCGGGAG TGACCTCCCA CCCTCGACAT TGGTTCTTCG AGAGATGATC 
CGCACGGCTC GGCATGACTC GGTGGGGGTG GTATTGTTGA GCCAAAGTCC TTCTTCGATG 
GATCGCCAGA TTCTGCTCAC CTGCAATACA CGTATGCTCT TTGCTTTGGA TCCTGAAGAT 
TTACGGGTAG TTGCCGGGCA AATCGGCGAT CTGCCGGAGG AGACGATAAA GCGTATTCCG 
AGAATGGCCC GTGGCACGGC GGTATTCACA TCCGGTATGG ACATCATGCG TCATGCGGTC 
ATCGTTAAAA TACGCGAAAG AACCTTTACG ACCCATGTAG CCGAAACTCC CGATTTACGT 
GAGGCGGTTG AACAATGGCA CAGAGAACAT CAGAAACAGC AAAACAGCAG CAGATAA

Protein sequence

MSDSTILALT DDALIGETSS SEFSSEGGTP TFDRIPFRVR AGKCPNLNTF VIALRQGDDN 
RAHYGRIIAG SELNLRASPT GMQKDDAYGM RRTDIRSSEL SPDLVRVMEI ELLGEISVLG 
NGSLEITEPT QLPHTGQPVY ELPATIIPKL LNIPEDERVQ DKDKPTSASG LYLGNIESGG 
HSIPFFLPNR AIARHIAVLG KTGVGKSYAV GVLMEELYAK RIPILSFDVL GDTEQTAREL 
EGKHIVAGTD DFKIPYSIIG LEEFLAFIPN LTSDQRELIT SAYGNVFDEA LDKLEKGEEL 
NIPFSRLTSL VEDIGRSINS KATPNAVKRV EAAFNRSSLL TDKPVTWTNL LETSPLINIY 
VGHLGQWQRN LVVGAVARIL QRLRRRNHIP PFVLVIDEAH LFLPGGSDLP PSTLVLREMI 
RTARHDSVGV VLLSQSPSSM DRQILLTCNT RMLFALDPED LRVVAGQIGD LPEETIKRIP 
RMARGTAVFT SGMDIMRHAV IVKIRERTFT THVAETPDLR EAVEQWHREH QKQQNSSR