Gene Cagg_0036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0036
Symbol
ID	7269033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	58214
End bp	59548
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	55%
IMG OID	643564909
Product	protein of unknown function DUF58
Protein accession	YP_002461425
Protein GI	219846992
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.764731
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTACCAA CACCACGCCT GCTATTCCTT GTCTTACTCG CTGCCCCCCT TATCGCCGGT 
ACCGCATTTG CGCCATGGCT GAGCTGGGCA GCAGCTATCT ACTTGATCCT CGTAGGAGGG 
GTGGTGATAA GCGATATGCT CCTCTCACCT GATCCCAAGG ATATCGAAGT CGAACGCTTG 
TGTGAGAAGC GACTATCCCT TGGGGCAGCG AACCTCGTCA CAATCCTCAT TACCAACGCT 
TCAGCACGTG TGTTGCGGTT TGAACTGCGT GATGAATATC CGGTAGAGAT ACCGGTCGAT 
ACCGACCGGC TCAGCGGTGT TGCCGAGCCG TTTGGTGTGT GTGCGGTTCG TTACCACTTA 
CGGCCACAGC GGCGTGGTGA TTATCACTTT GGCGACATCG TCATGCGCTA CGACGGTGTG 
CTTGGGTGCC ACCGTCGCCA GGTACGCTTT GCCGCAGCCC GTACCGTGCA GGTGTATCCC 
AATCTGCTCG CAGCACGTAA ATACGATCTC CTTATCCGTC GTGGTCAGTT GCGTACTATC 
GGGATACGTT CAATTCGCCA ACTCGGTAAG GGGGGCGAGT TTGAGCATCT GCGTGAATAT 
ACGCCGGACG ATGAATACCG CCGGATCAAT TGGAAGGCGA CGGCTCGGCG CGGAAAACCG 
ATTGTTGCCG AAATCGAAGC GGAACGGAGT CAGCAGATTA TCTGTGTGAT CGACGCCGGA 
CGGCTGATGG CAACGCCGGT GGCCGATCCA CTCCAACCCG ATGATCCCGG TCTTACTCGG 
CTCGATTATG TCGTTAATAC GGCATTAATG CTGAGTTATG TCGTCATTGG TAAAGGCGAT 
CAAGCCGGTA TGCTTACCTT TGCCGGTACC GTCGAGAACT TTATCCCACC ACGCAAGGGA 
AAGGCTCAAT TCCAACGCTT GCTTGAGGCA TTGTACAATG TACAGGCACA GCCGGTTGAA 
GCCGACATTG CTGCGGCCTT GGCTTATCTC GATCAGCGGC AGTCACGGCG CGCACTGATC 
GTTATCTTTA CCGATATTAC CAATCCGGCA GCCGTACAAC CGTTGATCGG TCTTCTCCAA 
CGGCTCGCAC GCCACCACTT GCCGCTCTGT GTGACGATTA GCGATCCGAA TATCGTTAAT 
GTTGCCGGTC GTCCGGTTAC TGATAGCCAT GGGCTGTTTC GCCGTTTGGT CGCCGAACAG 
TTGGCCAATG AGCGCCGGGC TTTACTCGAT CAGATTCAAC GCAGTGGTGC GCTAACGCTC 
GATGTGCCCG CAACTTCCCT GACGGTAGCG GTGGTAAACA CCTATTTGCG CTTGAAAGAA 
GAGGCTCGGC TGTAA

Protein sequence

MLPTPRLLFL VLLAAPLIAG TAFAPWLSWA AAIYLILVGG VVISDMLLSP DPKDIEVERL 
CEKRLSLGAA NLVTILITNA SARVLRFELR DEYPVEIPVD TDRLSGVAEP FGVCAVRYHL 
RPQRRGDYHF GDIVMRYDGV LGCHRRQVRF AAARTVQVYP NLLAARKYDL LIRRGQLRTI 
GIRSIRQLGK GGEFEHLREY TPDDEYRRIN WKATARRGKP IVAEIEAERS QQIICVIDAG 
RLMATPVADP LQPDDPGLTR LDYVVNTALM LSYVVIGKGD QAGMLTFAGT VENFIPPRKG 
KAQFQRLLEA LYNVQAQPVE ADIAAALAYL DQRQSRRALI VIFTDITNPA AVQPLIGLLQ 
RLARHHLPLC VTISDPNIVN VAGRPVTDSH GLFRRLVAEQ LANERRALLD QIQRSGALTL 
DVPATSLTVA VVNTYLRLKE EARL