Gene Cagg_0290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0290
Symbol
ID	7267471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	359975
End bp	361261
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	57%
IMG OID	643565159
Product	protein of unknown function DUF58
Protein accession	YP_002461673
Protein GI	219847240
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACAA CCCGACCGAT CTTTATCCTA CTGCTTGCCG GTACAAGTTA CCTCGCCGCC 
CAAACAACCG GTCAGCGTCT CTTTTTTCAT CTCAGCTACA TTCTGGTCAG TCTGCCCCTC 
GTGGCGCTGA TCTGGACGTG GCTTAACTTG CGTGGTCTGC GCATCGAGCG TGCCCATACC 
TCCTTGCGGG CCAGCGTCGG TGAATACATC CGCGAACGGA TTACCATTCA TAACCGATGG 
TGGTTACCCA AACTGTGGAT CGAACTCCAC GATGAGTCTG ATCTGCCGCA GCACGAACCC 
GGTTTCGTAA CCTACCTGGC AGGCCGCGAA TCAACCCGTT GGACAACCCG CTCGCTCTGT 
ACCCAACGTG GCCGGTTTCG CCTTGGTCCA ACCCGCGTCA TCAGTAGCGA CCCATTTGGC 
CTCTTCCGCT TCTCACGCCT GATCCCCGGT AGTGGTGAAC TTATCGTCTA TCCCGCCTCT 
GAAATCATCG CTACATTCCG CCTCCCCTCT GCCGAACGGT CCGGCGGTGC GAGCAATTTG 
GTGCGCGTCC ACAGTGTTAC CCCCAACGTT GCCACCATCC GCGATTACCA ACCCGGCGAT 
GGCTTCAACC GCATTCACTG GCGCAGCACG GCTCGTTACA ACCGTCTCAT GGTCAAAGAA 
TTTGAGCTTG ATCCGGCGGC AGACATCTAT CTCATTCTCG ACCTTAATGA ACAGGCAGTC 
ACGCGGATCG ACGAACCGGC GCTGCTCGCT CATGAACGGG CCGGTGTACC GTGGTGGCAG 
CGCCAACCGA CAATCCACCG TCACGCCTCT CCCATCTCAA CTGAAGAGCA CGCCGTCACG 
GTAGCGGCAT CGCTCGCGCG CACGCTGCTC AACCAAAACC GAATCGTTGG GCTTTTAGCG 
TGGGGCGAAC GGCTGGAAGT CATCCCCGCC GAGCGTGAGG AACGTCAATT ATGGAAAATG 
CTCGAACTAC TGGCCGTCTT ACGTGCGACC GGGCAACACA CCCTTGCCGA ACTCCTCATC 
GCCGAAGGAC AGCGCTTCGG ACGCGATACA ACGCTGATTA TTATCACCTC TGATCTCGAT 
CCCCGTTGGC TGGCAGCACT GCAACACCAC CTCTACCGCG GCACACGCGC CGTTGTTATC 
TTCATCGATC CGCAGAGTTA CGGTGGCCGT TATGATCCGG CGCCTCTCCT CAACCACCTC 
ATTGCCCTGC ATATCGATGT GTATCGTCTC CAACGAGGTG ATGCACTGGC CGATGCGTTA 
CGGCAACCGA TCGTAGTGAC AAGGTAA

Protein sequence

MNTTRPIFIL LLAGTSYLAA QTTGQRLFFH LSYILVSLPL VALIWTWLNL RGLRIERAHT 
SLRASVGEYI RERITIHNRW WLPKLWIELH DESDLPQHEP GFVTYLAGRE STRWTTRSLC 
TQRGRFRLGP TRVISSDPFG LFRFSRLIPG SGELIVYPAS EIIATFRLPS AERSGGASNL 
VRVHSVTPNV ATIRDYQPGD GFNRIHWRST ARYNRLMVKE FELDPAADIY LILDLNEQAV 
TRIDEPALLA HERAGVPWWQ RQPTIHRHAS PISTEEHAVT VAASLARTLL NQNRIVGLLA 
WGERLEVIPA EREERQLWKM LELLAVLRAT GQHTLAELLI AEGQRFGRDT TLIIITSDLD 
PRWLAALQHH LYRGTRAVVI FIDPQSYGGR YDPAPLLNHL IALHIDVYRL QRGDALADAL 
RQPIVVTR