Gene Cagg_0749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0749
Symbol
ID	7268068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	926213
End bp	927466
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	54%
IMG OID	643565600
Product	protein of unknown function UPF0118
Protein accession	YP_002462109
Protein GI	219847676
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.104647
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCT TCACCCCAAC TCAAATCCGT CGGGTTGCGC GTTGGTTGCT TGTTGCGGTG 
TCAATTTATC TTGTGGGCTG GCTGATTAGC CATACCGGTT CGGCGATCAC GCCGTTTGTG 
TTTGGCGGTG TGCTCGCCTA TTTATTTTTA CCGTTAGTCA ATTTCTTCGA GCGCTGGATG 
CCGCGTTGGT TGGCAATTCT GGTCGTGTAT CTGCTGACCT TCGGCGCATT GGTGGCTGCG 
ATTGCGTTTG TCATTCCACC GCTGATTGCT CAGATCGTCG AACTGATCCG TACCCTACCT 
GATATTGCCA CGATCCAACG CGAGGCTAAT CGGTTGCTCG ATGAGTATGA GCAGTTGCTT 
GCCAGCTTGC CACCTGCTAT ACAGTCTGAG GTGCAAAGCG CGATTGCGTC GGCAGCTTCA 
GAGGGGTTGA GTACCCTGCG GGCTAATTTC GTTAGCTATT TGCAAGGGAT CGGCCAGTTT 
CTGATTACGA GTGTTTTGTC GGTTGTTAAT ACGGTCACCT TCCTGTTGGG TTTCTTTCTG 
GTGCCATTTT GGCTCTTCTA CGTGCTGATG GATCAGCGTG CCGGACGCGA TTATCTTAAT 
CGCTTGATCC ATCCCCGCTT ACGGGCCGAT TTTTGGGCAA TGGTATCAAT TATCGATTAC 
GACCTGAGCG GTTATCTGCG CGGTCAGTTG ATTCTGGGTA CGTCCGTTGG CTTAGCCGCG 
TGGATCGGCC TCACGGCACT GAATATGGCG GGGATGAAGG TGCCATATAC GGTACTGTTA 
GCGGTTGTGG CCGGTGTTAC CGAGGTGGTA CCGGTGATCG GACCGATTAT TGGTGCCATC 
CCGGCAATCT TGTTGGGTCT AGCCGATTCG CCGACGACTG CGCTGGCCGT TACTATTCTC 
TACATTGCTA TCCAGCAGCT CGAGAATCAT ATCCTCGTGC CACGCATTAT CGGCGAAAGC 
GTGGGAGTCC ATCCGGCGAT TCTCATGGTT GTGCTGGTCG TGTGTTCGCA GGTTTTTGGT 
TTGTTGGGAG CGATCCTTTC GGCGCCACTG AGTGCAATGG CCCGCGATCT GTTTCTCTAT 
CTCTACGGGC GTTTGAGTGA TCCGCCCCGT CCGGCAGGTG TTCTGCCCGA ACGGTTGCGT 
CCGATAGCAG CTCTTACCGA AGTAGTGGCC CAATCGACGA CCGATCAATC GGCACCGTCT 
CCGCCCACCT CGGAAGACGT TCCCCGAACG CGCCCACTTG ATGAACCTCG ATGA

Protein sequence

MTIFTPTQIR RVARWLLVAV SIYLVGWLIS HTGSAITPFV FGGVLAYLFL PLVNFFERWM 
PRWLAILVVY LLTFGALVAA IAFVIPPLIA QIVELIRTLP DIATIQREAN RLLDEYEQLL 
ASLPPAIQSE VQSAIASAAS EGLSTLRANF VSYLQGIGQF LITSVLSVVN TVTFLLGFFL 
VPFWLFYVLM DQRAGRDYLN RLIHPRLRAD FWAMVSIIDY DLSGYLRGQL ILGTSVGLAA 
WIGLTALNMA GMKVPYTVLL AVVAGVTEVV PVIGPIIGAI PAILLGLADS PTTALAVTIL 
YIAIQQLENH ILVPRIIGES VGVHPAILMV VLVVCSQVFG LLGAILSAPL SAMARDLFLY 
LYGRLSDPPR PAGVLPERLR PIAALTEVVA QSTTDQSAPS PPTSEDVPRT RPLDEPR